Đối diện với sự bão hòa của thị trường mô hình trí tuệ nhân tạo ngôn ngữ lớn (LLM) gần đây, các tên tuổi lớn trong ngành công nghệ như Microsoft, Meta và Google đã điều chỉnh chiến lược đầu tư của mình bằng việc tập trung vào các mô hình ngôn ngữ nhỏ (SLM) nhằm tối ưu hóa lợi nhuận.
Theo báo Financial Times, các công ty trí tuệ nhân tạo đã đầu tư hàng tỷ đô la vào việc phát triển những gì được gọi là mô hình ngôn ngữ lớn, nhằm cung cấp nguồn lực cho các sản phẩm trí tuệ nhân tạo tổng hợp đang được nghiên cứu để tăng doanh thu. Các công ty như Apple, Microsoft, Meta và Google đã gần đây ra mắt các mô hình trí tuệ nhân tạo mới có ít yêu cầu về số lượng biến được sử dụng trong quá trình huấn luyện hệ thống và cách mà đầu ra của chúng được hình thành, nhưng vẫn giữ cho khả năng hoạt động mạnh mẽ.
Điều này thể hiện sự cố gắng của các tập đoàn công nghệ để thúc đẩy sự áp dụng của trí tuệ nhân tạo vào mô hình kinh doanh, đặc biệt là trước những lo ngại về chi phí và nguồn lực cần thiết cho việc triển khai các mô hình ngôn ngữ lớn, đó là loại công nghệ tạo nền tảng cho các chatbot phổ biến như ChatGPT của OpenAI.
Nói chung, số lượng tham số càng lớn, hiệu suất của phần mềm trí tuệ nhân tạo càng cao và khả năng xử lý các nhiệm vụ phức tạp và đa dạng càng tốt. Mô hình GPT-40 mới nhất của OpenAI, được công bố trong tuần này, cũng như Gemini 1.5 Pro của Google, được ước tính có hơn 1 nghìn tỷ tham số. Meta đang huấn luyện phiên bản với 400 tỷ tham số cho mô hình Llama nguồn mở.
Ngoài việc cố gắng thuyết phục một số khách hàng doanh nghiệp đầu tư số tiền lớn cho việc triển khai các sản phẩm trí tuệ nhân tạo tổng hợp, còn có những lo ngại về dữ liệu và trách nhiệm bản quyền đang làm chậm quá trình áp dụng. Điều này đã thúc đẩy các công ty công nghệ lớn như Meta và Google phát triển các mô hình ngôn ngữ nhỏ với ít tham số hơn, chi phí thấp hơn, tiết kiệm năng lượng, có khả năng tùy chỉnh và dễ đào tạo và vận hành hơn, đồng thời có khả năng ngăn chặn dữ liệu nhạy cảm.
Google, Meta, Microsoft và công ty khởi nghiệp Mistral của Pháp đều đã ra mắt các mô hình ngôn ngữ nhỏ thể hiện khả năng tiến bộ và tập trung vào các ứng dụng cụ thể. Nick Clegg, chủ tịch phụ trách các vấn đề toàn cầu của Meta, đã giới thiệu mô hình Llama 3 với 8 tỷ tham số, có thể so sánh với GPT-4. Microsoft cũng đã phát hành mô hình Phi-3 nhỏ với 7 tỷ tham số, cho biết nó hoạt động tốt hơn GPT-3.5 của OpenAI.
Các mô hình nhỏ có khả năng xử lý các tác vụ cục bộ trên thiết bị thay vì gửi thông tin lên đám mây, điều này có thể hấp dẫn những khách hàng quan tâm đến quyền riêng tư muốn đảm bảo thông tin được lưu giữ trong mạng nội bộ.
Charlotte Marshall, quản lý tại Addleshaw Goddard – một công ty luật tư vấn cho các ngân hàng, nói rằng: “một trong những thách thức mà nhiều khách hàng của chúng tôi gặp phải khi áp dụng các sản phẩm trí tuệ nhân tạo sáng tạo là tuân thủ các yêu cầu pháp lý về xử lý và truyền dữ liệu”. Bà cho biết các mô hình nhỏ hơn mang lại cơ hội cho các doanh nghiệp vượt qua những lo ngại về pháp lý và chi phí.
Các mẫu mô hình ngôn ngữ nhỏ cũng cho phép tính năng trí tuệ nhân tạo chạy trên các thiết bị như điện thoại di động. Mẫu “Gemini Nano” của Google đã được tích hợp vào điện thoại Pixel mới nhất và điện thoại thông minh S24 mới nhất của Samsung.
Apple cho biết họ đang phát triển các mô hình trí tuệ nhân tạo để chạy trên iPhone, sản phẩm bán chạy nhất của họ. Tháng trước, công ty này đã ra mắt mô hình OpenELM, một mô hình nhỏ được thiết kế để thực hiện các tác vụ dựa trên văn bản.
Boyd của Microsoft cho biết các mô hình nhỏ sẽ mang lại các ứng dụng thú vị, bao gồm cả cho điện thoại và máy tính xách tay.
Giám đốc điều hành của OpenAI, Sam Altman, đã cho biết vào tháng 11 rằng công ty này đã cung cấp các mô hình trí tuệ nhân tạo có quy mô khác nhau để phục vụ các mục đích riêng biệt cho khách hàng. Ông cũng nói rằng OpenAI sẽ tiếp tục phát triển và bán các lựa chọn này.
“Có một số điều mà các mô hình nhỏ có thể hoạt động thực sự tốt. Tôi rất hạnh phúc về điều đó”, Altman nói thêm.
Tuy nhiên, Altman cũng nhấn mạnh rằng OpenAI sẽ tiếp tục tập trung vào việc xây dựng các mô hình trí tuệ nhân tạo lớn hơn với khả năng mở rộng quy mô, bao gồm cả khả năng suy luận, lập kế hoạch và thực hiện các nhiệm vụ, và cuối cùng là đạt được trí thông minh ở cấp độ con người.
Cảm ơn bạn đã đọc bài tổng hợp của ISAO
Nguồn: sohuutritue.net.vn