Gã khổng lồ chip đồ họa NVIDIA gây chấn động giới công nghệ với mô hình ngôn ngữ đa phương thức mạnh mẽ, ngang ngửa GPT-4o.
Theo BGR, không chỉ là nhà cung cấp chip hàng đầu cho các ứng dụng AI (trí tuệ nhân tạo), NVIDIA vừa chính thức bước vào cuộc đua AI tạo sinh với NVLM 1.0 - một họ các mô hình ngôn ngữ lớn đa phương thức có khả năng xử lý cả văn bản và hình ảnh, được đánh giá là mạnh ngang ngửa, thậm chí vượt trội GPT-4o của ChatGPT.
Điểm đặc biệt của NVLM là khả năng 'thấu hiểu' hình ảnh, cho phép người dùng tương tác bằng cả văn bản và hình ảnh. Mô hình này có thể nhận diện người, động vật, đồ vật, hiểu được ý nghĩa của các meme và thậm chí giải quyết các bài toán phức tạp.
Thay vì cạnh tranh trực tiếp với những cái tên sừng sỏ như ChatGPT, Claude hay Gemini, NVIDIA đã lựa chọn một hướng đi khác biệt là công khai mã nguồn và trọng số mô hình NVLM. Điều này cho phép các nhà nghiên cứu và công ty nhỏ tiếp cận và sử dụng công nghệ AI tiên tiến mà không phải trả phí, qua đó thúc đẩy sự phát triển chung của lĩnh vực AI.
Quyết định này của NVIDIA được đánh giá là một 'cú hích' mạnh mẽ cho ngành công nghiệp AI, tạo ra áp lực cạnh tranh lớn cho các công ty hàng đầu như OpenAI, Anthropic và Google. Việc NVLM được mở mã nguồn được cho là có thể thúc đẩy sự đổi mới và đa dạng hóa các ứng dụng AI trong tương lai.
Hiện tại, NVLM chưa được ứng dụng vào các sản phẩm thương mại. Tuy nhiên, việc NVIDIA công khai công nghệ này hứa hẹn sẽ mang đến những trải nghiệm AI mới mẻ và tiên tiến hơn cho người dùng trong tương lai gần.
|