Đóng

Chấn động AI: Google tung "quái vật" Gemini 3, tự nhận là mô hình thông minh nhất thế giới

  • Thủy Tiên (T/h)
(DS&PL) -

"Gã khổng lồ" Google chính thức công bố Gemini 3 – mô hình trí tuệ nhân tạo (AI) mới nhất và được chính CEO Sundar Pichai tuyên bố là "tổng hợp toàn bộ năng lực" và thông minh nhất mà hãng từng tạo ra.

Thông tin trên báo VnExpress, rạng sáng 19/11 (giờ Hà Nội), Google đã chính thức ra mắt mô hình ngôn ngữ lớn (LLM) mới nhất của mình, Gemini 3, trong bối cảnh các mô hình trí tuệ nhân tạo tạo sinh (Generative AI) trước đó của hãng đang được người dùng đón nhận mạnh mẽ.

Trong buổi ra mắt, CEO Google Sundar Pichai nhấn mạnh: "Thật kinh ngạc khi chỉ trong hai năm, AI đã đột phá từ việc đọc văn bản và hình ảnh đơn thuần đến khả năng đọc hiểu tình huống." Gemini 3 là mô hình kế thừa sau Gemini 1, 2 và 2.5.

Theo Pichai, trong khi thế hệ đầu tiên tạo đột phá với khả năng xử lý ngữ cảnh dài, thế hệ thứ hai đặt nền móng cho tác nhân AI và đẩy mạnh năng lực lập luận, tư duy, thì Gemini 3 được coi là "mô hình thông minh nhất của Google, tổng hợp toàn bộ năng lực của Gemini".

Google tung "quái vật" Gemini 3, tự nhận là mô hình thông minh nhất thế giới. Ảnh minh họa: REUTERS

Đột phá về lập luận và khả năng học tập

Đại diện Google cho biết, mô hình AI mới này xây dựng khả năng lập luận tối tân để nắm bắt những tầng ý nghĩa sâu sắc và tinh tế. Nó có thể "nhận ra các gợi ý rất nhỏ trong một ý tưởng sáng tạo", hay bóc tách những lớp chồng chéo của một vấn đề phức tạp, giúp người dùng nhận được câu trả lời vừa ý chỉ với ít câu lệnh hơn.

Demis Hassabis, CEO Google DeepMind, thông báo phiên bản trải nghiệm đầu tiên là Gemini 3 Pro đã vượt trội so với bản 2.5 Pro trên mọi công cụ đánh giá. Cụ thể, trên bảng xếp hạng LMArena, mô hình đạt điểm số 1501, thể hiện năng lực lập luận ở trình độ tiến sĩ theo phép đo của Humanity’s Last Exam (đạt 37.5%) và GPQA Diamond (đạt 91.9%).

Về khả năng ứng dụng, Gemini 3 được tích hợp vào nhiều sản phẩm của Google để hỗ trợ người dùng trong ba lĩnh vực chính: học tập, xây dựng và lập kế hoạch.

Thông tin trên VietNamnet, Gemini 3 mở rộng ranh giới của khả năng lập luận đa phương thức, hỗ trợ người dùng học theo cách phù hợp nhất. Mô hình có thể xử lý ngữ cảnh tối đa 1 triệu token đầu vào. Nó có thể giải mã và dịch công thức viết tay sang nhiều ngôn ngữ, tạo sổ tay nấu ăn. Nó biến bài nghiên cứu học thuật, video bài giảng dài thành flashcard tương tác, hình ảnh trực quan, hay phân tích video hoạt động thể thao, xác định điểm cần cải thiện và lên kế hoạch luyện tập.

Trong ứng dụng Google Tìm kiếm, Chế độ AI (AI Mode) nay sử dụng Gemini 3 để mang đến các trải nghiệm tạo sinh mới lạ trong giao diện người dùng (UI), như bố cục trực quan sống động, các công cụ và giả lập tương tác, được tạo ra tức thì dựa trên truy vấn của bạn, giúp người dùng dễ dàng tìm hiểu các chủ đề phức tạp như cách thức hoạt động của RNA polymerase thông qua trải nghiệm trực quan.

Năng lực lập kế hoạch của Gemini 3 có thể thay thế người dùng thực hiện các quy trình phức tạp, nhiều bước như sắp xếp email trong Gmail hoặc lập lịch trình du lịch.

Google cũng ra mắt nền tảng lập trình tác nhân mới là Google Antigravity, cho phép lập trình viên làm việc xoay quanh nhiệm vụ thay vì từng thao tác nhỏ lẻ. Antigravity biến AI từ một công cụ thành một đối tác chủ động, cho phép các tác nhân tự động lập kế hoạch và thực thi đồng thời những tác vụ phần mềm phức tạp từ đầu đến cuối, cũng như tự kiểm chứng mã của chính mình.

Hình minh họa Gemini 3. Ảnh: Google

Độ an toàn và khả năng tiếp cận

Google tuyên bố Gemini 3 là mô hình an toàn nhất từ trước đến nay, đã trải qua bộ đánh giá an toàn toàn diện nhất từng được áp dụng cho bất kỳ mô hình Google AI nào. Mô hình cho thấy sự giảm thiểu khuynh hướng xu nịnh theo ý người dùng và tăng cường khả năng chống chịu trước các cuộc tấn công chèn lệnh (prompt injection).

Gemini 3 đã được đưa vào hoạt động trong toàn Google. Người dùng cá nhân có thể truy cập mô hình thông qua ứng dụng Gemini, dành cho người dùng đăng ký Google AI Pro, Ultra, và qua Chế độ AI trên Tìm kiếm. Các lập trình viên được dùng Gemini 3 trong Gemini API trên AI Studio, Google Antigravity và Gemini CLI. Trong khi đó, doanh nghiệp tiếp cận qua Vertex AI và Gemini Enterprise.

Tin nổi bật