Lời giải của AI đáng kinh ngạc ở nhiều khía cạnh
Cụ thể, trong điều kiện tương tự thi thật, với hai buổi thi kéo dài 4,5 giờ, không sử dụng công cụ hay Internet, công cụ Deep Think đạt 35/42 điểm trong 5 câu hỏi đầu, do chính giám khảo của IMO chấm.
Trong kỳ IMO năm nay, chỉ 67/630 thí sinh đạt từ 35 điểm trở lên - mức giành huy chương vàng.
"Chúng tôi xác nhận Google DeepMind đã đạt cột mốc được mong đợi từ lâu. Lời giải của AI đáng kinh ngạc ở nhiều khía cạnh. Giám khảo IMO nhận xét chúng rõ ràng, chính xác và phần lớn dễ hiểu", giáo sư Gregor Dolinar, Chủ tịch IMO, cho biết.
Kết quả này nhấn mạnh tốc độ phát triển nhanh chóng của các hệ thống AI. Hiện nay, các công ty AI đang cạnh tranh khốc liệt nhằm tạo ra cảm nhận rằng mình đang dẫn đầu - một “cuộc chiến cảm tính” có thể ảnh hưởng lớn đến việc thu hút các tài năng hàng đầu trong lĩnh vực AI. Nhiều nhà nghiên cứu AI xuất thân từ môi trường toán học thi đấu, vì vậy các cột mốc như IMO có ý nghĩa đặc biệt.
Ảnh minh họa
Deep Think là bản nâng cao của mô hình trí tuệ nhân tạo Gemini, được thiết kế đặc biệt để giải những bài toán phức tạp như trong kỳ thi IMO. Điểm nổi bật của AI này nằm ở khả năng tư duy song song, tức cho phép mô hình cùng lúc khám phá và kết hợp nhiều hướng giải khác nhau trước khi đưa ra câu trả lời, thay vì đi theo một chuỗi suy luận tuyến tính như các mô hình thông thường.
Để phát huy tối đa năng lực suy luận, nhóm nghiên cứu huấn luyện Gemini bằng kỹ thuật học tăng cường mới, sử dụng dữ liệu chuyên sâu lập luận nhiều bước, giải quyết vấn đề và chứng minh định lý. Ngoài ra, mô hình được cung cấp một kho dữ liệu chọn lọc gồm các lời giải toán học chất lượng cao, cùng các mẹo và chiến lược tổng quát để tiếp cận bài toán IMO hiệu quả hơn.
Một cột mốc lịch sử của AI
Google cho biết đây là bước tiến vượt bậc so với các mô hình trước. Năm ngoái, AlphaGeometry 2 của hãng cũng giải đúng 42/50 bài hình học của IMO 25 năm qua, ngang trình độ thí sinh giành huy chương vàng (40,9 bài). Còn AlphaProof cũng đạt điểm tuyệt đối 4 trong 6 bài IMO 2024, giành 28/42 điểm, ngang với thí sinh giành huy chương bạc.
"Chúng tôi tin rằng kết hợp sự lưu loát trong ngôn ngữ tự nhiên với khả năng lập luận chặt chẽ sẽ trở thành những công cụ vô giá cho các nhà toán học, nhà khoa học, kỹ sư và nhà nghiên cứu, giúp chúng ta nâng cao kiến thức của con người trên con đường hướng tới trí tuệ nhân tạo tổng hợp", Google cho biết.
IMO 2025 được tổ chức từ ngày 10-20/7, tại thành phố Sunshine Coast, bang Queensland, Australia, với 630 thí sinh tham dự. Trong số đó, 67 thí sinh (khoảng 11%) đã đạt được huy chương vàng. Việc AI cũng đạt được thành tích tương tự là một cột mốc lịch sử.
Đây là năm đầu tiên cuộc thi IMO chính thức phối hợp với một số nhà phát triển AI. Các giám khảo IMO đã xác nhận kết quả của các công ty hợp tác, bao gồm Google, và yêu cầu họ công bố kết quả vào ngày 28/7.