Dans les coulisses d'une réunion secrète où les mathématiciens ont tenté de surpasser l'IA

Inside the Secret Meeting Where Mathematicians Struggled to Outsmart AI

Dans les coulisses d'une réunion secrète où les mathématiciens ont tenté de surpasser l'IA

Le 6 juin 2025 - En mai dernier, une trentaine des plus éminents mathématiciens du monde se sont réunis secrètement à Berkeley, en Californie, pour un duel inédit contre une intelligence artificielle. Pendant deux jours, ils ont confronté le chatbot o4-mini d'OpenAI à des problèmes mathématiques complexes, espérant mettre en échec ses capacités de raisonnement. À leur grande surprise, l'IA a résolu certaines des questions les plus difficiles, démontrant une aptitude proche du "génie mathématique".

L'événement, organisé par Epoch AI, visait à évaluer les progrès des modèles de langage dans le domaine du raisonnement mathématique. Le chatbot o4-mini, spécialement entraîné pour effectuer des déductions complexes, a surpassé les attentes en résolvant environ 20% des problèmes du benchmark FrontierMath, incluant des défis de niveau recherche.

Ken Ono, mathématicien à l'Université de Virginie et juge lors de la rencontre, raconte son expérience troublante : après avoir soumis une question ouverte en théorie des nombres, il a vu l'IA maîtriser la littérature en deux minutes, proposer une version simplifiée du problème, puis fournir une solution correcte en dix minutes - un travail qui prendrait des semaines à un humain.

Les participants, liés par des accords de confidentialité stricts, ont finalement réussi à concevoir 10 questions résistant à l'IA. Mais cette performance exceptionnelle soulève des questions sur l'avenir des mathématiciens. Yang Hui He du London Institute compare o4-mini à "un très bon étudiant en doctorat, voire mieux".

Les chercheurs s'inquiètent notamment de la confiance excessive qu'on pourrait accorder aux résultats de l'IA, qualifiant son style de "preuve par intimidation". Ils envisagent déjà un "niveau 5" de problèmes insolubles même par les meilleurs humains - un seuil qui redéfinirait radicalement leur rôle.

Ono conclut : "C'est une grave erreur de penser que l'intelligence générale artificielle n'arrivera jamais. Ces modèles surpassent déjà nos meilleurs étudiants." Une prise de conscience qui, selon lui, doit conduire à repenser l'enseignement des mathématiques autour de la créativité.

Bên trong cuộc họp bí mật nơi các nhà toán học vật lộn để vượt mặt AI

Ngày 6 tháng 6 năm 2025 - Giữa tháng 5 vừa qua, 30 nhà toán học hàng đầu thế giới đã bí mật tụ họp tại Berkeley, California cho một trận đấu trí chưa từng có với trí tuệ nhân tạo. Trong hai ngày, họ thử thách chatbot o4-mini của OpenAI bằng những bài toán phức tạp, hy vọng làm lộ giới hạn khả năng lập luận của AI. Kết quả khiến họ sửng sốt: AI này giải quyết được những vấn đề được coi là khó nhất, thể hiện năng lực "thiên tài toán học".

Sự kiện do Epoch AI tổ chức nhằm đánh giá tiến bộ của mô hình ngôn ngữ lớn (LLM) trong lĩnh vực suy luận toán học. o4-mini, được huấn luyện đặc biệt để xử lý các suy diễn phức tạp, đã vượt xa kỳ vọng khi giải được khoảng 20% bài toán trong bộ kiểm tra FrontierMath, bao gồm cả thách thức cấp nghiên cứu.

Ken Ono, nhà toán học Đại học Virginia và giám khảo cuộc họp, kể lại trải nghiệm đáng kinh ngạc: sau khi đưa ra một câu hỏi mở trong lý thuyết số, ông chứng kiến AI nắm bắt tài liệu chuyên ngành trong hai phút, đề xuất phiên bản đơn giản hóa của bài toán, rồi đưa ra lời giải chính xác chỉ sau mười phút - công việc mà con người cần hàng tuần.

Các thành viên tham gia, bị ràng buộc bởi thỏa thuận bảo mật nghiêm ngặt, cuối cùng cũng tạo ra được 10 câu hỏi làm khó AI. Nhưng thành tích phi thường này đặt ra câu hỏi về tương lai ngành toán. Yang Hui He từ Viện Toán London London so sánh o4-mini với "một nghiên cứu sinh xuất sắc, thậm chí còn hơn thế".

Các nhà khoa học lo ngại về việc con người có thể tin tưởng quá mức vào kết quả từ AI, gọi phong cách của nó là "chứng minh bằng sự hùng hổ". Họ đã nghĩ tới "cấp độ 5" - những bài toán ngay cả bộ óc vĩ đại nhất cũng không giải nổi - ngưỡng cửa sẽ thay đổi căn bản vai trò của nhà toán học.

Ono kết luận: "Thật sai lầm khi nghĩ trí tuệ nhân tạo tổng quát sẽ không bao giờ xuất hiện. Những mô hình này đã vượt xa những sinh viên ưu tú nhất của chúng ta." Một nhận thức buộc ngành giáo dục phải tái định hướng đào tạo toán học xoay quanh tư duy sáng tạo.