ChatGPT défie un Atari 1977 aux échecs... et le résultat est catastrophique

ChatGPT takes on a 1977 Atari at chess ... and it didn't go well

ChatGPT défie un Atari 1977 aux échecs... et le résultat est catastrophique

Dans un affrontement pour le moins surprenant, ChatGPT s'est mesuré à un jeu d'échecs sur Atari 2600 datant de 1977. Le résultat, partagé par l'ingénieur logiciel Robert Caruso sur LinkedIn, s'est avéré désastreux pour l'IA conversationnelle, totalement surclassée par le modeste programme de l'ère disco. L'expérience révèle les limites fondamentales des modèles de langage face aux systèmes spécialisés.

Robert Caruso a initié une conversation avec ChatGPT sur l'histoire de l'IA dans les échecs, ce qui a conduit le chatbot à proposer une partie contre Atari Chess via un émulateur Stella. Contre toute attente, l'antique programme a dominé sans pitié son adversaire moderne, exposant les lacunes flagrantes de ChatGPT dans ce jeu stratégique.

Le spectacle fut pathétique : ChatGPT confondait tours et fous, oubliait la position des pièces, et accumulait les erreurs grossières. Malgré 90 minutes d'assistance humaine pour éviter les pires bourdes, l'IA a finalement dû s'avouer vaincue face à un programme qui, à l'origine, peinait à gérer les règles basiques comme le roque.

Cette déroute s'explique par la nature fondamentalement différente des technologies en présence. Les moteurs d'échecs, même rudimentaires comme celui d'Atari, sont conçus spécifiquement pour évaluer des millions de coups selon des règles strictes. ChatGPT, en revanche, fonctionne par prédiction statistique de mots sans véritable compréhension logique.

L'épisode illustre que le terme "IA" recouvre en réalité des technologies hétérogènes. Si des systèmes comme Stockfish surpassent les grands maîtres depuis des décennies, les LLM comme ChatGPT brillent dans le langage mais échouent dans les tâches nécessitant rigueur logique et mémoire persistante.

Comme le souligne l'article, cette limitation dépasse le cadre des échecs. Les LLM ne sont pas des solveurs universels et peinent avec les raisonnements précis ou les règles strictes. Ils peuvent discuter stratégie mais doivent éviter de toucher aux pièces - une leçon que ChatGPT a apprise à ses dépens.

ChatGPT thách đấu Atari 1977 trong ván cờ... và cái kết bẽ bàng

Trong một thử nghiệm bất ngờ, ChatGPT đã nhận lời đấu cờ với máy chơi game Atari 2600 đời 1977. Kết quả được kỹ sư phần mềm Robert Caruso chia sẻ trên LinkedIn cho thấy sự thất bại thảm hại của trí tuệ nhân tạo hiện đại trước chương trình cổ lỗ từ thời kỳ disco. Sự kiện này phơi bày những hạn chế cố hữu của mô hình ngôn ngữ lớn.

Cuộc đối đầu bắt đầu khi Caruso thảo luận với ChatGPT về lịch sử AI trong cờ vua. Tự tin đề nghị một ván đấu, ChatGPT đã phải đối mặt với Atari Chess thông qua trình giả lập Stella. Nhưng thay vì thể hiện ưu thế, nó đã phô diễn một màn trình diễn kém cỏi đến mức khó tin.

ChatGPT liên tục mắc những lỗi cơ bản: nhầm lẫn giữa quân xe và tượng, bỏ qua các nước chiếu bí, thậm chí 'quên' vị trí các quân cờ. Dù được Caruso hỗ trợ trong 90 phút để tránh những nước đi thảm họa, cuối cùng AI cũng phải đầu hàng trước đối thủ từ thời đồ đá kỹ thuật số.

Nguyên nhân thất bại nằm ở sự khác biệt căn bản giữa hai công nghệ. Trong khi chương trình cờ Atari dù đơn giản nhưng được thiết kế chuyên biệt để tính toán nước đi, ChatGPT hoạt động dựa trên dự đoán từ ngữ thống kê mà không có tư duy logic thực sự. Nó giỏi tạo lập ngôn ngữ nhưng không thể 'suy nghĩ' như một kỳ thủ.

Sự kiện này minh họa rõ ràng rằng thuật ngữ 'AI' bao hàm nhiều công nghệ khác biệt. Nếu các engine cờ như Stockfish có thể đánh bại đại kiện tướng từ lâu, thì các mô hình ngôn ngữ lớn như ChatGPT tỏ ra yếu thế trong các tác vụ đòi hỏi logic chặt chẽ và trí nhớ bền vững.

Bài học không chỉ giới hạn ở bàn cờ. Như bài viết chỉ rõ, LLM không phải là giải pháp vạn năng. Chúng có thể thảo luận chiến thuật nhưng không thể thay thế tư duy chiến lược - một ranh giới mà ChatGPT đã vượt qua với cái giá phải trả là sự bẽ mặt trước 'ông lão' Atari 45 tuổi.