Les scientifiques révèlent les secrets inattendus derrière la créativité des IA

Researchers Uncover Hidden Ingredients Behind AI Creativity

Les scientifiques révèlent les secrets inattendus derrière la créativité des IA

Les promesses de voitures autonomes et de robots domestiques ont cédé la place à une réalité différente : des intelligences artificielles capables de nous battre aux échecs, d'analyser des textes complexes et même de composer des poèmes. Cette évolution surprenante montre que les tâches physiques simples pour les humains restent difficiles pour les robots, tandis que les algorithmes imitent de mieux en mieux notre intellect. Un autre mystère intrigue les chercheurs : la capacité de ces systèmes à faire preuve d'une créativité étrange et unique.

Les modèles de diffusion, à la base d'outils comme DALL·E, Imagen et Stable Diffusion, sont conçus pour reproduire les images sur lesquelles ils sont entraînés. Pourtant, en pratique, ils improvisent souvent, combinant des éléments pour créer des images nouvelles et cohérentes. "C'est le paradoxe des modèles de diffusion", explique Giulio Biroli, chercheur en IA à l'École Normale Supérieure de Paris. "S'ils fonctionnaient parfaitement, ils se contenteraient de mémoriser. Mais ils produisent bel et bien de nouvelles images."

Pour générer des images, ces modèles utilisent un processus appelé débruitage. Ils transforment une image en un bruit numérique (un ensemble incohérent de pixels) avant de la reconstituer. C'est comme passer un tableau à la déchiqueteuse jusqu'à obtenir une fine poussière, puis le reconstruire pièce par pièce. Mais comment expliquer l'émergence de nouveauté dans ce processus ?

Deux physiciens ont récemment proposé une réponse surprenante : ce sont les imperfections techniques du débruitage qui engendrent la créativité des modèles. Dans un article à paraître à la Conférence Internationale sur le Machine Learning 2025, ils démontrent que cette "créativité" est en réalité un processus déterministe, directement lié à l'architecture des modèles.

Mason Kamb, étudiant en physique appliquée à Stanford et auteur principal de l'étude, s'est inspiré de la morphogenèse - le processus d'auto-organisation des systèmes vivants. Il a remarqué que les premières images générées par IA présentaient des anomalies similaires à celles observées dans les systèmes biologiques, comme des mains avec des doigts supplémentaires.

Kamb et son co-auteur Surya Ganguli ont développé une machine appelée ELS (Equivariant Local Score) pour tester leur hypothèse. Les résultats ont été stupéfiants : leur système a pu prédire avec 90% de précision les sorties des modèles de diffusion existants. "Dès qu'on impose la localité, la créativité émerge automatiquement", explique Kamb.

Cette découverte ouvre de nouvelles perspectives pour comprendre non seulement l'IA, mais aussi la créativité humaine. Comme le note Ben Hoover du Georgia Institute of Technology : "L'IA et les humains créent en assemblant des éléments de leur expérience. La créativité pourrait bien émerger de nos incompréhensions du monde."

Các nhà khoa học khám phá bí mật đằng sau khả năng sáng tạo của AI

Những lời hứa về xe tự lái và robot giúp việc đã nhường chỗ cho một thực tế khác: các hệ thống trí tuệ nhân tạo có thể đánh bại con người trong cờ vua, phân tích văn bản phức tạp và thậm chí sáng tác thơ. Sự phát triển đáng ngạc nhiên này cho thấy những nhiệm vụ vật lý đơn giản với con người vẫn là thách thức với robot, trong khi các thuật toán ngày càng bắt chước tốt hơn trí tuệ của chúng ta. Một bí ẩn khác khiến giới nghiên cứu đau đầu: khả năng sáng tạo độc đáo và kỳ lạ của những hệ thống này.

Các mô hình khuếch tán, nền tảng của những công cụ như DALL·E, Imagen và Stable Diffusion, được thiết kế để tái tạo các hình ảnh chúng được huấn luyện. Thế nhưng, trong thực tế, chúng thường ứng biến, kết hợp các yếu tố để tạo ra hình ảnh mới mẻ và có ý nghĩa. "Đây là nghịch lý của mô hình khuếch tán", Giulio Biroli, nhà nghiên cứu AI tại École Normale Supérieure Paris giải thích. "Nếu hoạt động hoàn hảo, chúng chỉ cần ghi nhớ. Nhưng thực tế chúng tạo ra được những hình ảnh mới."

Để tạo hình ảnh, các mô hình này sử dụng quy trình gọi là khử nhiễu. Chúng biến một hình ảnh thành nhiễu số (tập hợp pixel hỗn độn) trước khi tái tạo lại. Quá trình này giống như đưa một bức tranh qua máy xay cho đến khi chỉ còn lại bụi mịn, rồi lắp ráp lại từng mảnh. Nhưng làm thế nào sự mới mẻ xuất hiện trong quá trình này?

Hai nhà vật lý gần đây đã đưa ra câu trả lời bất ngờ: chính những khiếm khuyết kỹ thuật trong quá trình khử nhiễu tạo nên khả năng sáng tạo của mô hình. Trong báo cáo sẽ trình bày tại Hội nghị Quốc tế về Máy học 2025, họ chứng minh rằng "sự sáng tạo" này thực chất là quá trình tất định, liên quan trực tiếp đến kiến trúc mô hình.

Mason Kamb, nghiên cứu sinh vật lý ứng dụng tại Stanford và tác giả chính của nghiên cứu, lấy cảm hứng từ morphogenesis - quá trình tự tổ chức của hệ sống. Anh nhận thấy những hình ảnh AI tạo ra ban đầu có điểm bất thường tương tự hệ sinh học, như bàn tay với ngón thừa.

Kamb và đồng tác giả Surya Ganguli đã phát triển hệ thống ELS (Equivariant Local Score) để kiểm chứng giả thuyết. Kết quả gây sốc: hệ thống của họ dự đoán chính xác đến 90% đầu ra của các mô hình khuếch tán hiện có. "Ngay khi áp dụng tính địa phương, sự sáng tạo xuất hiện tự động", Kamb giải thích.

Khám phá này mở ra hướng tiếp cận mới không chỉ với AI mà còn với sự sáng tạo của con người. Như Ben Hoover từ Viện Công nghệ Georgia nhận định: "AI và con người đều sáng tạo bằng cách lắp ghép từ trải nghiệm. Có lẽ sáng tạo bắt nguồn từ những hiểu biết chưa trọn vẹn về thế giới."