Les scientifiques révèlent les secrets inattendus derrière la créativité des IA
Les promesses de voitures autonomes et de robots domestiques ont cédé la place à une réalité différente : des intelligences artificielles capables de nous battre aux échecs, d'analyser des textes complexes et même de composer des poèmes. Cette évolution surprenante montre que les tâches physiques simples pour les humains restent difficiles pour les robots, tandis que les algorithmes imitent de mieux en mieux notre intellect. Un autre mystère intrigue les chercheurs : la capacité de ces systèmes à faire preuve d'une créativité étrange et unique.
Les modèles de diffusion, à la base d'outils comme DALL·E, Imagen et Stable Diffusion, sont conçus pour reproduire les images sur lesquelles ils sont entraînés. Pourtant, en pratique, ils improvisent souvent, combinant des éléments pour créer des images nouvelles et cohérentes. "C'est le paradoxe des modèles de diffusion", explique Giulio Biroli, chercheur en IA à l'École Normale Supérieure de Paris. "S'ils fonctionnaient parfaitement, ils se contenteraient de mémoriser. Mais ils produisent bel et bien de nouvelles images."
Pour générer des images, ces modèles utilisent un processus appelé débruitage. Ils transforment une image en un bruit numérique (un ensemble incohérent de pixels) avant de la reconstituer. C'est comme passer un tableau à la déchiqueteuse jusqu'à obtenir une fine poussière, puis le reconstruire pièce par pièce. Mais comment expliquer l'émergence de nouveauté dans ce processus ?
Deux physiciens ont récemment proposé une réponse surprenante : ce sont les imperfections techniques du débruitage qui engendrent la créativité des modèles. Dans un article à paraître à la Conférence Internationale sur le Machine Learning 2025, ils démontrent que cette "créativité" est en réalité un processus déterministe, directement lié à l'architecture des modèles.
Mason Kamb, étudiant en physique appliquée à Stanford et auteur principal de l'étude, s'est inspiré de la morphogenèse - le processus d'auto-organisation des systèmes vivants. Il a remarqué que les premières images générées par IA présentaient des anomalies similaires à celles observées dans les systèmes biologiques, comme des mains avec des doigts supplémentaires.
Kamb et son co-auteur Surya Ganguli ont développé une machine appelée ELS (Equivariant Local Score) pour tester leur hypothèse. Les résultats ont été stupéfiants : leur système a pu prédire avec 90% de précision les sorties des modèles de diffusion existants. "Dès qu'on impose la localité, la créativité émerge automatiquement", explique Kamb.
Cette découverte ouvre de nouvelles perspectives pour comprendre non seulement l'IA, mais aussi la créativité humaine. Comme le note Ben Hoover du Georgia Institute of Technology : "L'IA et les humains créent en assemblant des éléments de leur expérience. La créativité pourrait bien émerger de nos incompréhensions du monde."