Cette IA n'arrête jamais d'apprendre : une révolution dans le domaine des modèles linguistiques
Les grands modèles linguistiques (LLM) modernes peuvent rédiger des sonnets élégants et du code sophistiqué, mais ils sont incapables d'apprendre de leurs expériences. Des chercheurs du Massachusetts Institute of Technology (MIT) ont développé une méthode permettant à ces modèles de s'améliorer continuellement en ajustant leurs paramètres en fonction de nouvelles informations. Cette avancée, baptisée SEAL (Self Adapting Language Models), représente une étape cruciale vers la création d'IA capables d'apprendre en permanence, un objectif de longue date dans ce domaine.
Le système SEAL permet à un LLM de générer ses propres données d'entraînement synthétiques et de mettre à jour ses procédures en fonction des entrées reçues. « L'idée initiale était d'explorer si les tokens pouvaient provoquer une mise à jour significative du modèle », explique Jyothish Pari, doctorant au MIT impliqué dans le développement de SEAL. Adam Zweiger, un autre chercheur du projet, ajoute que contrairement aux modèles classiques, SEAL intègre ses nouvelles découvertes directement dans ses paramètres.
Pour tester leur approche, les chercheurs ont utilisé des versions réduites de deux modèles open source, Llama de Meta et Qwen d'Alibaba. Les résultats, obtenus sur des tests de texte et de raisonnement abstrait (benchmark ARC), montrent que SEAL permet aux modèles de continuer à apprendre bien au-delà de leur formation initiale. Pulkit Agrawal, professeur au MIT supervisant ces travaux, souligne que SEAL ouvre la voie à des IA plus personnalisées.
Cependant, des défis subsistent. Les LLM testés souffrent d'« oubli catastrophique », où l'acquisition de nouvelles connaissances efface les anciennes. De plus, SEAL est gourmand en ressources computationnelles, et la planification optimale des phases d'apprentissage reste à déterminer. Malgré ces limites, SEAL représente une piste prometteuse pour l'avenir de l'IA, avec des applications potentielles dans les chatbots et autres outils intelligents.