Révolution en apprentissage automatique : Des algorithmes innovants exploitent efficacement les données symétriques
Une équipe du MIT a résolu une question fondamentale en intelligence artificielle : comment entraîner efficacement des modèles d'apprentissage automatique à respecter les symétries naturelles des données. Leurs travaux, présentés à la Conférence Internationale sur le Machine Learning, ouvrent la voie à des modèles plus précis et moins gourmands en ressources.
Les données symétriques, comme les structures moléculaires qui restent identiques après rotation, posent un défi majeur aux algorithmes classiques. Sans compréhension de ces symétries, un modèle pourrait considérer une molécule tournée comme un nouvel élément, faussant ses prédictions. Jusqu'ici, aucune méthode ne garantissait à la fois efficacité computationnelle et respect rigoureux des symétries.
Behrooz Tahmasebi et Ashkan Soleymani, doctorants au MIT, ont co-dirigé cette recherche avec les professeurs Stefanie Jegelka et Patrick Jaillet. Leur approche combine astucieusement algèbre et géométrie pour créer un algorithme optimisé. 'Ces symétries représentent une information essentielle que la nature nous livre sur les données', explique Tahmasebi.
Contrairement aux méthodes existantes comme l'augmentation de données (génératrice de coûts computationnels prohibitifs) ou les réseaux de neurones graphiques (dont le fonctionnement reste mystérieux), leur solution offre des garanties théoriques d'efficacité. Elle nécessite moins de données d'entraînement tout en capturant parfaitement les symétries.
Les applications potentielles sont vastes : découverte de médicaments, science des matériaux, astronomie ou étude du climat. Cette avancée pourrait inspirer de nouvelles architectures de réseaux neuronaux, combinant précision accrue et économie de ressources computationnelles.