Révolution en apprentissage automatique : Des algorithmes innovants exploitent efficacement les données symétriques

New algorithms enable efficient machine learning with symmetric data

Révolution en apprentissage automatique : Des algorithmes innovants exploitent efficacement les données symétriques

Une équipe du MIT a résolu une question fondamentale en intelligence artificielle : comment entraîner efficacement des modèles d'apprentissage automatique à respecter les symétries naturelles des données. Leurs travaux, présentés à la Conférence Internationale sur le Machine Learning, ouvrent la voie à des modèles plus précis et moins gourmands en ressources.

Les données symétriques, comme les structures moléculaires qui restent identiques après rotation, posent un défi majeur aux algorithmes classiques. Sans compréhension de ces symétries, un modèle pourrait considérer une molécule tournée comme un nouvel élément, faussant ses prédictions. Jusqu'ici, aucune méthode ne garantissait à la fois efficacité computationnelle et respect rigoureux des symétries.

Behrooz Tahmasebi et Ashkan Soleymani, doctorants au MIT, ont co-dirigé cette recherche avec les professeurs Stefanie Jegelka et Patrick Jaillet. Leur approche combine astucieusement algèbre et géométrie pour créer un algorithme optimisé. 'Ces symétries représentent une information essentielle que la nature nous livre sur les données', explique Tahmasebi.

Contrairement aux méthodes existantes comme l'augmentation de données (génératrice de coûts computationnels prohibitifs) ou les réseaux de neurones graphiques (dont le fonctionnement reste mystérieux), leur solution offre des garanties théoriques d'efficacité. Elle nécessite moins de données d'entraînement tout en capturant parfaitement les symétries.

Les applications potentielles sont vastes : découverte de médicaments, science des matériaux, astronomie ou étude du climat. Cette avancée pourrait inspirer de nouvelles architectures de réseaux neuronaux, combinant précision accrue et économie de ressources computationnelles.

Đột phá AI: Thuật toán mới xử lý hiệu quả dữ liệu đối xứng trong học máy

Các nhà nghiên cứu MIT vừa công bố giải pháp đột phá cho bài toán nan giải trong trí tuệ nhân tạo: đào tạo mô hình học máy nhận biết tính đối xứng tự nhiên của dữ liệu một cách hiệu quả. Nghiên cứu này, trình bày tại Hội nghị Quốc tế về Học Máy, mở đường cho các hệ thống AI chính xác hơn và tiết kiệm tài nguyên hơn.

Dữ liệu đối xứng - như cấu trúc phân tử không thay đổi khi xoay - vốn là thách thức lớn với thuật toán thông thường. Nếu không hiểu tính đối xứng, mô hình có thể nhầm một phân tử xoay nghiêng là dữ liệu mới, dẫn đến dự đoán sai lệch. Trước đây, chưa có phương pháp nào đảm bảo đồng thời hiệu quả tính toán và tuân thủ chặt chẽ các đối xứng.

Nhóm nghiên cứu do hai nghiên cứu sinh Behrooz Tahmasebi và Ashkan Soleymani dẫn đầu, cùng các giáo sư Stefanie Jegelka và Patrick Jaillet tại MIT, đã phát triển giải pháp độc đáo kết hợp đại số và hình học. 'Tính đối xứng chứa thông tin quan trọng từ tự nhiên mà mô hình học máy cần nắm bắt', Tahmasebi nhấn mạnh.

Khác với phương pháp tăng cường dữ liệu (tốn kém tài nguyên) hay mạng nơ-ron đồ thị (hoạt động như 'hộp đen'), thuật toán mới này có nền tảng lý thuyết vững chắc về hiệu quả. Nó yêu cầu ít dữ liệu huấn luyện hơn trong khi vẫn nắm bắt hoàn hảo mọi đối xứng.

Ứng dụng tiềm năng trải rộng từ dược phẩm, vật liệu mới đến thiên văn và khí hậu. Đột phá này có thể thúc đẩy thiết kế kiến trúc mạng nơ-ron thế hệ mới, cân bằng giữa độ chính xác cao và tối ưu tài nguyên tính toán.