DeepSeek aurait utilisé Gemini de Google pour entraîner son dernier modèle d'IA
La semaine dernière, le laboratoire chinois DeepSeek a publié une version mise à jour de son modèle d'IA R1, qui obtient des résultats impressionnants sur plusieurs benchmarks de mathématiques et de codage. Bien que l'entreprise n'ait pas révélé la source des données utilisées pour l'entraînement, certains chercheurs soupçonnent qu'une partie proviendrait de Gemini, la famille de modèles d'IA de Google.
Sam Paech, un développeur basé à Melbourne spécialisé dans les évaluations d'"intelligence émotionnelle" pour l'IA, a partagé sur X ce qu'il présente comme des preuves que le dernier modèle de DeepSeek a été entraîné sur des sorties de Gemini. Selon lui, le modèle R1-0528 de DeepSeek privilégie des mots et expressions similaires à ceux utilisés par Gemini 2.5 Pro de Google.
Un autre développeur, créateur anonyme de l'outil d'évaluation "SpeechMap", a également noté que les traces de raisonnement du modèle DeepSeek ressemblaient fortement à celles de Gemini. Ce n'est pas la première fois que DeepSeek est accusé d'utiliser des données de modèles concurrents : en décembre, son modèle V3 s'identifiait parfois comme ChatGPT.
OpenAI aurait détecté des preuves que DeepSeek utilise la distillation, une technique consistant à extraire des données de modèles plus performants. Microsoft, partenaire d'OpenAI, a signalé des fuites massives de données via des comptes développeurs liés à DeepSeek fin 2024.
Si la distillation est une pratique courante, elle viole les conditions d'utilisation d'OpenAI. Cependant, la prolifération de contenus générés par l'IA sur le web rend difficile le filtrage des données d'entraînement. Nathan Lambert, chercheur à AI2, estime plausible que DeepSeek ait utilisé Gemini pour générer des données synthétiques.
Face à ces risques, les entreprises renforcent leur sécurité. OpenAI exige désormais une vérification d'identité pour accéder à ses modèles avancés, excluant ainsi la Chine. Google et Anthropic ont également commencé à "résumer" les traces de leurs modèles pour protéger leur avantage concurrentiel.