La Chine surprend avec son modèle d'IA DeepSeek R1 amélioré, intensifiant la concurrence avec OpenAI
- La société chinoise DeepSeek a publié une version améliorée de son modèle d'IA de raisonnement DeepSeek R1.
- DeepSeek a gagné en notoriété cette année après que son modèle de raisonnement R1 gratuit et open-source a surpassé les offres de concurrents comme Meta et OpenAI.
- Le faible coût et le temps de développement court ont choqué les marchés mondiaux, effaçant des milliards de dollars de valeur des principales actions technologiques américaines.
La startup chinoise DeepSeek, qui a provoqué des ondes de choc sur les marchés cette année, a discrètement publié une version améliorée de son modèle de raisonnement d'intelligence artificielle.
L'entreprise n'a pas fait d'annonce officielle, mais la mise à niveau de DeepSeek R1 a été publiée sur le dépôt de modèles d'IA Hugging Face.
DeepSeek a gagné en notoriété cette année après que son modèle de raisonnement R1 gratuit et open-source a surpassé les offres de concurrents comme Meta et OpenAI. Le faible coût et le temps de développement court ont choqué les marchés mondiaux, suscitant des inquiétudes que les géants technologiques américains dépensaient trop en infrastructure et effaçant des milliards de dollars de valeur des principales actions technologiques américaines comme Nvidia. Ces entreprises se sont depuis largement rétablies.
Comme ce fut le cas pour les débuts de DeepSeek R1, le modèle amélioré a également été publié sans grand tapage. C'est un modèle de raisonnement, ce qui signifie que l'IA peut exécuter des tâches plus complexes grâce à un processus de pensée logique étape par étape.
Le modèle amélioré DeepSeek R1 est juste derrière les modèles de raisonnement o4-mini et o3 d'OpenAI sur LiveCodeBench, un site qui évalue les modèles selon différentes métriques.
"La dernière mise à niveau de DeepSeek est plus précise en raisonnement, plus forte en mathématiques et en code, et se rapproche des modèles de premier plan comme Gemini et O3", a déclaré Adina Yakefu, chercheuse en IA chez Hugging Face, à CNBC.
Le modèle amélioré présente "des améliorations majeures en inférence et en réduction des hallucinations", a déclaré Yakefu, ajoutant que "cette version montre que DeepSeek ne fait pas que rattraper son retard, il est en compétition". L'hallucination fait référence à l'IA qui fournit des informations incorrectes.
DeepSeek est devenu l'exemple type de la façon dont l'intelligence artificielle chinoise continue de se développer malgré les tentatives américaines de restreindre l'accès du pays aux puces et autres technologies. Ce mois-ci, les géants technologiques chinois Baidu et Tencent ont révélé comment ils rendaient leurs modèles d'IA plus efficaces pour faire face aux restrictions américaines sur les exportations de semi-conducteurs.
Jensen Huang, PDG de Nvidia, qui conçoit les unités de traitement graphique nécessaires pour entraîner d'énormes modèles d'IA, a critiqué les contrôles américains sur les exportations mercredi.
"Les États-Unis ont basé leur politique sur l'hypothèse que la Chine ne peut pas fabriquer de puces d'IA", a déclaré Huang. "Cette hypothèse a toujours été discutable, et maintenant elle est clairement erronée."
"La question n'est pas de savoir si la Chine aura de l'IA", a ajouté Huang. "Elle en a déjà."