La Chine surprend avec son modèle d'IA DeepSeek R1 amélioré, intensifiant la concurrence avec OpenAI

China's DeepSeek quietly releases upgraded R1 AI model, ramping up competition with OpenAI

La Chine surprend avec son modèle d'IA DeepSeek R1 amélioré, intensifiant la concurrence avec OpenAI

  • La société chinoise DeepSeek a publié une version améliorée de son modèle d'IA de raisonnement DeepSeek R1.
  • DeepSeek a gagné en notoriété cette année après que son modèle de raisonnement R1 gratuit et open-source a surpassé les offres de concurrents comme Meta et OpenAI.
  • Le faible coût et le temps de développement court ont choqué les marchés mondiaux, effaçant des milliards de dollars de valeur des principales actions technologiques américaines.

La startup chinoise DeepSeek, qui a provoqué des ondes de choc sur les marchés cette année, a discrètement publié une version améliorée de son modèle de raisonnement d'intelligence artificielle.

L'entreprise n'a pas fait d'annonce officielle, mais la mise à niveau de DeepSeek R1 a été publiée sur le dépôt de modèles d'IA Hugging Face.

DeepSeek a gagné en notoriété cette année après que son modèle de raisonnement R1 gratuit et open-source a surpassé les offres de concurrents comme Meta et OpenAI. Le faible coût et le temps de développement court ont choqué les marchés mondiaux, suscitant des inquiétudes que les géants technologiques américains dépensaient trop en infrastructure et effaçant des milliards de dollars de valeur des principales actions technologiques américaines comme Nvidia. Ces entreprises se sont depuis largement rétablies.

Comme ce fut le cas pour les débuts de DeepSeek R1, le modèle amélioré a également été publié sans grand tapage. C'est un modèle de raisonnement, ce qui signifie que l'IA peut exécuter des tâches plus complexes grâce à un processus de pensée logique étape par étape.

Le modèle amélioré DeepSeek R1 est juste derrière les modèles de raisonnement o4-mini et o3 d'OpenAI sur LiveCodeBench, un site qui évalue les modèles selon différentes métriques.

"La dernière mise à niveau de DeepSeek est plus précise en raisonnement, plus forte en mathématiques et en code, et se rapproche des modèles de premier plan comme Gemini et O3", a déclaré Adina Yakefu, chercheuse en IA chez Hugging Face, à CNBC.

Le modèle amélioré présente "des améliorations majeures en inférence et en réduction des hallucinations", a déclaré Yakefu, ajoutant que "cette version montre que DeepSeek ne fait pas que rattraper son retard, il est en compétition". L'hallucination fait référence à l'IA qui fournit des informations incorrectes.

DeepSeek est devenu l'exemple type de la façon dont l'intelligence artificielle chinoise continue de se développer malgré les tentatives américaines de restreindre l'accès du pays aux puces et autres technologies. Ce mois-ci, les géants technologiques chinois Baidu et Tencent ont révélé comment ils rendaient leurs modèles d'IA plus efficaces pour faire face aux restrictions américaines sur les exportations de semi-conducteurs.

Jensen Huang, PDG de Nvidia, qui conçoit les unités de traitement graphique nécessaires pour entraîner d'énormes modèles d'IA, a critiqué les contrôles américains sur les exportations mercredi.

"Les États-Unis ont basé leur politique sur l'hypothèse que la Chine ne peut pas fabriquer de puces d'IA", a déclaré Huang. "Cette hypothèse a toujours été discutable, et maintenant elle est clairement erronée."

"La question n'est pas de savoir si la Chine aura de l'IA", a ajouté Huang. "Elle en a déjà."

Trung Quốc gây bất ngờ với mô hình AI DeepSeek R1 nâng cấp, tăng cường cạnh tranh với OpenAI

  • Công ty Trung Quốc DeepSeek đã phát hành phiên bản nâng cấp của mô hình AI lập luận DeepSeek R1.
  • DeepSeek đã nổi lên trong năm nay sau khi mô hình lập luận R1 miễn phí, mã nguồn mở của họ vượt trội hơn các sản phẩm của đối thủ bao gồm Meta và OpenAI.
  • Chi phí thấp và thời gian phát triển ngắn đã gây chấn động thị trường toàn cầu, xóa sổ hàng tỷ đô la giá trị cổ phiếu công nghệ lớn của Mỹ.

Startup Trung Quốc DeepSeek, gây chấn động thị trường trong năm nay, đã âm thầm phát hành phiên bản nâng cấp của mô hình lập luận trí tuệ nhân tạo của mình.

Công ty không có thông báo chính thức, nhưng bản nâng cấp của DeepSeek R1 đã được phát hành trên kho lưu trữ mô hình AI Hugging Face.

DeepSeek đã nổi lên trong năm nay sau khi mô hình lập luận R1 miễn phí, mã nguồn mở của họ vượt trội hơn các sản phẩm của đối thủ bao gồm Meta và OpenAI. Chi phí thấp và thời gian phát triển ngắn đã gây chấn động thị trường toàn cầu, làm dấy lên lo ngại rằng các gã khổng lồ công nghệ Mỹ đang chi tiêu quá mức cho cơ sở hạ tầng và xóa sổ hàng tỷ đô la giá trị cổ phiếu công nghệ lớn của Mỹ như Nvidia. Các công ty này kể từ đó đã phục hồi phần lớn.

Giống như trường hợp ra mắt DeepSeek R1, mô hình nâng cấp cũng được phát hành mà không có nhiều ồn ào. Đây là một mô hình lập luận, có nghĩa là AI có thể thực hiện các nhiệm vụ phức tạp hơn thông qua một quá trình suy nghĩ logic từng bước.

Mô hình DeepSeek R1 nâng cấp chỉ đứng sau các mô hình lập luận o4-mini và o3 của OpenAI trên LiveCodeBench, một trang web đánh giá các mô hình dựa trên các chỉ số khác nhau.

"Bản nâng cấp mới nhất của DeepSeek sắc bén hơn trong lập luận, mạnh mẽ hơn về toán học và mã, và đang tiến gần đến các mô hình hàng đầu như Gemini và O3", Adina Yakefu, nhà nghiên cứu AI tại Hugging Face, nói với CNBC.

Mô hình nâng cấp có "những cải tiến lớn trong suy luận và giảm ảo giác", Yakefu nói, thêm rằng "phiên bản này cho thấy DeepSeek không chỉ đuổi kịp, mà còn đang cạnh tranh". Ảo giác đề cập đến AI cung cấp thông tin không chính xác.

DeepSeek đã trở thành hình mẫu về cách trí tuệ nhân tạo Trung Quốc vẫn đang phát triển bất chấp nỗ lực của Mỹ nhằm hạn chế tiếp cận của nước này với chip và công nghệ khác. Tháng này, các gã khổng lồ công nghệ Trung Quốc Baidu và Tencent đã tiết lộ cách họ làm cho các mô hình AI của mình hiệu quả hơn để đối phó với các hạn chế xuất khẩu chất bán dẫn của Mỹ.

Jensen Huang, CEO của Nvidia, công ty thiết kế các đơn vị xử lý đồ họa cần thiết để đào tạo các mô hình AI khổng lồ, đã chỉ trích các biện pháp kiểm soát xuất khẩu của Mỹ vào thứ Tư.

"Mỹ đã dựa chính sách của mình trên giả định rằng Trung Quốc không thể sản xuất chip AI", Huang nói. "Giả định đó luôn đáng ngờ, và giờ đây rõ ràng là sai."

"Câu hỏi không phải là liệu Trung Quốc có AI hay không", Huang nói thêm. "Họ đã có rồi."