Découvrez la famille de modèles Qwen3, désormais disponible sur Amazon Bedrock Marketplace et Amazon SageMaker JumpStart

Qwen3 family of reasoning models now available in Amazon Bedrock Marketplace and Amazon SageMaker JumpStart

Découvrez la famille de modèles Qwen3, désormais disponible sur Amazon Bedrock Marketplace et Amazon SageMaker JumpStart

Aujourd'hui, nous avons le plaisir d'annoncer que Qwen3, la dernière génération de grands modèles de langage (LLM) de la famille Qwen, est désormais disponible via Amazon Bedrock Marketplace et Amazon SageMaker JumpStart. Cette mise à disposition permet aux utilisateurs de déployer les modèles Qwen3 - disponibles en tailles de paramètres 0,6B, 4B, 8B et 32B - pour développer, expérimenter et mettre à l'échelle de manière responsable leurs applications d'IA générative sur AWS. Dans cet article, nous expliquons comment commencer à utiliser Qwen3 sur Amazon Bedrock Marketplace et SageMaker JumpStart, y compris les versions distillées des modèles.

Qwen3 représente la dernière évolution des LLM de la série Qwen, offrant une gamme complète de modèles denses et mixture-of-experts (MoE). Ces modèles apportent des avancées majeures en matière de raisonnement, de suivi d'instructions, de capacités d'agent et de support multilingue. Parmi leurs caractéristiques clés figurent : un support unique permettant de basculer entre mode pensant et non-pensant au sein d'un même modèle, des capacités de raisonnement améliorées surpassant les modèles précédents, une excellente adaptation aux préférences humaines, et un support pour plus de 100 langues et dialectes.

Pour déployer les modèles Qwen3, il est nécessaire de vérifier l'accès aux types d'instances recommandés en fonction de la taille du modèle. Ces recommandations sont disponibles sur Amazon Bedrock Marketplace ou la console SageMaker JumpStart. Les utilisateurs doivent également s'assurer d'avoir les quotas nécessaires dans leur région AWS cible.

Le déploiement de Qwen3 via Amazon Bedrock Marketplace est simple. Après avoir filtré les modèles par fournisseur (Hugging Face), les utilisateurs peuvent choisir un modèle Qwen3, comme le Qwen3-32B, et suivre les étapes de configuration pour le déployer. Une fois déployé, le modèle peut être testé dans le playground Amazon Bedrock, offrant une interface interactive pour expérimenter avec différents prompts.

Qwen3 permet également d'activer ou désactiver le raisonnement via l'API Converse, selon les besoins. Par défaut, le raisonnement est activé, mais peut être désactivé en ajoutant la commande /no_think au prompt. Cela est particulièrement utile pour obtenir des réponses directes sans explications.

Pour les déploiements via SageMaker JumpStart, deux approches sont possibles : via l'interface utilisateur ou le SDK Python SageMaker. L'interface utilisateur guide les utilisateurs à travers la sélection du modèle, la configuration du déploiement et le monitoring. Le SDK Python, quant à lui, permet un déploiement programmatique avec des options de personnalisation avancées.

Enfin, pour éviter des coûts inutiles, il est important de supprimer les déploiements et prédicteurs une fois qu'ils ne sont plus nécessaires. Amazon Bedrock Marketplace et SageMaker JumpStart fournissent des interfaces simples pour gérer ces ressources.

En conclusion, Qwen3 offre une solution puissante et versatile pour les besoins en IA générative, avec des capacités avancées de raisonnement et de support multilingue. Que ce soit pour la génération de contenu, l'analyse ou des tâches complexes, Qwen3 se positionne comme un choix de premier plan sur AWS.

Dòng mô hình Qwen3 chính thức ra mắt trên Amazon Bedrock Marketplace và Amazon SageMaker JumpStart

Hôm nay, chúng tôi vui mừng thông báo Qwen3 - thế hệ mới nhất của dòng mô hình ngôn ngữ lớn (LLM) Qwen - đã chính thức có mặt trên Amazon Bedrock Marketplace và Amazon SageMaker JumpStart. Với phiên bản này, người dùng có thể triển khai các mô hình Qwen3 (với các phiên bản tham số 0.6B, 4B, 8B và 32B) để xây dựng, thử nghiệm và mở rộng ứng dụng AI sinh một cách có trách nhiệm trên AWS. Bài viết này sẽ hướng dẫn chi tiết cách bắt đầu với Qwen3 trên cả hai nền tảng, bao gồm cả các phiên bản rút gọn của mô hình.

Qwen3 đại diện cho bước tiến mới nhất trong dòng LLM Qwen, cung cấp bộ công cụ đầy đủ gồm các mô hình dense và mixture-of-experts (MoE). Những cải tiến đột phá bao gồm khả năng lập luận, tuân thủ hướng dẫn, chức năng agent và hỗ trợ đa ngôn ngữ. Đặc biệt, Qwen3 cho phép chuyển đổi linh hoạt giữa chế độ suy nghĩ và không suy nghĩ trong cùng một mô hình, nâng cao đáng kể hiệu suất trên các tác vụ toán học, lập trình và lập luận thông thường.

Để triển khai Qwen3, người dùng cần đảm bảo có quyền truy cập vào các loại instance được đề xuất tương ứng với kích thước mô hình. Thông tin này có thể xem trên Amazon Bedrock Marketplace hoặc bảng điều khiển SageMaker JumpStart. Ngoài ra, cần kiểm tra hạn ngạch tài nguyên trong khu vực AWS mục tiêu trước khi triển khai.

Quy trình triển khai Qwen3 trên Amazon Bedrock Marketplace khá đơn giản. Sau khi lọc mô hình theo nhà cung cấp (Hugging Face), người dùng chọn phiên bản Qwen3 mong muốn (ví dụ Qwen3-32B) và làm theo các bước cấu hình. Khi triển khai hoàn tất, mô hình có thể được kiểm thử ngay trong playground tích hợp, nơi cung cấp giao diện tương tác để thử nghiệm với các prompt khác nhau.

Một tính năng nổi bật của Qwen3 là khả năng bật/tắt chế độ lập luận thông qua API Converse. Mặc định chế độ này được bật, nhưng có thể tắt bằng cách thêm lệnh /no_think vào prompt - hữu ích khi cần câu trả lời nhanh không kèm giải thích.

Đối với SageMaker JumpStart, người dùng có hai lựa chọn triển khai: qua giao diện đồ họa hoặc SDK Python. Giao diện đồ họa hướng dẫn từng bước từ chọn mô hình đến giám sát triển khai, trong khi SDK Python mang lại sự linh hoạt cao hơn cho các tùy chỉnh nâng cao.

Cuối cùng, để tránh phát sinh chi phí không cần thiết, người dùng nên xóa các tài nguyên triển khai khi không còn sử dụng. Cả hai nền tảng đều cung cấp công cụ quản lý tài nguyên đơn giản và trực quan.

Tóm lại, Qwen3 mang đến giải pháp mạnh mẽ và linh hoạt cho nhu cầu AI sinh, với khả năng lập luận tiên tiến và hỗ trợ đa ngôn ngữ vượt trội. Dù cho mục đích tạo nội dung, phân tích hay xử lý tác vụ phức tạp, Qwen3 đều là lựa chọn hàng đầu trên AWS.