Découvrez la famille de modèles Qwen3, désormais disponible sur Amazon Bedrock Marketplace et Amazon SageMaker JumpStart
Aujourd'hui, nous avons le plaisir d'annoncer que Qwen3, la dernière génération de grands modèles de langage (LLM) de la famille Qwen, est désormais disponible via Amazon Bedrock Marketplace et Amazon SageMaker JumpStart. Cette mise à disposition permet aux utilisateurs de déployer les modèles Qwen3 - disponibles en tailles de paramètres 0,6B, 4B, 8B et 32B - pour développer, expérimenter et mettre à l'échelle de manière responsable leurs applications d'IA générative sur AWS. Dans cet article, nous expliquons comment commencer à utiliser Qwen3 sur Amazon Bedrock Marketplace et SageMaker JumpStart, y compris les versions distillées des modèles.
Qwen3 représente la dernière évolution des LLM de la série Qwen, offrant une gamme complète de modèles denses et mixture-of-experts (MoE). Ces modèles apportent des avancées majeures en matière de raisonnement, de suivi d'instructions, de capacités d'agent et de support multilingue. Parmi leurs caractéristiques clés figurent : un support unique permettant de basculer entre mode pensant et non-pensant au sein d'un même modèle, des capacités de raisonnement améliorées surpassant les modèles précédents, une excellente adaptation aux préférences humaines, et un support pour plus de 100 langues et dialectes.
Pour déployer les modèles Qwen3, il est nécessaire de vérifier l'accès aux types d'instances recommandés en fonction de la taille du modèle. Ces recommandations sont disponibles sur Amazon Bedrock Marketplace ou la console SageMaker JumpStart. Les utilisateurs doivent également s'assurer d'avoir les quotas nécessaires dans leur région AWS cible.
Le déploiement de Qwen3 via Amazon Bedrock Marketplace est simple. Après avoir filtré les modèles par fournisseur (Hugging Face), les utilisateurs peuvent choisir un modèle Qwen3, comme le Qwen3-32B, et suivre les étapes de configuration pour le déployer. Une fois déployé, le modèle peut être testé dans le playground Amazon Bedrock, offrant une interface interactive pour expérimenter avec différents prompts.
Qwen3 permet également d'activer ou désactiver le raisonnement via l'API Converse, selon les besoins. Par défaut, le raisonnement est activé, mais peut être désactivé en ajoutant la commande /no_think au prompt. Cela est particulièrement utile pour obtenir des réponses directes sans explications.
Pour les déploiements via SageMaker JumpStart, deux approches sont possibles : via l'interface utilisateur ou le SDK Python SageMaker. L'interface utilisateur guide les utilisateurs à travers la sélection du modèle, la configuration du déploiement et le monitoring. Le SDK Python, quant à lui, permet un déploiement programmatique avec des options de personnalisation avancées.
Enfin, pour éviter des coûts inutiles, il est important de supprimer les déploiements et prédicteurs une fois qu'ils ne sont plus nécessaires. Amazon Bedrock Marketplace et SageMaker JumpStart fournissent des interfaces simples pour gérer ces ressources.
En conclusion, Qwen3 offre une solution puissante et versatile pour les besoins en IA générative, avec des capacités avancées de raisonnement et de support multilingue. Que ce soit pour la génération de contenu, l'analyse ou des tâches complexes, Qwen3 se positionne comme un choix de premier plan sur AWS.