Name: Qwen 2.5 72B
Author: Alibaba

Question 1

Qwen 2.5 72B est-il gratuit à utiliser ?

Accepted Answer

Qwen 2.5 72B est gratuit à exécuter localement sur votre propre matériel. L'accès hébergé via osFoundry est facturé à l'usage (entrée Free (local) / $ 0.50 /1M, sortie Free (local) / $ 0.70 /1M). Vous pouvez basculer entre local et hébergé à tout moment.

Question 2

Puis-je utiliser Qwen 2.5 72B à des fins commerciales ?

Accepted Answer

Oui — l'usage commercial est autorisé. Autorise l'usage commercial avec attribution ; certaines restrictions sur les usages abusifs. Attribution « Built with Qwen » requise dans les dérivés.

Question 3

Quelle est la fenêtre de contexte de Qwen 2.5 72B ?

Accepted Answer

Qwen 2.5 72B prend en charge une fenêtre de contexte de 131K tokens.

Question 4

Combien de VRAM faut-il pour Qwen 2.5 72B ?

Accepted Answer

Environ 44 GB en quantification Q4, ou 173 GB en pleine précision FP16. Tient sur un seul A100/H100 80GB.

Question 5

Puis-je exécuter Qwen 2.5 72B localement ?

Accepted Answer

Oui. Qwen 2.5 72B est en open-weights et s'exécute localement sur un GPU station de travail. Le runtime local d'osFoundry gère le chargement du modèle, la quantification et le routage.

Question 6

À quoi Qwen 2.5 72B excelle-t-il ?

Accepted Answer

Qwen 2.5 72B convient particulièrement bien à chat généraliste et questions-réponses, génération et revue de code, raisonnement mathématique.

Question 7

Comment utiliser Qwen 2.5 72B dans osFoundry ?

Accepted Answer

Collez votre clé API Alibaba dans la fenêtre de clés (ou déployez les open weights pour les modèles auto-hébergeables), assignez Qwen 2.5 72B à un rôle Maestro dans l'onglet Pipeline, puis utilisez-le en chat, dans les Room Apps via invokeAI, ou dans vos propres applications.