Name: Llama 3.3 70B
Author: Meta

Question 1

Llama 3.3 70B est-il gratuit à utiliser ?

Accepted Answer

Llama 3.3 70B est gratuit à exécuter localement sur votre propre matériel. L'accès hébergé via osFoundry est facturé à l'usage (entrée Free (local) / $ 0.59 /1M, sortie Free (local) / $ 0.79 /1M). Vous pouvez basculer entre local et hébergé à tout moment.

Question 2

Puis-je utiliser Llama 3.3 70B à des fins commerciales ?

Accepted Answer

L'usage commercial est autorisé sous conditions. Autorise l'usage commercial jusqu'à 700 millions d'utilisateurs actifs mensuels ; les déploiements plus larges nécessitent une licence séparée. Attribution « Built with Llama » requise.

Question 3

Quelle est la fenêtre de contexte de Llama 3.3 70B ?

Accepted Answer

Llama 3.3 70B prend en charge une fenêtre de contexte de 128K tokens.

Question 4

Combien de VRAM faut-il pour Llama 3.3 70B ?

Accepted Answer

Environ 42 GB en quantification Q4, ou 168 GB en pleine précision FP16. Tient sur un seul A100/H100 80GB.

Question 5

Puis-je exécuter Llama 3.3 70B localement ?

Accepted Answer

Oui. Llama 3.3 70B est en open-weights et s'exécute localement sur un GPU station de travail. Le runtime local d'osFoundry gère le chargement du modèle, la quantification et le routage.

Question 6

À quoi Llama 3.3 70B excelle-t-il ?

Accepted Answer

Llama 3.3 70B convient particulièrement bien à chat généraliste et questions-réponses, orchestration d'agents avec utilisation d'outils, analyse et synthèse de documents longs.

Question 7

Comment utiliser Llama 3.3 70B dans osFoundry ?

Accepted Answer

Collez votre clé API Meta dans la fenêtre de clés (ou déployez les open weights pour les modèles auto-hébergeables), assignez Llama 3.3 70B à un rôle Maestro dans l'onglet Pipeline, puis utilisez-le en chat, dans les Room Apps via invokeAI, ou dans vos propres applications.