Llama 3.2 3B Instruct
Llama 3.2 3B Instruct est un modèle chat de Meta, publié le 25 septembre 2024. Llama 3.2 3B is a 3-billion-parameter multilingual large language model, optimized for advanced natural language processing tasks like dialogue generation, reasoning, and summarization. Designed with the latest transformer architecture, it...
by Meta · fenêtre de contexte de 80K tokens
Idéal pour
- chat et routage à faible latence
- routage et triage des requêtes
- classification de texte
Comment utiliser Llama 3.2 3B Instruct dans osFoundry
Connectez-vous avec votre propre clé (BYOK)
Ouvrez la fenêtre de clés et collez votre clé API Meta. osFoundry détecte automatiquement Llama 3.2 3B Instruct — assignez-le à un rôle Maestro (router, direct, orchestrator ou fallback) dans l'onglet Pipeline et il est actif dans chaque conversation. Votre clé, votre compte fournisseur — sans majoration sur les tokens.
Utilisez-le dans une Room App
Les Room Apps déclarent leurs fonctionnalités IA dans leur manifeste, puis les appellent via invokeAI :
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Appelez-le depuis vos propres applications
Une fois un modèle intégré à votre espace de travail, vous pouvez l'héberger en tant qu'API et l'appeler depuis vos propres services, scripts ou CI — en dehors d'osFoundry.
Exécutez Llama 3.2 3B Instruct vous-même
Llama 3.2 3B Instruct est également disponible en open weights — hébergez-le vous-même pour un contrôle total des données et zéro coût au token. Consultez cette page pour les prérequis GPU et une comparaison des coûts avec la tarification API.
Llama 3.2 3B Instruct face aux modèles similaires
| Modèle | Organisation | Paramètres | Contexte | Prix en entrée | Auto-hébergement |
|---|
| Llama 3.2 3B Instruct | Meta | — | 80K | $ 0.051 /1M | API uniquement |
| Qwen2.5 72B Instruct | qwen | — | 33K | $ 0.360 /1M | API uniquement |
| Command R+ (08-2024) | Cohere | — | 128K | $ 2.50 /1M | API uniquement |
| Rocinante 12B | TheDrummer | — | 33K | $ 0.170 /1M | API uniquement |
Licence
Hosted — usage subject to provider terms — Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur.
Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Questions fréquentes sur Llama 3.2 3B Instruct
Combien coûte Llama 3.2 3B Instruct ?
Llama 3.2 3B Instruct est facturé à $ 0.051 /1M en entrée et $ 0.340 /1M en sortie. Apportez votre propre clé API Meta — osFoundry répercute la tarification du fournisseur sans majoration.
Puis-je utiliser Llama 3.2 3B Instruct à des fins commerciales ?
L'usage commercial est autorisé sous conditions. Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur. Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Quelle est la fenêtre de contexte de Llama 3.2 3B Instruct ?
Llama 3.2 3B Instruct prend en charge une fenêtre de contexte de 80K tokens.
Puis-je exécuter Llama 3.2 3B Instruct localement ?
Non — Llama 3.2 3B Instruct est uniquement hébergé et accessible via l'API Meta. Un équivalent en open-weights est disponible en auto-hébergement — voir le lien croisé ci-dessus.
À quoi Llama 3.2 3B Instruct excelle-t-il ?
Llama 3.2 3B Instruct convient particulièrement bien à chat et routage à faible latence, routage et triage des requêtes, classification de texte.
Comment utiliser Llama 3.2 3B Instruct dans osFoundry ?
Collez votre clé API Meta dans la fenêtre de clés (ou déployez les open weights pour les modèles auto-hébergeables), assignez Llama 3.2 3B Instruct à un rôle Maestro dans l'onglet Pipeline, puis utilisez-le en chat, dans les Room Apps via invokeAI, ou dans vos propres applications.
Publié par Meta le 25 septembre 2024. Source : https://openrouter.ai/meta-llama/llama-3.2-3b-instruct