Llama 3.2 11B Vision Instruct
Llama 3.2 11B Vision Instruct est un modèle génération d'images de Meta, publié le 25 septembre 2024. Llama 3.2 11B Vision is a multimodal model with 11 billion parameters, designed to handle tasks combining visual and textual data. It excels in tasks such as image captioning and...
by Meta · fenêtre de contexte de 131K tokens
Idéal pour
- génération d'images à partir de texte
- design créatif et idéation
Comment utiliser Llama 3.2 11B Vision Instruct dans osFoundry
Connectez-vous avec votre propre clé (BYOK)
Ouvrez la fenêtre de clés et collez votre clé API Meta. osFoundry détecte automatiquement Llama 3.2 11B Vision Instruct — assignez-le à un rôle Maestro (router, direct, orchestrator ou fallback) dans l'onglet Pipeline et il est actif dans chaque conversation. Votre clé, votre compte fournisseur — sans majoration sur les tokens.
Utilisez-le dans une Room App
Les Room Apps déclarent leurs fonctionnalités IA dans leur manifeste, puis les appellent via invokeAI :
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Appelez-le depuis vos propres applications
Une fois un modèle intégré à votre espace de travail, vous pouvez l'héberger en tant qu'API et l'appeler depuis vos propres services, scripts ou CI — en dehors d'osFoundry.
Exécutez Llama 3.2 11B Vision Instruct vous-même
Llama 3.2 11B Vision Instruct est également disponible en open weights — hébergez-le vous-même pour un contrôle total des données et zéro coût au token. Consultez cette page pour les prérequis GPU et une comparaison des coûts avec la tarification API.
Llama 3.2 11B Vision Instruct face aux modèles similaires
| Modèle | Organisation | Paramètres | Contexte | Prix en entrée | Auto-hébergement |
|---|
| Llama 3.2 11B Vision Instruct | Meta | — | 131K | $ 0.245 /1M | API uniquement |
| Claude 3.5 Haiku | Anthropic | — | 200K | $ 0.800 /1M | API uniquement |
| GPT-4o (2024-08-06) | OpenAI | — | 128K | $ 2.50 /1M | API uniquement |
| Pixtral Large 2411 | Mistral | — | 131K | $ 2.00 /1M | API uniquement |
Licence
Hosted — usage subject to provider terms — Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur.
Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Questions fréquentes sur Llama 3.2 11B Vision Instruct
Combien coûte Llama 3.2 11B Vision Instruct ?
Llama 3.2 11B Vision Instruct est facturé à $ 0.245 /1M en entrée et $ 0.245 /1M en sortie. Apportez votre propre clé API Meta — osFoundry répercute la tarification du fournisseur sans majoration.
Puis-je utiliser Llama 3.2 11B Vision Instruct à des fins commerciales ?
L'usage commercial est autorisé sous conditions. Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur. Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Quelle est la fenêtre de contexte de Llama 3.2 11B Vision Instruct ?
Llama 3.2 11B Vision Instruct prend en charge une fenêtre de contexte de 131K tokens.
Puis-je exécuter Llama 3.2 11B Vision Instruct localement ?
Non — Llama 3.2 11B Vision Instruct est uniquement hébergé et accessible via l'API Meta. Un équivalent en open-weights est disponible en auto-hébergement — voir le lien croisé ci-dessus.
À quoi Llama 3.2 11B Vision Instruct excelle-t-il ?
Llama 3.2 11B Vision Instruct convient particulièrement bien à génération d'images à partir de texte, design créatif et idéation.
Comment utiliser Llama 3.2 11B Vision Instruct dans osFoundry ?
Collez votre clé API Meta dans la fenêtre de clés (ou déployez les open weights pour les modèles auto-hébergeables), assignez Llama 3.2 11B Vision Instruct à un rôle Maestro dans l'onglet Pipeline, puis utilisez-le en chat, dans les Room Apps via invokeAI, ou dans vos propres applications.
Publié par Meta le 25 septembre 2024. Source : https://openrouter.ai/meta-llama/llama-3.2-11b-vision-instruct