Llama 3.3 Nemotron Super 49B V1.5
Conçu par NVIDIA, Llama 3.3 Nemotron Super 49B V1.5 est un modèle chat avec une fenêtre de contexte de 131K tokens. Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...
by NVIDIA · fenêtre de contexte de 131K tokens
Idéal pour
- chat et routage à faible latence
- routage et triage des requêtes
- classification de texte
Comment utiliser Llama 3.3 Nemotron Super 49B V1.5 dans osFoundry
Connectez-vous avec votre propre clé (BYOK)
Ouvrez la fenêtre de clés et collez votre clé API NVIDIA. osFoundry détecte automatiquement Llama 3.3 Nemotron Super 49B V1.5 — assignez-le à un rôle Maestro (router, direct, orchestrator ou fallback) dans l'onglet Pipeline et il est actif dans chaque conversation. Votre clé, votre compte fournisseur — sans majoration sur les tokens.
Utilisez-le dans une Room App
Les Room Apps déclarent leurs fonctionnalités IA dans leur manifeste, puis les appellent via invokeAI :
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Appelez-le depuis vos propres applications
Une fois un modèle intégré à votre espace de travail, vous pouvez l'héberger en tant qu'API et l'appeler depuis vos propres services, scripts ou CI — en dehors d'osFoundry.
Exécutez Llama 3.3 Nemotron Super 49B V1.5 vous-même
Llama 3.3 Nemotron Super 49B V1.5 est également disponible en open weights — hébergez-le vous-même pour un contrôle total des données et zéro coût au token. Consultez cette page pour les prérequis GPU et une comparaison des coûts avec la tarification API.
Llama 3.3 Nemotron Super 49B V1.5 face aux modèles similaires
Licence
Hosted — usage subject to provider terms — Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur.
Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Questions fréquentes sur Llama 3.3 Nemotron Super 49B V1.5
Combien coûte Llama 3.3 Nemotron Super 49B V1.5 ?
Llama 3.3 Nemotron Super 49B V1.5 est facturé à $ 0.100 /1M en entrée et $ 0.400 /1M en sortie. Apportez votre propre clé API NVIDIA — osFoundry répercute la tarification du fournisseur sans majoration.
Puis-je utiliser Llama 3.3 Nemotron Super 49B V1.5 à des fins commerciales ?
L'usage commercial est autorisé sous conditions. Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur. Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Quelle est la fenêtre de contexte de Llama 3.3 Nemotron Super 49B V1.5 ?
Llama 3.3 Nemotron Super 49B V1.5 prend en charge une fenêtre de contexte de 131K tokens.
Puis-je exécuter Llama 3.3 Nemotron Super 49B V1.5 localement ?
Non — Llama 3.3 Nemotron Super 49B V1.5 est uniquement hébergé et accessible via l'API NVIDIA. Un équivalent en open-weights est disponible en auto-hébergement — voir le lien croisé ci-dessus.
À quoi Llama 3.3 Nemotron Super 49B V1.5 excelle-t-il ?
Llama 3.3 Nemotron Super 49B V1.5 convient particulièrement bien à chat et routage à faible latence, routage et triage des requêtes, classification de texte.
Comment utiliser Llama 3.3 Nemotron Super 49B V1.5 dans osFoundry ?
Collez votre clé API NVIDIA dans la fenêtre de clés (ou déployez les open weights pour les modèles auto-hébergeables), assignez Llama 3.3 Nemotron Super 49B V1.5 à un rôle Maestro dans l'onglet Pipeline, puis utilisez-le en chat, dans les Room Apps via invokeAI, ou dans vos propres applications.
Publié par NVIDIA le 10 octobre 2025. Source : https://openrouter.ai/nvidia/llama-3.3-nemotron-super-49b-v1.5