Llama 3.3 Nemotron Super 49B V1.5
Desenvolvido pela NVIDIA, Llama 3.3 Nemotron Super 49B V1.5 é um modelo de chat com janela de contexto de 131K tokens. Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...
by NVIDIA · janela de contexto de 131K tokens
Ideal para
- chat e roteamento de baixa latência
- roteamento e triagem de requisições
- classificação de texto
Como usar Llama 3.3 Nemotron Super 49B V1.5 no osFoundry
Conecte com sua própria chave (BYOK)
Abra o diálogo de chaves e cole sua chave de API da NVIDIA. O osFoundry descobre Llama 3.3 Nemotron Super 49B V1.5 automaticamente — atribua-o a um papel do Maestro (router, direct, orchestrator ou fallback) na aba Pipeline e ele estará ativo em cada chat. Sua chave, sua conta no provedor — sem markup sobre tokens.
Use em um Room App
Os Room Apps declaram recursos de IA em seus manifestos e os chamam com invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Chame a partir dos seus próprios apps
Uma vez que um modelo está conectado ao seu workspace, você pode hospedá-lo como uma API e acessá-lo a partir dos seus próprios serviços, scripts ou CI — fora do osFoundry.
Execute Llama 3.3 Nemotron Super 49B V1.5 por conta própria
Llama 3.3 Nemotron Super 49B V1.5 também está disponível como open weights — auto-hospede para controle total dos dados e sem custo por token. Veja essa página para requisitos de GPU e uma comparação de custos com o preço da API.
Llama 3.3 Nemotron Super 49B V1.5 vs modelos semelhantes
Licença
Hosted — usage subject to provider terms — Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor.
Sem distribuição de pesos; uso sujeito aos termos do provedor.
Perguntas frequentes sobre Llama 3.3 Nemotron Super 49B V1.5
Quanto custa Llama 3.3 Nemotron Super 49B V1.5?
Llama 3.3 Nemotron Super 49B V1.5 é cobrado a $ 0.100 /1M para entrada e $ 0.400 /1M para saída. Use sua própria chave de API da NVIDIA — o osFoundry repassa o preço do provedor sem markup.
Posso usar Llama 3.3 Nemotron Super 49B V1.5 comercialmente?
Uso comercial é permitido com condições. Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor. Sem distribuição de pesos; uso sujeito aos termos do provedor.
Qual é a janela de contexto de Llama 3.3 Nemotron Super 49B V1.5?
Llama 3.3 Nemotron Super 49B V1.5 suporta uma janela de contexto de 131K tokens.
Posso rodar Llama 3.3 Nemotron Super 49B V1.5 localmente?
Não — Llama 3.3 Nemotron Super 49B V1.5 é somente hospedado e acessado via API da NVIDIA. Há um equivalente open-weights disponível para auto-hospedagem — veja o link cruzado acima.
Em que Llama 3.3 Nemotron Super 49B V1.5 é melhor?
Llama 3.3 Nemotron Super 49B V1.5 é bem adequado para chat e roteamento de baixa latência, roteamento e triagem de requisições, classificação de texto.
Como uso Llama 3.3 Nemotron Super 49B V1.5 no osFoundry?
Cole sua chave de API da NVIDIA no diálogo de chaves (ou implante os pesos abertos para modelos auto-hospedáveis), atribua Llama 3.3 Nemotron Super 49B V1.5 a um papel do Maestro na aba Pipeline e use-o em chats, em Room Apps via invokeAI ou nos seus próprios apps.
Publicado pela NVIDIA em 10 de outubro de 2025. Fonte: https://openrouter.ai/nvidia/llama-3.3-nemotron-super-49b-v1.5