Llama 3.3 Nemotron Super 49B V1.5
Desarrollado por NVIDIA, Llama 3.3 Nemotron Super 49B V1.5 es un modelo de chat con una ventana de contexto de 131K tokens. Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...
by NVIDIA · ventana de contexto de 131K tokens
Ideal para
- chat y enrutamiento de baja latencia
- enrutamiento y triaje de solicitudes
- clasificación de texto
Formas de utilizar Llama 3.3 Nemotron Super 49B V1.5 en osFoundry
Conecten con su propia clave (BYOK)
Abran el diálogo de claves y peguen su clave de API de NVIDIA. osFoundry detecta Llama 3.3 Nemotron Super 49B V1.5 automáticamente: asígnenlo a un rol de Maestro (router, direct, orchestrator o fallback) en la pestaña Pipeline y quedará activo en cada chat. Su clave, su cuenta de proveedor: sin recargo por tokens.
Úsenlo en una Room App
Las Room Apps declaran funciones de IA en su manifiesto y luego las invocan con invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Invóquenlo desde sus propias aplicaciones
Una vez que un modelo está integrado en su workspace, pueden alojarlo como API y consumirlo desde sus propios servicios, scripts o CI, fuera de osFoundry.
Ejecuten Llama 3.3 Nemotron Super 49B V1.5 ustedes mismos
Llama 3.3 Nemotron Super 49B V1.5 también está disponible como pesos abiertos: aloja tú mismo el modelo para tener control total de los datos y sin coste por token. Consulten esa página para conocer los requisitos de GPU y una comparativa de costes frente al precio de la API.
Llama 3.3 Nemotron Super 49B V1.5 frente a modelos similares
Licencia
Hosted — usage subject to provider terms — Modelo solo alojado: el uso se rige por los términos de API del proveedor. Aporten su propia clave del proveedor.
No se distribuyen los pesos; el uso está sujeto a los términos del proveedor.
Preguntas frecuentes sobre Llama 3.3 Nemotron Super 49B V1.5
¿Cuánto cuesta Llama 3.3 Nemotron Super 49B V1.5?
Llama 3.3 Nemotron Super 49B V1.5 se factura a $ 0.100 /1M por entrada y $ 0.400 /1M por salida. Aporten su propia clave de API de NVIDIA: osFoundry traslada el precio del proveedor sin recargo.
¿Puedo utilizar Llama 3.3 Nemotron Super 49B V1.5 comercialmente?
El uso comercial está permitido con condiciones. Modelo solo alojado: el uso se rige por los términos de API del proveedor. Aporten su propia clave del proveedor. No se distribuyen los pesos; el uso está sujeto a los términos del proveedor.
¿Cuál es la ventana de contexto de Llama 3.3 Nemotron Super 49B V1.5?
Llama 3.3 Nemotron Super 49B V1.5 admite una ventana de contexto de 131K tokens.
¿Puedo ejecutar Llama 3.3 Nemotron Super 49B V1.5 localmente?
No: Llama 3.3 Nemotron Super 49B V1.5 es solo alojado y se accede a través de la API de NVIDIA. Existe un equivalente de pesos abiertos para autoalojar: consulten el enlace cruzado de arriba.
¿En qué destaca Llama 3.3 Nemotron Super 49B V1.5?
Llama 3.3 Nemotron Super 49B V1.5 es muy adecuado para chat y enrutamiento de baja latencia, enrutamiento y triaje de solicitudes, clasificación de texto.
¿Cómo se utiliza Llama 3.3 Nemotron Super 49B V1.5 en osFoundry?
Peguen su clave de API de NVIDIA en el diálogo de claves (o desplieguen los pesos abiertos para modelos autoalojables), asignen Llama 3.3 Nemotron Super 49B V1.5 a un rol de Maestro en la pestaña Pipeline y úsenlo en chat, en Room Apps mediante invokeAI o en sus propias aplicaciones.
Publicado por NVIDIA el 10 de octubre de 2025. Fuente: https://openrouter.ai/nvidia/llama-3.3-nemotron-super-49b-v1.5