Llama 3.3 Nemotron Super 49B V1.5
Entwickelt von NVIDIA, ist Llama 3.3 Nemotron Super 49B V1.5 ein Chat-Modell mit einem Kontextfenster von 131K Token. Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...
by NVIDIA · Kontextfenster von 131K Token
Am besten geeignet für
- Chat und Routing mit geringer Latenz
- Anfrage-Routing und Triage
- Textklassifikation
Möglichkeiten, Llama 3.3 Nemotron Super 49B V1.5 in osFoundry zu nutzen
Mit eigenem Schlüssel verbinden (BYOK)
Öffnen Sie den Schlüssel-Dialog und fügen Sie Ihren NVIDIA-API-Key ein. osFoundry erkennt Llama 3.3 Nemotron Super 49B V1.5 automatisch — weisen Sie es im Pipeline-Tab einer Maestro-Rolle (Router, Direct, Orchestrator oder Fallback) zu, und es ist in jedem Chat verfügbar. Ihr Key, Ihr Provider-Konto — kein Token-Aufschlag.
In einer Room App verwenden
Room Apps deklarieren KI-Funktionen in ihrem Manifest und rufen sie anschließend mit invokeAI auf:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Aus eigenen Anwendungen aufrufen
Sobald ein Modell in Ihrem Workspace eingerichtet ist, können Sie es als API hosten und aus Ihren eigenen Diensten, Skripten oder CI — außerhalb von osFoundry — erreichen.
Llama 3.3 Nemotron Super 49B V1.5 selbst betreiben
Llama 3.3 Nemotron Super 49B V1.5 ist auch als Open Weights verfügbar — selbst hosten für volle Datenkontrolle und ohne Kosten pro Token. Auf jener Seite finden Sie GPU-Anforderungen und einen Kostenvergleich mit API-Preisen.
Llama 3.3 Nemotron Super 49B V1.5 im Vergleich zu ähnlichen Modellen
Lizenz
Hosted — usage subject to provider terms — Nur gehostetes Modell — die Nutzung unterliegt den API-Bedingungen des Anbieters. Bringen Sie Ihren eigenen Provider-Key mit.
Keine Weights verteilt; Nutzung unterliegt den Anbieterbedingungen.
Häufige Fragen zu Llama 3.3 Nemotron Super 49B V1.5
Wie viel kostet Llama 3.3 Nemotron Super 49B V1.5?
Llama 3.3 Nemotron Super 49B V1.5 wird mit $ 0.100 /1M für Input und $ 0.400 /1M für Output abgerechnet. Bringen Sie Ihren eigenen NVIDIA-API-Key mit — osFoundry reicht die Provider-Preise ohne Aufschlag durch.
Kann ich Llama 3.3 Nemotron Super 49B V1.5 kommerziell nutzen?
Kommerzielle Nutzung ist unter bestimmten Bedingungen erlaubt. Nur gehostetes Modell — die Nutzung unterliegt den API-Bedingungen des Anbieters. Bringen Sie Ihren eigenen Provider-Key mit. Keine Weights verteilt; Nutzung unterliegt den Anbieterbedingungen.
Wie groß ist das Kontextfenster von Llama 3.3 Nemotron Super 49B V1.5?
Llama 3.3 Nemotron Super 49B V1.5 unterstützt ein Kontextfenster von 131K Token.
Kann ich Llama 3.3 Nemotron Super 49B V1.5 lokal betreiben?
Nein — Llama 3.3 Nemotron Super 49B V1.5 ist nur gehostet verfügbar und wird über die NVIDIA-API genutzt. Ein Open-Weights-Äquivalent steht zum Selbsthosten zur Verfügung — siehe den Querverweis oben.
Worin ist Llama 3.3 Nemotron Super 49B V1.5 besonders gut?
Llama 3.3 Nemotron Super 49B V1.5 eignet sich besonders für Chat und Routing mit geringer Latenz, Anfrage-Routing und Triage, Textklassifikation.
Wie verwende ich Llama 3.3 Nemotron Super 49B V1.5 in osFoundry?
Fügen Sie Ihren NVIDIA-API-Key im Schlüssel-Dialog ein (oder stellen Sie bei selbst hostbaren Modellen die Open Weights bereit), weisen Sie Llama 3.3 Nemotron Super 49B V1.5 im Pipeline-Tab einer Maestro-Rolle zu und nutzen Sie es anschließend im Chat, in Room Apps über invokeAI oder in Ihren eigenen Anwendungen.
Veröffentlicht von NVIDIA am 10. Oktober 2025. Quelle: https://openrouter.ai/nvidia/llama-3.3-nemotron-super-49b-v1.5