Nemotron 3 Super
Entwickelt von NVIDIA, ist Nemotron 3 Super ein Chat-Modell mit einem Kontextfenster von 262K Token. NVIDIA Nemotron 3 Super is a 120B-parameter open hybrid MoE model, activating just 12B parameters for maximum compute efficiency and accuracy in complex multi-agent applications. Built on a hybrid Mamba-Transformer...
by NVIDIA · Kontextfenster von 262K Token
Am besten geeignet für
- Chat und Routing mit geringer Latenz
- Anfrage-Routing und Triage
- Textklassifikation
Möglichkeiten, Nemotron 3 Super in osFoundry zu nutzen
Mit eigenem Schlüssel verbinden (BYOK)
Öffnen Sie den Schlüssel-Dialog und fügen Sie Ihren NVIDIA-API-Key ein. osFoundry erkennt Nemotron 3 Super automatisch — weisen Sie es im Pipeline-Tab einer Maestro-Rolle (Router, Direct, Orchestrator oder Fallback) zu, und es ist in jedem Chat verfügbar. Ihr Key, Ihr Provider-Konto — kein Token-Aufschlag.
In einer Room App verwenden
Room Apps deklarieren KI-Funktionen in ihrem Manifest und rufen sie anschließend mit invokeAI auf:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Aus eigenen Anwendungen aufrufen
Sobald ein Modell in Ihrem Workspace eingerichtet ist, können Sie es als API hosten und aus Ihren eigenen Diensten, Skripten oder CI — außerhalb von osFoundry — erreichen.
Nemotron 3 Super selbst betreiben
Nemotron 3 Super ist auch als Open Weights verfügbar — selbst hosten für volle Datenkontrolle und ohne Kosten pro Token. Auf jener Seite finden Sie GPU-Anforderungen und einen Kostenvergleich mit API-Preisen.
Nemotron 3 Super im Vergleich zu ähnlichen Modellen
| Modell | Organisation | Parameter | Kontext | Input-Preis | Selbst hosten |
|---|
| Nemotron 3 Super | NVIDIA | — | 262K | $ 0.090 /1M | Nur API |
| Mercury 2 | Inception | — | 128K | $ 0.250 /1M | Nur API |
| GLM 5 Turbo | Z.ai | — | 203K | $ 1.20 /1M | Nur API |
| LFM2-24B-A2B | LiquidAI | — | 33K | $ 0.030 /1M | Nur API |
Lizenz
Hosted — usage subject to provider terms — Nur gehostetes Modell — die Nutzung unterliegt den API-Bedingungen des Anbieters. Bringen Sie Ihren eigenen Provider-Key mit.
Keine Weights verteilt; Nutzung unterliegt den Anbieterbedingungen.
Häufige Fragen zu Nemotron 3 Super
Wie viel kostet Nemotron 3 Super?
Nemotron 3 Super wird mit $ 0.090 /1M für Input und $ 0.450 /1M für Output abgerechnet. Bringen Sie Ihren eigenen NVIDIA-API-Key mit — osFoundry reicht die Provider-Preise ohne Aufschlag durch.
Kann ich Nemotron 3 Super kommerziell nutzen?
Kommerzielle Nutzung ist unter bestimmten Bedingungen erlaubt. Nur gehostetes Modell — die Nutzung unterliegt den API-Bedingungen des Anbieters. Bringen Sie Ihren eigenen Provider-Key mit. Keine Weights verteilt; Nutzung unterliegt den Anbieterbedingungen.
Wie groß ist das Kontextfenster von Nemotron 3 Super?
Nemotron 3 Super unterstützt ein Kontextfenster von 262K Token.
Kann ich Nemotron 3 Super lokal betreiben?
Nein — Nemotron 3 Super ist nur gehostet verfügbar und wird über die NVIDIA-API genutzt. Ein Open-Weights-Äquivalent steht zum Selbsthosten zur Verfügung — siehe den Querverweis oben.
Worin ist Nemotron 3 Super besonders gut?
Nemotron 3 Super eignet sich besonders für Chat und Routing mit geringer Latenz, Anfrage-Routing und Triage, Textklassifikation.
Wie verwende ich Nemotron 3 Super in osFoundry?
Fügen Sie Ihren NVIDIA-API-Key im Schlüssel-Dialog ein (oder stellen Sie bei selbst hostbaren Modellen die Open Weights bereit), weisen Sie Nemotron 3 Super im Pipeline-Tab einer Maestro-Rolle zu und nutzen Sie es anschließend im Chat, in Room Apps über invokeAI oder in Ihren eigenen Anwendungen.
Veröffentlicht von NVIDIA am 11. März 2026. Quelle: https://openrouter.ai/nvidia/nemotron-3-super-120b-a12b