Llama 3.3 Nemotron Super 49B V1.5
Dibangun oleh NVIDIA, Llama 3.3 Nemotron Super 49B V1.5 adalah sebuah model chat dengan context window 131K token. Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...
by NVIDIA · context window 131K token
Paling cocok untuk
- chat dan routing latensi rendah
- routing dan triase permintaan
- klasifikasi teks
Cara menggunakan Llama 3.3 Nemotron Super 49B V1.5 di osFoundry
Hubungkan dengan key Anda sendiri (BYOK)
Buka dialog key dan tempelkan API key NVIDIA Anda. osFoundry menemukan Llama 3.3 Nemotron Super 49B V1.5 secara otomatis — tetapkan ke peran Maestro (router, direct, orchestrator, atau fallback) di tab Pipeline dan model ini langsung aktif di setiap chat. Key Anda, akun provider Anda — tanpa markup token.
Gunakan di Room App
Room App mendeklarasikan fitur AI di manifest mereka, lalu memanggilnya dengan invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Panggil dari aplikasi Anda sendiri
Setelah sebuah model terhubung ke workspace Anda, Anda dapat meng-host-nya sebagai API dan mengaksesnya dari layanan, skrip, atau CI Anda sendiri — di luar osFoundry.
Jalankan Llama 3.3 Nemotron Super 49B V1.5 sendiri
Llama 3.3 Nemotron Super 49B V1.5 juga tersedia sebagai open weights — self-host model ini untuk kontrol data penuh dan tanpa biaya per token. Lihat halaman tersebut untuk persyaratan GPU dan perbandingan biaya terhadap harga API.
Llama 3.3 Nemotron Super 49B V1.5 vs model serupa
Lisensi
Hosted — usage subject to provider terms — Model ter-host saja — penggunaan diatur oleh ketentuan API provider. Bawa key provider Anda sendiri.
Tidak ada weights yang didistribusikan; penggunaan tunduk pada ketentuan provider.
Pertanyaan umum tentang Llama 3.3 Nemotron Super 49B V1.5
Berapa biaya Llama 3.3 Nemotron Super 49B V1.5?
Llama 3.3 Nemotron Super 49B V1.5 dikenakan biaya $ 0.100 /1M untuk input, dan $ 0.400 /1M untuk output. Bawa API key NVIDIA Anda sendiri — osFoundry meneruskan harga provider tanpa markup.
Bisakah saya menggunakan Llama 3.3 Nemotron Super 49B V1.5 secara komersial?
Penggunaan komersial diizinkan dengan syarat. Model ter-host saja — penggunaan diatur oleh ketentuan API provider. Bawa key provider Anda sendiri. Tidak ada weights yang didistribusikan; penggunaan tunduk pada ketentuan provider.
Berapa context window dari Llama 3.3 Nemotron Super 49B V1.5?
Llama 3.3 Nemotron Super 49B V1.5 mendukung context window 131K token.
Bisakah saya menjalankan Llama 3.3 Nemotron Super 49B V1.5 secara lokal?
Tidak — Llama 3.3 Nemotron Super 49B V1.5 hanya ter-host dan diakses melalui API NVIDIA. Padanan open-weights tersedia untuk self-host — lihat tautan silang di atas.
Apa keunggulan utama Llama 3.3 Nemotron Super 49B V1.5?
Llama 3.3 Nemotron Super 49B V1.5 sangat cocok untuk chat dan routing latensi rendah, routing dan triase permintaan, klasifikasi teks.
Bagaimana cara menggunakan Llama 3.3 Nemotron Super 49B V1.5 di osFoundry?
Tempelkan API key NVIDIA Anda di dialog key (atau deploy open weights untuk model yang dapat di-self-host), tetapkan Llama 3.3 Nemotron Super 49B V1.5 ke peran Maestro di tab Pipeline, lalu gunakan di chat, di Room App via invokeAI, atau di aplikasi Anda sendiri.
Diterbitkan oleh NVIDIA pada 10 Oktober 2025. Sumber: https://openrouter.ai/nvidia/llama-3.3-nemotron-super-49b-v1.5