Llama 3.3 Nemotron Super 49B V1.5
Созданная NVIDIA, Llama 3.3 Nemotron Super 49B V1.5 — это чат модель с контекстным окном 131K токенов. Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...
by NVIDIA · контекстное окно 131K токенов
Лучше всего подходит для
- чат и маршрутизация с низкой задержкой
- маршрутизация и сортировка запросов
- классификация текста
Способы использования Llama 3.3 Nemotron Super 49B V1.5 в osFoundry
Подключите со своим ключом (BYOK)
Откройте диалог ключей и вставьте ваш API-ключ NVIDIA. osFoundry автоматически обнаружит Llama 3.3 Nemotron Super 49B V1.5 — назначьте её на роль Maestro (router, direct, orchestrator или fallback) во вкладке Pipeline, и она будет доступна в каждом чате. Ваш ключ, ваш аккаунт у провайдера — без наценки на токены.
Используйте в Room App
Room App объявляют функции ИИ в своём манифесте, а затем вызывают их через invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Вызывайте из своих приложений
После подключения модели к вашему рабочему пространству вы можете разместить её как API и обращаться к ней из своих сервисов, скриптов или CI — за пределами osFoundry.
Запустите Llama 3.3 Nemotron Super 49B V1.5 самостоятельно
Llama 3.3 Nemotron Super 49B V1.5 также доступна в виде открытых весов — разверните самостоятельно для полного контроля над данными и без оплаты за токены. На этой странице описаны требования к GPU и сравнение стоимости с ценами API.
Llama 3.3 Nemotron Super 49B V1.5 в сравнении с похожими моделями
Лицензия
Hosted — usage subject to provider terms — Модель доступна только в хостинговом варианте — использование регулируется условиями API провайдера. Используйте собственный ключ провайдера.
Веса не распространяются; использование регулируется условиями провайдера.
Частые вопросы о Llama 3.3 Nemotron Super 49B V1.5
Сколько стоит Llama 3.3 Nemotron Super 49B V1.5?
Llama 3.3 Nemotron Super 49B V1.5 тарифицируется по ставке $ 0.100 /1M за ввод и $ 0.400 /1M за вывод. Используйте свой API-ключ NVIDIA — osFoundry передаёт цены провайдера без наценки.
Можно ли использовать Llama 3.3 Nemotron Super 49B V1.5 в коммерческих целях?
Коммерческое использование разрешено с условиями. Модель доступна только в хостинговом варианте — использование регулируется условиями API провайдера. Используйте собственный ключ провайдера. Веса не распространяются; использование регулируется условиями провайдера.
Каково контекстное окно у Llama 3.3 Nemotron Super 49B V1.5?
Llama 3.3 Nemotron Super 49B V1.5 поддерживает контекстное окно в 131K токенов.
Можно ли запустить Llama 3.3 Nemotron Super 49B V1.5 локально?
Нет — Llama 3.3 Nemotron Super 49B V1.5 доступна только в хостинговом варианте через API NVIDIA. Доступен аналог с открытыми весами для самостоятельного хостинга — см. перекрёстную ссылку выше.
В чём Llama 3.3 Nemotron Super 49B V1.5 лучше всего?
Llama 3.3 Nemotron Super 49B V1.5 хорошо подходит для чат и маршрутизация с низкой задержкой, маршрутизация и сортировка запросов, классификация текста.
Как использовать Llama 3.3 Nemotron Super 49B V1.5 в osFoundry?
Вставьте свой API-ключ NVIDIA в диалог ключей (или разверните открытые веса для моделей с возможностью самостоятельного хостинга), назначьте Llama 3.3 Nemotron Super 49B V1.5 на роль Maestro во вкладке Pipeline, а затем используйте её в чате, в Room App через invokeAI или в собственных приложениях.
Опубликовано NVIDIA 10 октября 2025 г.. Источник: https://openrouter.ai/nvidia/llama-3.3-nemotron-super-49b-v1.5