Name: Llama 3.3 Nemotron Super 49B V1.5
Author: NVIDIA

Question 1

Quanto custa Llama 3.3 Nemotron Super 49B V1.5?

Accepted Answer

Llama 3.3 Nemotron Super 49B V1.5 é cobrado a $ 0.100 /1M para entrada e $ 0.400 /1M para saída. Use sua própria chave de API da NVIDIA — o osFoundry repassa o preço do provedor sem markup.

Question 2

Posso usar Llama 3.3 Nemotron Super 49B V1.5 comercialmente?

Accepted Answer

Uso comercial é permitido com condições. Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor. Sem distribuição de pesos; uso sujeito aos termos do provedor.

Question 3

Qual é a janela de contexto de Llama 3.3 Nemotron Super 49B V1.5?

Accepted Answer

Llama 3.3 Nemotron Super 49B V1.5 suporta uma janela de contexto de 131K tokens.

Question 4

Posso rodar Llama 3.3 Nemotron Super 49B V1.5 localmente?

Accepted Answer

Não — Llama 3.3 Nemotron Super 49B V1.5 é somente hospedado e acessado via API da NVIDIA. Há um equivalente open-weights disponível para auto-hospedagem — veja o link cruzado acima.

Question 5

Em que Llama 3.3 Nemotron Super 49B V1.5 é melhor?

Accepted Answer

Llama 3.3 Nemotron Super 49B V1.5 é bem adequado para chat e roteamento de baixa latência, roteamento e triagem de requisições, classificação de texto.

Question 6

Como uso Llama 3.3 Nemotron Super 49B V1.5 no osFoundry?

Accepted Answer

Cole sua chave de API da NVIDIA no diálogo de chaves (ou implante os pesos abertos para modelos auto-hospedáveis), atribua Llama 3.3 Nemotron Super 49B V1.5 a um papel do Maestro na aba Pipeline e use-o em chats, em Room Apps via invokeAI ou nos seus próprios apps.