gpt-oss-120b
Lançado pela OpenAI em 2025, gpt-oss-120b é um modelo de chat. gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases. It activates 5.1B parameters per forward pass and is optimized...
by OpenAI · janela de contexto de 131K tokens
Ideal para
- chat e roteamento de baixa latência
- roteamento e triagem de requisições
- classificação de texto
Como usar gpt-oss-120b no osFoundry
Conecte com sua própria chave (BYOK)
Abra o diálogo de chaves e cole sua chave de API da OpenAI. O osFoundry descobre gpt-oss-120b automaticamente — atribua-o a um papel do Maestro (router, direct, orchestrator ou fallback) na aba Pipeline e ele estará ativo em cada chat. Sua chave, sua conta no provedor — sem markup sobre tokens.
Use em um Room App
Os Room Apps declaram recursos de IA em seus manifestos e os chamam com invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Chame a partir dos seus próprios apps
Uma vez que um modelo está conectado ao seu workspace, você pode hospedá-lo como uma API e acessá-lo a partir dos seus próprios serviços, scripts ou CI — fora do osFoundry.
Execute gpt-oss-120b por conta própria
gpt-oss-120b também está disponível como open weights — auto-hospede para controle total dos dados e sem custo por token. Veja essa página para requisitos de GPU e uma comparação de custos com o preço da API.
gpt-oss-120b vs modelos semelhantes
| Modelo | Organização | Parâmetros | Contexto | Preço de entrada | Auto-hospedado |
|---|
| gpt-oss-120b | OpenAI | — | 131K | $ 0.039 /1M | Apenas API |
| Jamba Large 1.7 | AI21 | — | 256K | $ 2.00 /1M | Apenas API |
| ERNIE 4.5 21B A3B | Baidu | — | 120K | $ 0.070 /1M | Apenas API |
| Codestral 2508 | Mistral | — | 256K | $ 0.300 /1M | Apenas API |
Licença
Hosted — usage subject to provider terms — Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor.
Sem distribuição de pesos; uso sujeito aos termos do provedor.
Perguntas frequentes sobre gpt-oss-120b
Quanto custa gpt-oss-120b?
gpt-oss-120b é cobrado a $ 0.039 /1M para entrada e $ 0.180 /1M para saída. Use sua própria chave de API da OpenAI — o osFoundry repassa o preço do provedor sem markup.
Posso usar gpt-oss-120b comercialmente?
Uso comercial é permitido com condições. Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor. Sem distribuição de pesos; uso sujeito aos termos do provedor.
Qual é a janela de contexto de gpt-oss-120b?
gpt-oss-120b suporta uma janela de contexto de 131K tokens.
Posso rodar gpt-oss-120b localmente?
Não — gpt-oss-120b é somente hospedado e acessado via API da OpenAI. Há um equivalente open-weights disponível para auto-hospedagem — veja o link cruzado acima.
Em que gpt-oss-120b é melhor?
gpt-oss-120b é bem adequado para chat e roteamento de baixa latência, roteamento e triagem de requisições, classificação de texto.
Como uso gpt-oss-120b no osFoundry?
Cole sua chave de API da OpenAI no diálogo de chaves (ou implante os pesos abertos para modelos auto-hospedáveis), atribua gpt-oss-120b a um papel do Maestro na aba Pipeline e use-o em chats, em Room Apps via invokeAI ou nos seus próprios apps.
Publicado pela OpenAI em 5 de agosto de 2025. Fonte: https://openrouter.ai/openai/gpt-oss-120b