GPT Audio
Lançado pela OpenAI em 2026, GPT Audio é um modelo de fala e áudio. The gpt-audio model is OpenAI's first generally available audio model. The new snapshot features an upgraded decoder for more natural sounding voices and maintains better voice consistency. Audio is priced...
by OpenAI · janela de contexto de 128K tokens
Ideal para
- transcrição de fala para texto
- transcrição de reuniões e áudio
Como usar GPT Audio no osFoundry
Conecte com sua própria chave (BYOK)
Abra o diálogo de chaves e cole sua chave de API da OpenAI. O osFoundry descobre GPT Audio automaticamente — atribua-o a um papel do Maestro (router, direct, orchestrator ou fallback) na aba Pipeline e ele estará ativo em cada chat. Sua chave, sua conta no provedor — sem markup sobre tokens.
Use em um Room App
Os Room Apps declaram recursos de IA em seus manifestos e os chamam com invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Chame a partir dos seus próprios apps
Uma vez que um modelo está conectado ao seu workspace, você pode hospedá-lo como uma API e acessá-lo a partir dos seus próprios serviços, scripts ou CI — fora do osFoundry.
GPT Audio vs modelos semelhantes
| Modelo | Organização | Parâmetros | Contexto | Preço de entrada | Auto-hospedado |
|---|
| GPT Audio | OpenAI | — | 128K | $ 2.50 /1M | Apenas API |
| Voxtral Small 24B 2507 | Mistral | — | 32K | $ 0.100 /1M | Apenas API |
| GPT Audio Mini | OpenAI | — | 128K | $ 0.600 /1M | Apenas API |
| GPT-4o Audio | OpenAI | — | 128K | $ 2.50 /1M | Apenas API |
Licença
Hosted — usage subject to provider terms — Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor.
Sem distribuição de pesos; uso sujeito aos termos do provedor.
Perguntas frequentes sobre GPT Audio
Quanto custa GPT Audio?
GPT Audio é cobrado a $ 2.50 /1M para entrada e $ 10.00 /1M para saída. Use sua própria chave de API da OpenAI — o osFoundry repassa o preço do provedor sem markup.
Posso usar GPT Audio comercialmente?
Uso comercial é permitido com condições. Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor. Sem distribuição de pesos; uso sujeito aos termos do provedor.
Qual é a janela de contexto de GPT Audio?
GPT Audio suporta uma janela de contexto de 128K tokens.
Posso rodar GPT Audio localmente?
Não — GPT Audio é somente hospedado e acessado via API da OpenAI.
Em que GPT Audio é melhor?
GPT Audio é bem adequado para transcrição de fala para texto, transcrição de reuniões e áudio.
Como uso GPT Audio no osFoundry?
Cole sua chave de API da OpenAI no diálogo de chaves (ou implante os pesos abertos para modelos auto-hospedáveis), atribua GPT Audio a um papel do Maestro na aba Pipeline e use-o em chats, em Room Apps via invokeAI ou nos seus próprios apps.
Publicado pela OpenAI em 19 de janeiro de 2026. Fonte: https://openrouter.ai/openai/gpt-audio