GPT Audio
Rilasciato da OpenAI nel 2026, GPT Audio è un modello voce e audio. The gpt-audio model is OpenAI's first generally available audio model. The new snapshot features an upgraded decoder for more natural sounding voices and maintains better voice consistency. Audio is priced...
by OpenAI · finestra di contesto da 128K token
Ideale per
- trascrizione speech-to-text
- trascrizione di riunioni e audio
Modi per utilizzare GPT Audio in osFoundry
Si colleghi con la sua chiave (BYOK)
Apra la finestra delle chiavi e incolli la sua API key OpenAI. osFoundry scopre GPT Audio automaticamente — lo assegni a un ruolo Maestro (router, direct, orchestrator o fallback) nella scheda Pipeline e sarà attivo in ogni chat. La sua chiave, il suo account provider — nessun ricarico sui token.
Lo utilizzi in una Room App
Le Room App dichiarano le funzionalità AI nel loro manifest e le richiamano con invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Lo richiami dalle sue applicazioni
Una volta integrato un modello nel suo workspace, può esporlo come API e raggiungerlo dai suoi servizi, script o pipeline CI — al di fuori di osFoundry.
GPT Audio a confronto con modelli simili
Licenza
Hosted — usage subject to provider terms — Modello solo in hosting — l'uso è regolato dai termini API del provider. Porti la sua chiave del provider.
Nessun peso distribuito; uso soggetto ai termini del provider.
Domande frequenti su GPT Audio
Quanto costa GPT Audio?
GPT Audio è tariffato a $ 2.50 /1M per l'input e $ 10.00 /1M per l'output. Porti la sua API key OpenAI — osFoundry applica i prezzi del provider senza ricarico.
Posso usare GPT Audio a scopo commerciale?
L'uso commerciale è consentito a determinate condizioni. Modello solo in hosting — l'uso è regolato dai termini API del provider. Porti la sua chiave del provider. Nessun peso distribuito; uso soggetto ai termini del provider.
Qual è la finestra di contesto di GPT Audio?
GPT Audio supporta una finestra di contesto da 128K token.
Posso eseguire GPT Audio localmente?
No — GPT Audio è disponibile solo in hosting e si accede tramite l'API di OpenAI.
In che cosa eccelle GPT Audio?
GPT Audio è particolarmente adatto a trascrizione speech-to-text, trascrizione di riunioni e audio.
Come utilizzo GPT Audio in osFoundry?
Incolli la sua API key OpenAI nella finestra delle chiavi (oppure distribuisca i pesi aperti per i modelli auto-ospitabili), assegni GPT Audio a un ruolo Maestro nella scheda Pipeline, quindi lo utilizzi in chat, nelle Room App tramite invokeAI o nelle sue applicazioni.
Pubblicato da OpenAI il 19 gennaio 2026. Fonte: https://openrouter.ai/openai/gpt-audio