GPT-4o Audio
GPT-4o Audio di OpenAI è un modello voce e audio. The gpt-4o-audio-preview model adds support for audio inputs as prompts. This enhancement allows the model to detect nuances within audio recordings and add depth to generated user experiences. Audio outputs...
by OpenAI · finestra di contesto da 128K token
Ideale per
- trascrizione speech-to-text
- trascrizione di riunioni e audio
Modi per utilizzare GPT-4o Audio in osFoundry
Si colleghi con la sua chiave (BYOK)
Apra la finestra delle chiavi e incolli la sua API key OpenAI. osFoundry scopre GPT-4o Audio automaticamente — lo assegni a un ruolo Maestro (router, direct, orchestrator o fallback) nella scheda Pipeline e sarà attivo in ogni chat. La sua chiave, il suo account provider — nessun ricarico sui token.
Lo utilizzi in una Room App
Le Room App dichiarano le funzionalità AI nel loro manifest e le richiamano con invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Lo richiami dalle sue applicazioni
Una volta integrato un modello nel suo workspace, può esporlo come API e raggiungerlo dai suoi servizi, script o pipeline CI — al di fuori di osFoundry.
GPT-4o Audio a confronto con modelli simili
Licenza
Hosted — usage subject to provider terms — Modello solo in hosting — l'uso è regolato dai termini API del provider. Porti la sua chiave del provider.
Nessun peso distribuito; uso soggetto ai termini del provider.
Domande frequenti su GPT-4o Audio
Quanto costa GPT-4o Audio?
GPT-4o Audio è tariffato a $ 2.50 /1M per l'input e $ 10.00 /1M per l'output. Porti la sua API key OpenAI — osFoundry applica i prezzi del provider senza ricarico.
Posso usare GPT-4o Audio a scopo commerciale?
L'uso commerciale è consentito a determinate condizioni. Modello solo in hosting — l'uso è regolato dai termini API del provider. Porti la sua chiave del provider. Nessun peso distribuito; uso soggetto ai termini del provider.
Qual è la finestra di contesto di GPT-4o Audio?
GPT-4o Audio supporta una finestra di contesto da 128K token.
Posso eseguire GPT-4o Audio localmente?
No — GPT-4o Audio è disponibile solo in hosting e si accede tramite l'API di OpenAI.
In che cosa eccelle GPT-4o Audio?
GPT-4o Audio è particolarmente adatto a trascrizione speech-to-text, trascrizione di riunioni e audio.
Come utilizzo GPT-4o Audio in osFoundry?
Incolli la sua API key OpenAI nella finestra delle chiavi (oppure distribuisca i pesi aperti per i modelli auto-ospitabili), assegni GPT-4o Audio a un ruolo Maestro nella scheda Pipeline, quindi lo utilizzi in chat, nelle Room App tramite invokeAI o nelle sue applicazioni.
Pubblicato da OpenAI il 15 agosto 2025. Fonte: https://openrouter.ai/openai/gpt-4o-audio-preview