GPT Audio
Publié par OpenAI en 2026, GPT Audio est un modèle parole et audio . The gpt-audio model is OpenAI's first generally available audio model. The new snapshot features an upgraded decoder for more natural sounding voices and maintains better voice consistency. Audio is priced...
by OpenAI · fenêtre de contexte de 128K tokens
Idéal pour
- transcription parole-vers-texte
- transcription de réunions et d'audio
Comment utiliser GPT Audio dans osFoundry
Connectez-vous avec votre propre clé (BYOK)
Ouvrez la fenêtre de clés et collez votre clé API OpenAI. osFoundry détecte automatiquement GPT Audio — assignez-le à un rôle Maestro (router, direct, orchestrator ou fallback) dans l'onglet Pipeline et il est actif dans chaque conversation. Votre clé, votre compte fournisseur — sans majoration sur les tokens.
Utilisez-le dans une Room App
Les Room Apps déclarent leurs fonctionnalités IA dans leur manifeste, puis les appellent via invokeAI :
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Appelez-le depuis vos propres applications
Une fois un modèle intégré à votre espace de travail, vous pouvez l'héberger en tant qu'API et l'appeler depuis vos propres services, scripts ou CI — en dehors d'osFoundry.
GPT Audio face aux modèles similaires
| Modèle | Organisation | Paramètres | Contexte | Prix en entrée | Auto-hébergement |
|---|
| GPT Audio | OpenAI | — | 128K | $ 2.50 /1M | API uniquement |
| Voxtral Small 24B 2507 | Mistral | — | 32K | $ 0.100 /1M | API uniquement |
| GPT Audio Mini | OpenAI | — | 128K | $ 0.600 /1M | API uniquement |
| GPT-4o Audio | OpenAI | — | 128K | $ 2.50 /1M | API uniquement |
Licence
Hosted — usage subject to provider terms — Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur.
Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Questions fréquentes sur GPT Audio
Combien coûte GPT Audio ?
GPT Audio est facturé à $ 2.50 /1M en entrée et $ 10.00 /1M en sortie. Apportez votre propre clé API OpenAI — osFoundry répercute la tarification du fournisseur sans majoration.
Puis-je utiliser GPT Audio à des fins commerciales ?
L'usage commercial est autorisé sous conditions. Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur. Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Quelle est la fenêtre de contexte de GPT Audio ?
GPT Audio prend en charge une fenêtre de contexte de 128K tokens.
Puis-je exécuter GPT Audio localement ?
Non — GPT Audio est uniquement hébergé et accessible via l'API OpenAI.
À quoi GPT Audio excelle-t-il ?
GPT Audio convient particulièrement bien à transcription parole-vers-texte, transcription de réunions et d'audio.
Comment utiliser GPT Audio dans osFoundry ?
Collez votre clé API OpenAI dans la fenêtre de clés (ou déployez les open weights pour les modèles auto-hébergeables), assignez GPT Audio à un rôle Maestro dans l'onglet Pipeline, puis utilisez-le en chat, dans les Room Apps via invokeAI, ou dans vos propres applications.
Publié par OpenAI le 19 janvier 2026. Source : https://openrouter.ai/openai/gpt-audio