GPT Audio
Выпущенная OpenAI в 2026 году, GPT Audio — это речь и аудио модель. The gpt-audio model is OpenAI's first generally available audio model. The new snapshot features an upgraded decoder for more natural sounding voices and maintains better voice consistency. Audio is priced...
by OpenAI · контекстное окно 128K токенов
Лучше всего подходит для
- распознавание речи в текст
- транскрипция встреч и аудио
Способы использования GPT Audio в osFoundry
Подключите со своим ключом (BYOK)
Откройте диалог ключей и вставьте ваш API-ключ OpenAI. osFoundry автоматически обнаружит GPT Audio — назначьте её на роль Maestro (router, direct, orchestrator или fallback) во вкладке Pipeline, и она будет доступна в каждом чате. Ваш ключ, ваш аккаунт у провайдера — без наценки на токены.
Используйте в Room App
Room App объявляют функции ИИ в своём манифесте, а затем вызывают их через invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Вызывайте из своих приложений
После подключения модели к вашему рабочему пространству вы можете разместить её как API и обращаться к ней из своих сервисов, скриптов или CI — за пределами osFoundry.
GPT Audio в сравнении с похожими моделями
| Модель | Организация | Параметры | Контекст | Цена ввода | Самостоятельный хостинг |
|---|
| GPT Audio | OpenAI | — | 128K | $ 2.50 /1M | Только API |
| Voxtral Small 24B 2507 | Mistral | — | 32K | $ 0.100 /1M | Только API |
| GPT Audio Mini | OpenAI | — | 128K | $ 0.600 /1M | Только API |
| GPT-4o Audio | OpenAI | — | 128K | $ 2.50 /1M | Только API |
Лицензия
Hosted — usage subject to provider terms — Модель доступна только в хостинговом варианте — использование регулируется условиями API провайдера. Используйте собственный ключ провайдера.
Веса не распространяются; использование регулируется условиями провайдера.
Частые вопросы о GPT Audio
Сколько стоит GPT Audio?
GPT Audio тарифицируется по ставке $ 2.50 /1M за ввод и $ 10.00 /1M за вывод. Используйте свой API-ключ OpenAI — osFoundry передаёт цены провайдера без наценки.
Можно ли использовать GPT Audio в коммерческих целях?
Коммерческое использование разрешено с условиями. Модель доступна только в хостинговом варианте — использование регулируется условиями API провайдера. Используйте собственный ключ провайдера. Веса не распространяются; использование регулируется условиями провайдера.
Каково контекстное окно у GPT Audio?
GPT Audio поддерживает контекстное окно в 128K токенов.
Можно ли запустить GPT Audio локально?
Нет — GPT Audio доступна только в хостинговом варианте через API OpenAI.
В чём GPT Audio лучше всего?
GPT Audio хорошо подходит для распознавание речи в текст, транскрипция встреч и аудио.
Как использовать GPT Audio в osFoundry?
Вставьте свой API-ключ OpenAI в диалог ключей (или разверните открытые веса для моделей с возможностью самостоятельного хостинга), назначьте GPT Audio на роль Maestro во вкладке Pipeline, а затем используйте её в чате, в Room App через invokeAI или в собственных приложениях.
Опубликовано OpenAI 19 января 2026 г.. Источник: https://openrouter.ai/openai/gpt-audio