GPT-4o Audio
GPT-4o Audio от OpenAI — представляет собой речь и аудио модель. The gpt-4o-audio-preview model adds support for audio inputs as prompts. This enhancement allows the model to detect nuances within audio recordings and add depth to generated user experiences. Audio outputs...
by OpenAI · контекстное окно 128K токенов
Лучше всего подходит для
- распознавание речи в текст
- транскрипция встреч и аудио
Способы использования GPT-4o Audio в osFoundry
Подключите со своим ключом (BYOK)
Откройте диалог ключей и вставьте ваш API-ключ OpenAI. osFoundry автоматически обнаружит GPT-4o Audio — назначьте её на роль Maestro (router, direct, orchestrator или fallback) во вкладке Pipeline, и она будет доступна в каждом чате. Ваш ключ, ваш аккаунт у провайдера — без наценки на токены.
Используйте в Room App
Room App объявляют функции ИИ в своём манифесте, а затем вызывают их через invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Вызывайте из своих приложений
После подключения модели к вашему рабочему пространству вы можете разместить её как API и обращаться к ней из своих сервисов, скриптов или CI — за пределами osFoundry.
GPT-4o Audio в сравнении с похожими моделями
| Модель | Организация | Параметры | Контекст | Цена ввода | Самостоятельный хостинг |
|---|
| GPT-4o Audio | OpenAI | — | 128K | $ 2.50 /1M | Только API |
| Voxtral Small 24B 2507 | Mistral | — | 32K | $ 0.100 /1M | Только API |
| GPT Audio Mini | OpenAI | — | 128K | $ 0.600 /1M | Только API |
| GPT Audio | OpenAI | — | 128K | $ 2.50 /1M | Только API |
Лицензия
Hosted — usage subject to provider terms — Модель доступна только в хостинговом варианте — использование регулируется условиями API провайдера. Используйте собственный ключ провайдера.
Веса не распространяются; использование регулируется условиями провайдера.
Частые вопросы о GPT-4o Audio
Сколько стоит GPT-4o Audio?
GPT-4o Audio тарифицируется по ставке $ 2.50 /1M за ввод и $ 10.00 /1M за вывод. Используйте свой API-ключ OpenAI — osFoundry передаёт цены провайдера без наценки.
Можно ли использовать GPT-4o Audio в коммерческих целях?
Коммерческое использование разрешено с условиями. Модель доступна только в хостинговом варианте — использование регулируется условиями API провайдера. Используйте собственный ключ провайдера. Веса не распространяются; использование регулируется условиями провайдера.
Каково контекстное окно у GPT-4o Audio?
GPT-4o Audio поддерживает контекстное окно в 128K токенов.
Можно ли запустить GPT-4o Audio локально?
Нет — GPT-4o Audio доступна только в хостинговом варианте через API OpenAI.
В чём GPT-4o Audio лучше всего?
GPT-4o Audio хорошо подходит для распознавание речи в текст, транскрипция встреч и аудио.
Как использовать GPT-4o Audio в osFoundry?
Вставьте свой API-ключ OpenAI в диалог ключей (или разверните открытые веса для моделей с возможностью самостоятельного хостинга), назначьте GPT-4o Audio на роль Maestro во вкладке Pipeline, а затем используйте её в чате, в Room App через invokeAI или в собственных приложениях.
Опубликовано OpenAI 15 августа 2025 г.. Источник: https://openrouter.ai/openai/gpt-4o-audio-preview