GPT Audio
OpenAIが2026年に公開したGPT Audioは、音声・オーディオモデルです。The gpt-audio model is OpenAI's first generally available audio model. The new snapshot features an upgraded decoder for more natural sounding voices and maintains better voice consistency. Audio is priced...
by OpenAI · 128Kトークンのコンテキストウィンドウ
得意な用途
- 音声からテキストへの書き起こし
- 会議・音声の文字起こし
osFoundryでのGPT Audioの使い方
ご自身のキーで接続(BYOK)
キーダイアログを開き、OpenAIのAPIキーを貼り付けるだけで、osFoundryがGPT Audioを自動的に検出します。パイプラインタブでMaestroのロール(router、direct、orchestrator、fallback)に割り当てれば、すべてのチャットですぐに利用できます。ご自身のキー・ご自身のプロバイダーアカウントで、トークン手数料は一切上乗せしません。
Room Appで使う
Room Appはマニフェストで AI 機能を宣言し、invokeAIで呼び出します:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
ご自身のアプリから呼び出す
モデルをワークスペースに組み込めば、APIとしてホストして、osFoundryの外側にあるご自身のサービス・スクリプト・CIから呼び出すことができます。
GPT Audioと類似モデルの比較
ライセンス
Hosted — usage subject to provider terms — ホスティング専用モデル — 利用はプロバイダーのAPI規約に従います。ご自身のプロバイダーキーをお持ちください。
重みは配布されません。利用はプロバイダー規約に従います。
GPT Audioについてのよくある質問
GPT Audioの料金はいくらですか?
GPT Audioは入力 $ 2.50 /1M、出力 $ 10.00 /1Mの従量課金です。ご自身のOpenAI APIキーをお持ちいただければ、osFoundryはプロバイダー価格をそのまま反映し、上乗せはありません。
GPT Audioを商用利用できますか?
条件付きで商用利用が許可されています。 ホスティング専用モデル — 利用はプロバイダーのAPI規約に従います。ご自身のプロバイダーキーをお持ちください。 重みは配布されません。利用はプロバイダー規約に従います。
GPT Audioのコンテキストウィンドウはどれくらいですか?
GPT Audioは128Kトークンのコンテキストウィンドウに対応しています。
GPT Audioをローカルで実行できますか?
いいえ、GPT Audioはホスティング専用で、OpenAI API経由でのみ利用できます。
GPT Audioが最も得意なことは何ですか?
GPT Audioは音声からテキストへの書き起こし, 会議・音声の文字起こしに適しています。
osFoundryでGPT Audioをどう使えばよいですか?
キーダイアログでOpenAI APIキーを貼り付け(セルフホスト可能なモデルの場合はオープンウェイトをデプロイ)、パイプラインタブでGPT AudioをMaestroのロールに割り当てれば、チャット、invokeAI経由のRoom App、ご自身のアプリから利用できます。
OpenAIにより公開(2026年1月19日)。 出典: https://openrouter.ai/openai/gpt-audio