GPT Audio
OpenAI द्वारा 2026 में जारी, GPT Audio एक speech और audio model है। The gpt-audio model is OpenAI's first generally available audio model. The new snapshot features an upgraded decoder for more natural sounding voices and maintains better voice consistency. Audio is priced...
by OpenAI · 128K token context window
किसके लिए सर्वोत्तम
- speech-to-text transcription
- meeting और audio transcription
osFoundry में GPT Audio का उपयोग करने के तरीके
अपनी key से जोड़ें (BYOK)
key dialog खोलें और अपनी OpenAI API key पेस्ट करें। osFoundry GPT Audio को स्वचालित रूप से खोज लेता है — इसे Pipeline tab में किसी Maestro role (router, direct, orchestrator, या fallback) को असाइन करें और यह हर चैट में live हो जाता है। आपकी key, आपका provider account — कोई token markup नहीं।
Room App में उपयोग करें
Room Apps अपने manifest में AI features घोषित करते हैं, फिर उन्हें invokeAI के साथ कॉल करते हैं:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
अपने ऐप्स से इसे कॉल करें
एक बार जब model आपके workspace में wired हो जाता है, तो आप इसे API के रूप में host कर सकते हैं और इसे अपनी services, scripts, या CI से — osFoundry के बाहर — एक्सेस कर सकते हैं।
GPT Audio बनाम समान models
लाइसेंस
Hosted — usage subject to provider terms — Hosted-only model — उपयोग provider के API terms द्वारा शासित। अपनी provider key लाएँ।
कोई weights distributed नहीं; उपयोग provider terms के अधीन।
GPT Audio के बारे में अक्सर पूछे जाने वाले प्रश्न
GPT Audio की लागत कितनी है?
GPT Audio input के लिए $ 2.50 /1M पर metered है, और output के लिए $ 10.00 /1M। अपनी OpenAI API key लाएँ — osFoundry बिना markup के provider pricing pass-through करता है।
क्या मैं GPT Audio का commercial उपयोग कर सकता हूँ?
Commercial उपयोग शर्तों के साथ अनुमत है। Hosted-only model — उपयोग provider के API terms द्वारा शासित। अपनी provider key लाएँ। कोई weights distributed नहीं; उपयोग provider terms के अधीन।
GPT Audio का context window क्या है?
GPT Audio 128K token context window का समर्थन करता है।
क्या मैं GPT Audio को locally चला सकता हूँ?
नहीं — GPT Audio केवल hosted है और OpenAI API के माध्यम से एक्सेस किया जाता है।
GPT Audio किसमें सर्वश्रेष्ठ है?
GPT Audio speech-to-text transcription, meeting और audio transcription के लिए उपयुक्त है।
मैं osFoundry में GPT Audio का उपयोग कैसे करूँ?
key dialog में अपनी OpenAI API key पेस्ट करें (या self-hostable models के लिए open weights deploy करें), Pipeline tab में GPT Audio को एक Maestro role को असाइन करें, फिर इसे चैट में, invokeAI के माध्यम से Room Apps में, या अपने ऐप्स में उपयोग करें।
OpenAI द्वारा प्रकाशित 19 जनवरी 2026 को। स्रोत: https://openrouter.ai/openai/gpt-audio