GPT-4o Audio
OpenAI का GPT-4o Audio एक speech और audio model। The gpt-4o-audio-preview model adds support for audio inputs as prompts. This enhancement allows the model to detect nuances within audio recordings and add depth to generated user experiences. Audio outputs...
by OpenAI · 128K token context window
किसके लिए सर्वोत्तम
- speech-to-text transcription
- meeting और audio transcription
osFoundry में GPT-4o Audio का उपयोग करने के तरीके
अपनी key से जोड़ें (BYOK)
key dialog खोलें और अपनी OpenAI API key पेस्ट करें। osFoundry GPT-4o Audio को स्वचालित रूप से खोज लेता है — इसे Pipeline tab में किसी Maestro role (router, direct, orchestrator, या fallback) को असाइन करें और यह हर चैट में live हो जाता है। आपकी key, आपका provider account — कोई token markup नहीं।
Room App में उपयोग करें
Room Apps अपने manifest में AI features घोषित करते हैं, फिर उन्हें invokeAI के साथ कॉल करते हैं:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
अपने ऐप्स से इसे कॉल करें
एक बार जब model आपके workspace में wired हो जाता है, तो आप इसे API के रूप में host कर सकते हैं और इसे अपनी services, scripts, या CI से — osFoundry के बाहर — एक्सेस कर सकते हैं।
GPT-4o Audio बनाम समान models
लाइसेंस
Hosted — usage subject to provider terms — Hosted-only model — उपयोग provider के API terms द्वारा शासित। अपनी provider key लाएँ।
कोई weights distributed नहीं; उपयोग provider terms के अधीन।
GPT-4o Audio के बारे में अक्सर पूछे जाने वाले प्रश्न
GPT-4o Audio की लागत कितनी है?
GPT-4o Audio input के लिए $ 2.50 /1M पर metered है, और output के लिए $ 10.00 /1M। अपनी OpenAI API key लाएँ — osFoundry बिना markup के provider pricing pass-through करता है।
क्या मैं GPT-4o Audio का commercial उपयोग कर सकता हूँ?
Commercial उपयोग शर्तों के साथ अनुमत है। Hosted-only model — उपयोग provider के API terms द्वारा शासित। अपनी provider key लाएँ। कोई weights distributed नहीं; उपयोग provider terms के अधीन।
GPT-4o Audio का context window क्या है?
GPT-4o Audio 128K token context window का समर्थन करता है।
क्या मैं GPT-4o Audio को locally चला सकता हूँ?
नहीं — GPT-4o Audio केवल hosted है और OpenAI API के माध्यम से एक्सेस किया जाता है।
GPT-4o Audio किसमें सर्वश्रेष्ठ है?
GPT-4o Audio speech-to-text transcription, meeting और audio transcription के लिए उपयुक्त है।
मैं osFoundry में GPT-4o Audio का उपयोग कैसे करूँ?
key dialog में अपनी OpenAI API key पेस्ट करें (या self-hostable models के लिए open weights deploy करें), Pipeline tab में GPT-4o Audio को एक Maestro role को असाइन करें, फिर इसे चैट में, invokeAI के माध्यम से Room Apps में, या अपने ऐप्स में उपयोग करें।
OpenAI द्वारा प्रकाशित 15 अगस्त 2025 को। स्रोत: https://openrouter.ai/openai/gpt-4o-audio-preview