GPT-4o Audio
Model ucapan-dan-audio GPT-4o Audio dari OpenAI adalah sebuah . The gpt-4o-audio-preview model adds support for audio inputs as prompts. This enhancement allows the model to detect nuances within audio recordings and add depth to generated user experiences. Audio outputs...
by OpenAI · context window 128K token
Paling cocok untuk
- transkripsi speech-to-text
- transkripsi rapat dan audio
Cara menggunakan GPT-4o Audio di osFoundry
Hubungkan dengan key Anda sendiri (BYOK)
Buka dialog key dan tempelkan API key OpenAI Anda. osFoundry menemukan GPT-4o Audio secara otomatis — tetapkan ke peran Maestro (router, direct, orchestrator, atau fallback) di tab Pipeline dan model ini langsung aktif di setiap chat. Key Anda, akun provider Anda — tanpa markup token.
Gunakan di Room App
Room App mendeklarasikan fitur AI di manifest mereka, lalu memanggilnya dengan invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Panggil dari aplikasi Anda sendiri
Setelah sebuah model terhubung ke workspace Anda, Anda dapat meng-host-nya sebagai API dan mengaksesnya dari layanan, skrip, atau CI Anda sendiri — di luar osFoundry.
GPT-4o Audio vs model serupa
Lisensi
Hosted — usage subject to provider terms — Model ter-host saja — penggunaan diatur oleh ketentuan API provider. Bawa key provider Anda sendiri.
Tidak ada weights yang didistribusikan; penggunaan tunduk pada ketentuan provider.
Pertanyaan umum tentang GPT-4o Audio
Berapa biaya GPT-4o Audio?
GPT-4o Audio dikenakan biaya $ 2.50 /1M untuk input, dan $ 10.00 /1M untuk output. Bawa API key OpenAI Anda sendiri — osFoundry meneruskan harga provider tanpa markup.
Bisakah saya menggunakan GPT-4o Audio secara komersial?
Penggunaan komersial diizinkan dengan syarat. Model ter-host saja — penggunaan diatur oleh ketentuan API provider. Bawa key provider Anda sendiri. Tidak ada weights yang didistribusikan; penggunaan tunduk pada ketentuan provider.
Berapa context window dari GPT-4o Audio?
GPT-4o Audio mendukung context window 128K token.
Bisakah saya menjalankan GPT-4o Audio secara lokal?
Tidak — GPT-4o Audio hanya ter-host dan diakses melalui API OpenAI.
Apa keunggulan utama GPT-4o Audio?
GPT-4o Audio sangat cocok untuk transkripsi speech-to-text, transkripsi rapat dan audio.
Bagaimana cara menggunakan GPT-4o Audio di osFoundry?
Tempelkan API key OpenAI Anda di dialog key (atau deploy open weights untuk model yang dapat di-self-host), tetapkan GPT-4o Audio ke peran Maestro di tab Pipeline, lalu gunakan di chat, di Room App via invokeAI, atau di aplikasi Anda sendiri.
Diterbitkan oleh OpenAI pada 15 Agustus 2025. Sumber: https://openrouter.ai/openai/gpt-4o-audio-preview