GPT Audio
Veröffentlicht von OpenAI im Jahr 2026, ist GPT Audio ein Sprache und Audio-Modell. The gpt-audio model is OpenAI's first generally available audio model. The new snapshot features an upgraded decoder for more natural sounding voices and maintains better voice consistency. Audio is priced...
by OpenAI · Kontextfenster von 128K Token
Am besten geeignet für
- Speech-to-Text-Transkription
- Meeting- und Audiotranskription
Möglichkeiten, GPT Audio in osFoundry zu nutzen
Mit eigenem Schlüssel verbinden (BYOK)
Öffnen Sie den Schlüssel-Dialog und fügen Sie Ihren OpenAI-API-Key ein. osFoundry erkennt GPT Audio automatisch — weisen Sie es im Pipeline-Tab einer Maestro-Rolle (Router, Direct, Orchestrator oder Fallback) zu, und es ist in jedem Chat verfügbar. Ihr Key, Ihr Provider-Konto — kein Token-Aufschlag.
In einer Room App verwenden
Room Apps deklarieren KI-Funktionen in ihrem Manifest und rufen sie anschließend mit invokeAI auf:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Aus eigenen Anwendungen aufrufen
Sobald ein Modell in Ihrem Workspace eingerichtet ist, können Sie es als API hosten und aus Ihren eigenen Diensten, Skripten oder CI — außerhalb von osFoundry — erreichen.
GPT Audio im Vergleich zu ähnlichen Modellen
Lizenz
Hosted — usage subject to provider terms — Nur gehostetes Modell — die Nutzung unterliegt den API-Bedingungen des Anbieters. Bringen Sie Ihren eigenen Provider-Key mit.
Keine Weights verteilt; Nutzung unterliegt den Anbieterbedingungen.
Häufige Fragen zu GPT Audio
Wie viel kostet GPT Audio?
GPT Audio wird mit $ 2.50 /1M für Input und $ 10.00 /1M für Output abgerechnet. Bringen Sie Ihren eigenen OpenAI-API-Key mit — osFoundry reicht die Provider-Preise ohne Aufschlag durch.
Kann ich GPT Audio kommerziell nutzen?
Kommerzielle Nutzung ist unter bestimmten Bedingungen erlaubt. Nur gehostetes Modell — die Nutzung unterliegt den API-Bedingungen des Anbieters. Bringen Sie Ihren eigenen Provider-Key mit. Keine Weights verteilt; Nutzung unterliegt den Anbieterbedingungen.
Wie groß ist das Kontextfenster von GPT Audio?
GPT Audio unterstützt ein Kontextfenster von 128K Token.
Kann ich GPT Audio lokal betreiben?
Nein — GPT Audio ist nur gehostet verfügbar und wird über die OpenAI-API genutzt.
Worin ist GPT Audio besonders gut?
GPT Audio eignet sich besonders für Speech-to-Text-Transkription, Meeting- und Audiotranskription.
Wie verwende ich GPT Audio in osFoundry?
Fügen Sie Ihren OpenAI-API-Key im Schlüssel-Dialog ein (oder stellen Sie bei selbst hostbaren Modellen die Open Weights bereit), weisen Sie GPT Audio im Pipeline-Tab einer Maestro-Rolle zu und nutzen Sie es anschließend im Chat, in Room Apps über invokeAI oder in Ihren eigenen Anwendungen.
Veröffentlicht von OpenAI am 19. Januar 2026. Quelle: https://openrouter.ai/openai/gpt-audio