DeepSeek V4 Flash
DeepSeek V4 Flash ist ein Chat-Modell von DeepSeek, veröffentlicht am 24. April 2026. DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and...
by DeepSeek · Kontextfenster von 1049K Token
Am besten geeignet für
- Chat und Routing mit geringer Latenz
- Anfrage-Routing und Triage
- Textklassifikation
Möglichkeiten, DeepSeek V4 Flash in osFoundry zu nutzen
Mit eigenem Schlüssel verbinden (BYOK)
Öffnen Sie den Schlüssel-Dialog und fügen Sie Ihren DeepSeek-API-Key ein. osFoundry erkennt DeepSeek V4 Flash automatisch — weisen Sie es im Pipeline-Tab einer Maestro-Rolle (Router, Direct, Orchestrator oder Fallback) zu, und es ist in jedem Chat verfügbar. Ihr Key, Ihr Provider-Konto — kein Token-Aufschlag.
In einer Room App verwenden
Room Apps deklarieren KI-Funktionen in ihrem Manifest und rufen sie anschließend mit invokeAI auf:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Aus eigenen Anwendungen aufrufen
Sobald ein Modell in Ihrem Workspace eingerichtet ist, können Sie es als API hosten und aus Ihren eigenen Diensten, Skripten oder CI — außerhalb von osFoundry — erreichen.
DeepSeek V4 Flash selbst betreiben
DeepSeek V4 Flash ist auch als Open Weights verfügbar — selbst hosten für volle Datenkontrolle und ohne Kosten pro Token. Auf jener Seite finden Sie GPU-Anforderungen und einen Kostenvergleich mit API-Preisen.
DeepSeek V4 Flash im Vergleich zu ähnlichen Modellen
| Modell | Organisation | Parameter | Kontext | Input-Preis | Selbst hosten |
|---|
| DeepSeek V4 Flash | DeepSeek | — | 1049K | $ 0.126 /1M | Nur API |
| Ling-2.6-1T | inclusionAI | — | 262K | $ 0.300 /1M | Nur API |
| Hy3 preview | Tencent | — | 262K | $ 0.066 /1M | Nur API |
| Qwen3.6 Max Preview | Qwen | — | 262K | $ 1.04 /1M | Nur API |
Lizenz
Hosted — usage subject to provider terms — Nur gehostetes Modell — die Nutzung unterliegt den API-Bedingungen des Anbieters. Bringen Sie Ihren eigenen Provider-Key mit.
Keine Weights verteilt; Nutzung unterliegt den Anbieterbedingungen.
Häufige Fragen zu DeepSeek V4 Flash
Wie viel kostet DeepSeek V4 Flash?
DeepSeek V4 Flash wird mit $ 0.126 /1M für Input und $ 0.252 /1M für Output abgerechnet. Bringen Sie Ihren eigenen DeepSeek-API-Key mit — osFoundry reicht die Provider-Preise ohne Aufschlag durch.
Kann ich DeepSeek V4 Flash kommerziell nutzen?
Kommerzielle Nutzung ist unter bestimmten Bedingungen erlaubt. Nur gehostetes Modell — die Nutzung unterliegt den API-Bedingungen des Anbieters. Bringen Sie Ihren eigenen Provider-Key mit. Keine Weights verteilt; Nutzung unterliegt den Anbieterbedingungen.
Wie groß ist das Kontextfenster von DeepSeek V4 Flash?
DeepSeek V4 Flash unterstützt ein Kontextfenster von 1049K Token.
Kann ich DeepSeek V4 Flash lokal betreiben?
Nein — DeepSeek V4 Flash ist nur gehostet verfügbar und wird über die DeepSeek-API genutzt. Ein Open-Weights-Äquivalent steht zum Selbsthosten zur Verfügung — siehe den Querverweis oben.
Worin ist DeepSeek V4 Flash besonders gut?
DeepSeek V4 Flash eignet sich besonders für Chat und Routing mit geringer Latenz, Anfrage-Routing und Triage, Textklassifikation.
Wie verwende ich DeepSeek V4 Flash in osFoundry?
Fügen Sie Ihren DeepSeek-API-Key im Schlüssel-Dialog ein (oder stellen Sie bei selbst hostbaren Modellen die Open Weights bereit), weisen Sie DeepSeek V4 Flash im Pipeline-Tab einer Maestro-Rolle zu und nutzen Sie es anschließend im Chat, in Room Apps über invokeAI oder in Ihren eigenen Anwendungen.
Veröffentlicht von DeepSeek am 24. April 2026. Quelle: https://openrouter.ai/deepseek/deepseek-v4-flash