DeepSeek V4 Flash
DeepSeek V4 Flash est un modèle chat de DeepSeek, publié le 24 avril 2026. DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and...
by DeepSeek · fenêtre de contexte de 1049K tokens
Idéal pour
- chat et routage à faible latence
- routage et triage des requêtes
- classification de texte
Comment utiliser DeepSeek V4 Flash dans osFoundry
Connectez-vous avec votre propre clé (BYOK)
Ouvrez la fenêtre de clés et collez votre clé API DeepSeek. osFoundry détecte automatiquement DeepSeek V4 Flash — assignez-le à un rôle Maestro (router, direct, orchestrator ou fallback) dans l'onglet Pipeline et il est actif dans chaque conversation. Votre clé, votre compte fournisseur — sans majoration sur les tokens.
Utilisez-le dans une Room App
Les Room Apps déclarent leurs fonctionnalités IA dans leur manifeste, puis les appellent via invokeAI :
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Appelez-le depuis vos propres applications
Une fois un modèle intégré à votre espace de travail, vous pouvez l'héberger en tant qu'API et l'appeler depuis vos propres services, scripts ou CI — en dehors d'osFoundry.
Exécutez DeepSeek V4 Flash vous-même
DeepSeek V4 Flash est également disponible en open weights — hébergez-le vous-même pour un contrôle total des données et zéro coût au token. Consultez cette page pour les prérequis GPU et une comparaison des coûts avec la tarification API.
DeepSeek V4 Flash face aux modèles similaires
| Modèle | Organisation | Paramètres | Contexte | Prix en entrée | Auto-hébergement |
|---|
| DeepSeek V4 Flash | DeepSeek | — | 1049K | $ 0.126 /1M | API uniquement |
| Ling-2.6-1T | inclusionAI | — | 262K | $ 0.300 /1M | API uniquement |
| Hy3 preview | Tencent | — | 262K | $ 0.066 /1M | API uniquement |
| Qwen3.6 Max Preview | Qwen | — | 262K | $ 1.04 /1M | API uniquement |
Licence
Hosted — usage subject to provider terms — Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur.
Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Questions fréquentes sur DeepSeek V4 Flash
Combien coûte DeepSeek V4 Flash ?
DeepSeek V4 Flash est facturé à $ 0.126 /1M en entrée et $ 0.252 /1M en sortie. Apportez votre propre clé API DeepSeek — osFoundry répercute la tarification du fournisseur sans majoration.
Puis-je utiliser DeepSeek V4 Flash à des fins commerciales ?
L'usage commercial est autorisé sous conditions. Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur. Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Quelle est la fenêtre de contexte de DeepSeek V4 Flash ?
DeepSeek V4 Flash prend en charge une fenêtre de contexte de 1049K tokens.
Puis-je exécuter DeepSeek V4 Flash localement ?
Non — DeepSeek V4 Flash est uniquement hébergé et accessible via l'API DeepSeek. Un équivalent en open-weights est disponible en auto-hébergement — voir le lien croisé ci-dessus.
À quoi DeepSeek V4 Flash excelle-t-il ?
DeepSeek V4 Flash convient particulièrement bien à chat et routage à faible latence, routage et triage des requêtes, classification de texte.
Comment utiliser DeepSeek V4 Flash dans osFoundry ?
Collez votre clé API DeepSeek dans la fenêtre de clés (ou déployez les open weights pour les modèles auto-hébergeables), assignez DeepSeek V4 Flash à un rôle Maestro dans l'onglet Pipeline, puis utilisez-le en chat, dans les Room Apps via invokeAI, ou dans vos propres applications.
Publié par DeepSeek le 24 avril 2026. Source : https://openrouter.ai/deepseek/deepseek-v4-flash