DeepSeek V4 Flash
DeepSeek V4 Flash é um modelo de chat da DeepSeek, lançado em 24 de abril de 2026. DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and...
by DeepSeek · janela de contexto de 1049K tokens
Ideal para
- chat e roteamento de baixa latência
- roteamento e triagem de requisições
- classificação de texto
Como usar DeepSeek V4 Flash no osFoundry
Conecte com sua própria chave (BYOK)
Abra o diálogo de chaves e cole sua chave de API da DeepSeek. O osFoundry descobre DeepSeek V4 Flash automaticamente — atribua-o a um papel do Maestro (router, direct, orchestrator ou fallback) na aba Pipeline e ele estará ativo em cada chat. Sua chave, sua conta no provedor — sem markup sobre tokens.
Use em um Room App
Os Room Apps declaram recursos de IA em seus manifestos e os chamam com invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Chame a partir dos seus próprios apps
Uma vez que um modelo está conectado ao seu workspace, você pode hospedá-lo como uma API e acessá-lo a partir dos seus próprios serviços, scripts ou CI — fora do osFoundry.
Execute DeepSeek V4 Flash por conta própria
DeepSeek V4 Flash também está disponível como open weights — auto-hospede para controle total dos dados e sem custo por token. Veja essa página para requisitos de GPU e uma comparação de custos com o preço da API.
DeepSeek V4 Flash vs modelos semelhantes
| Modelo | Organização | Parâmetros | Contexto | Preço de entrada | Auto-hospedado |
|---|
| DeepSeek V4 Flash | DeepSeek | — | 1049K | $ 0.126 /1M | Apenas API |
| Ling-2.6-1T | inclusionAI | — | 262K | $ 0.300 /1M | Apenas API |
| Hy3 preview | Tencent | — | 262K | $ 0.066 /1M | Apenas API |
| Qwen3.6 Max Preview | Qwen | — | 262K | $ 1.04 /1M | Apenas API |
Licença
Hosted — usage subject to provider terms — Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor.
Sem distribuição de pesos; uso sujeito aos termos do provedor.
Perguntas frequentes sobre DeepSeek V4 Flash
Quanto custa DeepSeek V4 Flash?
DeepSeek V4 Flash é cobrado a $ 0.126 /1M para entrada e $ 0.252 /1M para saída. Use sua própria chave de API da DeepSeek — o osFoundry repassa o preço do provedor sem markup.
Posso usar DeepSeek V4 Flash comercialmente?
Uso comercial é permitido com condições. Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor. Sem distribuição de pesos; uso sujeito aos termos do provedor.
Qual é a janela de contexto de DeepSeek V4 Flash?
DeepSeek V4 Flash suporta uma janela de contexto de 1049K tokens.
Posso rodar DeepSeek V4 Flash localmente?
Não — DeepSeek V4 Flash é somente hospedado e acessado via API da DeepSeek. Há um equivalente open-weights disponível para auto-hospedagem — veja o link cruzado acima.
Em que DeepSeek V4 Flash é melhor?
DeepSeek V4 Flash é bem adequado para chat e roteamento de baixa latência, roteamento e triagem de requisições, classificação de texto.
Como uso DeepSeek V4 Flash no osFoundry?
Cole sua chave de API da DeepSeek no diálogo de chaves (ou implante os pesos abertos para modelos auto-hospedáveis), atribua DeepSeek V4 Flash a um papel do Maestro na aba Pipeline e use-o em chats, em Room Apps via invokeAI ou nos seus próprios apps.
Publicado pela DeepSeek em 24 de abril de 2026. Fonte: https://openrouter.ai/deepseek/deepseek-v4-flash