DeepSeek V4 Flash
DeepSeek V4 Flash adalah model chat dari DeepSeek, dirilis 24 April 2026. DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and...
by DeepSeek · context window 1049K token
Paling cocok untuk
- chat dan routing latensi rendah
- routing dan triase permintaan
- klasifikasi teks
Cara menggunakan DeepSeek V4 Flash di osFoundry
Hubungkan dengan key Anda sendiri (BYOK)
Buka dialog key dan tempelkan API key DeepSeek Anda. osFoundry menemukan DeepSeek V4 Flash secara otomatis — tetapkan ke peran Maestro (router, direct, orchestrator, atau fallback) di tab Pipeline dan model ini langsung aktif di setiap chat. Key Anda, akun provider Anda — tanpa markup token.
Gunakan di Room App
Room App mendeklarasikan fitur AI di manifest mereka, lalu memanggilnya dengan invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Panggil dari aplikasi Anda sendiri
Setelah sebuah model terhubung ke workspace Anda, Anda dapat meng-host-nya sebagai API dan mengaksesnya dari layanan, skrip, atau CI Anda sendiri — di luar osFoundry.
Jalankan DeepSeek V4 Flash sendiri
DeepSeek V4 Flash juga tersedia sebagai open weights — self-host model ini untuk kontrol data penuh dan tanpa biaya per token. Lihat halaman tersebut untuk persyaratan GPU dan perbandingan biaya terhadap harga API.
DeepSeek V4 Flash vs model serupa
| Model | Org | Parameter | Context | Harga input | Self-host |
|---|
| DeepSeek V4 Flash | DeepSeek | — | 1049K | $ 0.126 /1M | Hanya API |
| Ling-2.6-1T | inclusionAI | — | 262K | $ 0.300 /1M | Hanya API |
| Hy3 preview | Tencent | — | 262K | $ 0.066 /1M | Hanya API |
| Qwen3.6 Max Preview | Qwen | — | 262K | $ 1.04 /1M | Hanya API |
Lisensi
Hosted — usage subject to provider terms — Model ter-host saja — penggunaan diatur oleh ketentuan API provider. Bawa key provider Anda sendiri.
Tidak ada weights yang didistribusikan; penggunaan tunduk pada ketentuan provider.
Pertanyaan umum tentang DeepSeek V4 Flash
Berapa biaya DeepSeek V4 Flash?
DeepSeek V4 Flash dikenakan biaya $ 0.126 /1M untuk input, dan $ 0.252 /1M untuk output. Bawa API key DeepSeek Anda sendiri — osFoundry meneruskan harga provider tanpa markup.
Bisakah saya menggunakan DeepSeek V4 Flash secara komersial?
Penggunaan komersial diizinkan dengan syarat. Model ter-host saja — penggunaan diatur oleh ketentuan API provider. Bawa key provider Anda sendiri. Tidak ada weights yang didistribusikan; penggunaan tunduk pada ketentuan provider.
Berapa context window dari DeepSeek V4 Flash?
DeepSeek V4 Flash mendukung context window 1049K token.
Bisakah saya menjalankan DeepSeek V4 Flash secara lokal?
Tidak — DeepSeek V4 Flash hanya ter-host dan diakses melalui API DeepSeek. Padanan open-weights tersedia untuk self-host — lihat tautan silang di atas.
Apa keunggulan utama DeepSeek V4 Flash?
DeepSeek V4 Flash sangat cocok untuk chat dan routing latensi rendah, routing dan triase permintaan, klasifikasi teks.
Bagaimana cara menggunakan DeepSeek V4 Flash di osFoundry?
Tempelkan API key DeepSeek Anda di dialog key (atau deploy open weights untuk model yang dapat di-self-host), tetapkan DeepSeek V4 Flash ke peran Maestro di tab Pipeline, lalu gunakan di chat, di Room App via invokeAI, atau di aplikasi Anda sendiri.
Diterbitkan oleh DeepSeek pada 24 April 2026. Sumber: https://openrouter.ai/deepseek/deepseek-v4-flash