MiMo-V2-Flash
MiMo-V2-Flash (Xiaomi, 2025) é um modelo de chat. MiMo-V2-Flash is an open-source foundation language model developed by Xiaomi. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, adopting hybrid attention architecture. MiMo-V2-Flash supports a...
by Xiaomi · janela de contexto de 262K tokens
Ideal para
- chat e roteamento de baixa latência
- roteamento e triagem de requisições
- classificação de texto
Como usar MiMo-V2-Flash no osFoundry
Conecte com sua própria chave (BYOK)
Abra o diálogo de chaves e cole sua chave de API da Xiaomi. O osFoundry descobre MiMo-V2-Flash automaticamente — atribua-o a um papel do Maestro (router, direct, orchestrator ou fallback) na aba Pipeline e ele estará ativo em cada chat. Sua chave, sua conta no provedor — sem markup sobre tokens.
Use em um Room App
Os Room Apps declaram recursos de IA em seus manifestos e os chamam com invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Chame a partir dos seus próprios apps
Uma vez que um modelo está conectado ao seu workspace, você pode hospedá-lo como uma API e acessá-lo a partir dos seus próprios serviços, scripts ou CI — fora do osFoundry.
Execute MiMo-V2-Flash por conta própria
MiMo-V2-Flash também está disponível como open weights — auto-hospede para controle total dos dados e sem custo por token. Veja essa página para requisitos de GPU e uma comparação de custos com o preço da API.
MiMo-V2-Flash vs modelos semelhantes
| Modelo | Organização | Parâmetros | Contexto | Preço de entrada | Auto-hospedado |
|---|
| MiMo-V2-Flash | Xiaomi | — | 262K | $ 0.100 /1M | Apenas API |
| GLM 4.7 | Z.ai | — | 203K | $ 0.400 /1M | Apenas API |
| Nemotron 3 Nano 30B A3B (free) | NVIDIA | — | 256K | Free | Apenas API |
| MiniMax M2.1 | MiniMax | — | 197K | $ 0.290 /1M | Apenas API |
Licença
Hosted — usage subject to provider terms — Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor.
Sem distribuição de pesos; uso sujeito aos termos do provedor.
Perguntas frequentes sobre MiMo-V2-Flash
Quanto custa MiMo-V2-Flash?
MiMo-V2-Flash é cobrado a $ 0.100 /1M para entrada e $ 0.300 /1M para saída. Use sua própria chave de API da Xiaomi — o osFoundry repassa o preço do provedor sem markup.
Posso usar MiMo-V2-Flash comercialmente?
Uso comercial é permitido com condições. Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor. Sem distribuição de pesos; uso sujeito aos termos do provedor.
Qual é a janela de contexto de MiMo-V2-Flash?
MiMo-V2-Flash suporta uma janela de contexto de 262K tokens.
Posso rodar MiMo-V2-Flash localmente?
Não — MiMo-V2-Flash é somente hospedado e acessado via API da Xiaomi. Há um equivalente open-weights disponível para auto-hospedagem — veja o link cruzado acima.
Em que MiMo-V2-Flash é melhor?
MiMo-V2-Flash é bem adequado para chat e roteamento de baixa latência, roteamento e triagem de requisições, classificação de texto.
Como uso MiMo-V2-Flash no osFoundry?
Cole sua chave de API da Xiaomi no diálogo de chaves (ou implante os pesos abertos para modelos auto-hospedáveis), atribua MiMo-V2-Flash a um papel do Maestro na aba Pipeline e use-o em chats, em Room Apps via invokeAI ou nos seus próprios apps.
Publicado pela Xiaomi em 14 de dezembro de 2025. Fonte: https://openrouter.ai/xiaomi/mimo-v2-flash