Kimi K2 Thinking
Kimi K2 Thinking (MoonshotAI, 2025) é um modelo de chat. Kimi K2 Thinking is Moonshot AI’s most advanced open reasoning model to date, extending the K2 series into agentic, long-horizon reasoning. Built on the trillion-parameter Mixture-of-Experts (MoE) architecture introduced in...
by MoonshotAI · janela de contexto de 262K tokens
Ideal para
- chat e roteamento de baixa latência
- roteamento e triagem de requisições
- classificação de texto
Como usar Kimi K2 Thinking no osFoundry
Conecte com sua própria chave (BYOK)
Abra o diálogo de chaves e cole sua chave de API da MoonshotAI. O osFoundry descobre Kimi K2 Thinking automaticamente — atribua-o a um papel do Maestro (router, direct, orchestrator ou fallback) na aba Pipeline e ele estará ativo em cada chat. Sua chave, sua conta no provedor — sem markup sobre tokens.
Use em um Room App
Os Room Apps declaram recursos de IA em seus manifestos e os chamam com invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Chame a partir dos seus próprios apps
Uma vez que um modelo está conectado ao seu workspace, você pode hospedá-lo como uma API e acessá-lo a partir dos seus próprios serviços, scripts ou CI — fora do osFoundry.
Execute Kimi K2 Thinking por conta própria
Kimi K2 Thinking também está disponível como open weights — auto-hospede para controle total dos dados e sem custo por token. Veja essa página para requisitos de GPU e uma comparação de custos com o preço da API.
Kimi K2 Thinking vs modelos semelhantes
| Modelo | Organização | Parâmetros | Contexto | Preço de entrada | Auto-hospedado |
|---|
| Kimi K2 Thinking | MoonshotAI | — | 262K | $ 0.600 /1M | Apenas API |
| Cogito v2.1 671B | Deep Cogito | — | 128K | $ 1.25 /1M | Apenas API |
| gpt-oss-safeguard-20b | OpenAI | — | 131K | $ 0.075 /1M | Apenas API |
| Olmo 3 32B Think | AllenAI | — | 66K | $ 0.150 /1M | Apenas API |
Licença
Hosted — usage subject to provider terms — Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor.
Sem distribuição de pesos; uso sujeito aos termos do provedor.
Perguntas frequentes sobre Kimi K2 Thinking
Quanto custa Kimi K2 Thinking?
Kimi K2 Thinking é cobrado a $ 0.600 /1M para entrada e $ 2.50 /1M para saída. Use sua própria chave de API da MoonshotAI — o osFoundry repassa o preço do provedor sem markup.
Posso usar Kimi K2 Thinking comercialmente?
Uso comercial é permitido com condições. Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor. Sem distribuição de pesos; uso sujeito aos termos do provedor.
Qual é a janela de contexto de Kimi K2 Thinking?
Kimi K2 Thinking suporta uma janela de contexto de 262K tokens.
Posso rodar Kimi K2 Thinking localmente?
Não — Kimi K2 Thinking é somente hospedado e acessado via API da MoonshotAI. Há um equivalente open-weights disponível para auto-hospedagem — veja o link cruzado acima.
Em que Kimi K2 Thinking é melhor?
Kimi K2 Thinking é bem adequado para chat e roteamento de baixa latência, roteamento e triagem de requisições, classificação de texto.
Como uso Kimi K2 Thinking no osFoundry?
Cole sua chave de API da MoonshotAI no diálogo de chaves (ou implante os pesos abertos para modelos auto-hospedáveis), atribua Kimi K2 Thinking a um papel do Maestro na aba Pipeline e use-o em chats, em Room Apps via invokeAI ou nos seus próprios apps.
Publicado pela MoonshotAI em 6 de novembro de 2025. Fonte: https://openrouter.ai/moonshotai/kimi-k2-thinking