Kimi K2 Thinking
Kimi K2 Thinking (MoonshotAI, 2025) est un modèle chat . Kimi K2 Thinking is Moonshot AI’s most advanced open reasoning model to date, extending the K2 series into agentic, long-horizon reasoning. Built on the trillion-parameter Mixture-of-Experts (MoE) architecture introduced in...
by MoonshotAI · fenêtre de contexte de 262K tokens
Idéal pour
- chat et routage à faible latence
- routage et triage des requêtes
- classification de texte
Comment utiliser Kimi K2 Thinking dans osFoundry
Connectez-vous avec votre propre clé (BYOK)
Ouvrez la fenêtre de clés et collez votre clé API MoonshotAI. osFoundry détecte automatiquement Kimi K2 Thinking — assignez-le à un rôle Maestro (router, direct, orchestrator ou fallback) dans l'onglet Pipeline et il est actif dans chaque conversation. Votre clé, votre compte fournisseur — sans majoration sur les tokens.
Utilisez-le dans une Room App
Les Room Apps déclarent leurs fonctionnalités IA dans leur manifeste, puis les appellent via invokeAI :
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Appelez-le depuis vos propres applications
Une fois un modèle intégré à votre espace de travail, vous pouvez l'héberger en tant qu'API et l'appeler depuis vos propres services, scripts ou CI — en dehors d'osFoundry.
Exécutez Kimi K2 Thinking vous-même
Kimi K2 Thinking est également disponible en open weights — hébergez-le vous-même pour un contrôle total des données et zéro coût au token. Consultez cette page pour les prérequis GPU et une comparaison des coûts avec la tarification API.
Kimi K2 Thinking face aux modèles similaires
| Modèle | Organisation | Paramètres | Contexte | Prix en entrée | Auto-hébergement |
|---|
| Kimi K2 Thinking | MoonshotAI | — | 262K | $ 0.600 /1M | API uniquement |
| Cogito v2.1 671B | Deep Cogito | — | 128K | $ 1.25 /1M | API uniquement |
| gpt-oss-safeguard-20b | OpenAI | — | 131K | $ 0.075 /1M | API uniquement |
| Olmo 3 32B Think | AllenAI | — | 66K | $ 0.150 /1M | API uniquement |
Licence
Hosted — usage subject to provider terms — Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur.
Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Questions fréquentes sur Kimi K2 Thinking
Combien coûte Kimi K2 Thinking ?
Kimi K2 Thinking est facturé à $ 0.600 /1M en entrée et $ 2.50 /1M en sortie. Apportez votre propre clé API MoonshotAI — osFoundry répercute la tarification du fournisseur sans majoration.
Puis-je utiliser Kimi K2 Thinking à des fins commerciales ?
L'usage commercial est autorisé sous conditions. Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur. Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Quelle est la fenêtre de contexte de Kimi K2 Thinking ?
Kimi K2 Thinking prend en charge une fenêtre de contexte de 262K tokens.
Puis-je exécuter Kimi K2 Thinking localement ?
Non — Kimi K2 Thinking est uniquement hébergé et accessible via l'API MoonshotAI. Un équivalent en open-weights est disponible en auto-hébergement — voir le lien croisé ci-dessus.
À quoi Kimi K2 Thinking excelle-t-il ?
Kimi K2 Thinking convient particulièrement bien à chat et routage à faible latence, routage et triage des requêtes, classification de texte.
Comment utiliser Kimi K2 Thinking dans osFoundry ?
Collez votre clé API MoonshotAI dans la fenêtre de clés (ou déployez les open weights pour les modèles auto-hébergeables), assignez Kimi K2 Thinking à un rôle Maestro dans l'onglet Pipeline, puis utilisez-le en chat, dans les Room Apps via invokeAI, ou dans vos propres applications.
Publié par MoonshotAI le 6 novembre 2025. Source : https://openrouter.ai/moonshotai/kimi-k2-thinking