Mistral Small 3
Mistral Small 3 (Mistral AI, 2025) est un modèle chat à 24 milliards de paramètres . Compact 24B open-weights model. Tuned for low-latency chat and tool use with a permissive licence for commercial deployment.
by Mistral AI · 24 milliards de paramètres · fenêtre de contexte de 32K tokens
Idéal pour
- chat et routage à faible latence
- appel d'outils et de fonctions
- déploiement en périphérie sur GPU grand public
Comment utiliser Mistral Small 3 dans osFoundry
Connectez-vous avec votre propre clé (BYOK)
Ouvrez la fenêtre de clés et collez votre clé API Mistral AI. osFoundry détecte automatiquement Mistral Small 3 — assignez-le à un rôle Maestro (router, direct, orchestrator ou fallback) dans l'onglet Pipeline et il est actif dans chaque conversation. Votre clé, votre compte fournisseur — sans majoration sur les tokens.
Déployez un endpoint dédié
Mistral Small 3 est en open-weights — exécutez-le localement gratuitement, ou déployez un endpoint GPU dédié dans votre espace de travail pour disposer d'une capacité réservée sans limite de débit.
Utilisez-le dans une Room App
Les Room Apps déclarent leurs fonctionnalités IA dans leur manifeste, puis les appellent via invokeAI :
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Appelez-le depuis vos propres applications
Une fois un modèle intégré à votre espace de travail, vous pouvez l'héberger en tant qu'API et l'appeler depuis vos propres services, scripts ou CI — en dehors d'osFoundry.
Quel matériel peut faire tourner Mistral Small 3
Mistral Small 3 fonctionne sur un seul GPU grand public 16GB (~15 GB de VRAM avec marge pour le cache KV). L'inférence en pleine précision tient sur un seul H100 80GB en précision FP16 (~58 GB).
Mistral Small 3 face aux modèles similaires
Licence
Apache 2.0 — commercial use allowed — Autorise l'usage commercial, la modification, la distribution et la concession de brevets sans redevances.
Attribution requise (conservez les mentions de copyright et de licence).
Questions fréquentes sur Mistral Small 3
Mistral Small 3 est-il gratuit à utiliser ?
Mistral Small 3 est gratuit à exécuter localement sur votre propre matériel. L'accès hébergé via osFoundry est facturé à l'usage (entrée Free (local) / $ 0.10 /1M, sortie Free (local) / $ 0.30 /1M). Vous pouvez basculer entre local et hébergé à tout moment.
Puis-je utiliser Mistral Small 3 à des fins commerciales ?
Oui — l'usage commercial est autorisé. Autorise l'usage commercial, la modification, la distribution et la concession de brevets sans redevances. Attribution requise (conservez les mentions de copyright et de licence).
Quelle est la fenêtre de contexte de Mistral Small 3 ?
Mistral Small 3 prend en charge une fenêtre de contexte de 32K tokens.
Combien de VRAM faut-il pour Mistral Small 3 ?
Environ 15 GB en quantification Q4, ou 58 GB en pleine précision FP16. Tient sur un seul GPU grand public 24GB.
Puis-je exécuter Mistral Small 3 localement ?
Oui. Mistral Small 3 est en open-weights et s'exécute localement sur un GPU station de travail. Le runtime local d'osFoundry gère le chargement du modèle, la quantification et le routage.
À quoi Mistral Small 3 excelle-t-il ?
Mistral Small 3 convient particulièrement bien à chat et routage à faible latence, appel d'outils et de fonctions, déploiement en périphérie sur GPU grand public.
Comment utiliser Mistral Small 3 dans osFoundry ?
Collez votre clé API Mistral AI dans la fenêtre de clés (ou déployez les open weights pour les modèles auto-hébergeables), assignez Mistral Small 3 à un rôle Maestro dans l'onglet Pipeline, puis utilisez-le en chat, dans les Room Apps via invokeAI, ou dans vos propres applications.
Publié par Mistral AI le 30 janvier 2025.