Mistral Small 3
Mistral Small 3 (Mistral AI, 2025) es un modelo de 24 mil millones de parámetros chat. Compact 24B open-weights model. Tuned for low-latency chat and tool use with a permissive licence for commercial deployment.
by Mistral AI · 24 mil millones de parámetros · ventana de contexto de 32K tokens
Ideal para
- chat y enrutamiento de baja latencia
- llamada a herramientas y uso de funciones
- despliegue en el borde con GPU de consumo
Formas de utilizar Mistral Small 3 en osFoundry
Conecten con su propia clave (BYOK)
Abran el diálogo de claves y peguen su clave de API de Mistral AI. osFoundry detecta Mistral Small 3 automáticamente: asígnenlo a un rol de Maestro (router, direct, orchestrator o fallback) en la pestaña Pipeline y quedará activo en cada chat. Su clave, su cuenta de proveedor: sin recargo por tokens.
Desplieguen un endpoint dedicado
Mistral Small 3 es de pesos abiertos: ejecútenlo localmente de forma gratuita o desplieguen un endpoint GPU dedicado en su workspace para disponer de capacidad reservada sin límites de tasa.
Úsenlo en una Room App
Las Room Apps declaran funciones de IA en su manifiesto y luego las invocan con invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Invóquenlo desde sus propias aplicaciones
Una vez que un modelo está integrado en su workspace, pueden alojarlo como API y consumirlo desde sus propios servicios, scripts o CI, fuera de osFoundry.
Qué hardware puede ejecutar Mistral Small 3
Mistral Small 3 se ejecuta en una sola GPU de consumo de 16GB (~15 GB de VRAM con margen para la caché KV). La inferencia a precisión completa cabe en una sola H100 80GB con precisión FP16 (~58 GB).
Mistral Small 3 frente a modelos similares
Licencia
Apache 2.0 — commercial use allowed — Permite uso comercial, modificación, distribución y concesión de patentes sin regalías.
Atribución obligatoria (conservar avisos de copyright y de licencia).
Preguntas frecuentes sobre Mistral Small 3
¿Es gratuito el uso de Mistral Small 3?
Mistral Small 3 se puede ejecutar gratis localmente en su propio hardware. El acceso alojado a través de osFoundry se mide (entrada Free (local) / $ 0.10 /1M, salida Free (local) / $ 0.30 /1M). Pueden alternar entre local y alojado en cualquier momento.
¿Puedo utilizar Mistral Small 3 comercialmente?
Sí, se permite el uso comercial. Permite uso comercial, modificación, distribución y concesión de patentes sin regalías. Atribución obligatoria (conservar avisos de copyright y de licencia).
¿Cuál es la ventana de contexto de Mistral Small 3?
Mistral Small 3 admite una ventana de contexto de 32K tokens.
¿Cuánta VRAM necesita Mistral Small 3?
Aproximadamente 15 GB con cuantización Q4, o 58 GB con precisión FP16 completa. Cabe en una sola GPU de consumo de 24GB.
¿Puedo ejecutar Mistral Small 3 localmente?
Sí. Mistral Small 3 es de pesos abiertos y se ejecuta localmente en una GPU de estación de trabajo. El runtime local de osFoundry gestiona la carga del modelo, la cuantización y el enrutamiento.
¿En qué destaca Mistral Small 3?
Mistral Small 3 es muy adecuado para chat y enrutamiento de baja latencia, llamada a herramientas y uso de funciones, despliegue en el borde con GPU de consumo.
¿Cómo se utiliza Mistral Small 3 en osFoundry?
Peguen su clave de API de Mistral AI en el diálogo de claves (o desplieguen los pesos abiertos para modelos autoalojables), asignen Mistral Small 3 a un rol de Maestro en la pestaña Pipeline y úsenlo en chat, en Room Apps mediante invokeAI o en sus propias aplicaciones.
Publicado por Mistral AI el 30 de enero de 2025.