Mistral Small 3
Mistral Small 3(Mistral AI, 2025)是一款 24 十亿参数 对话模型。Compact 24B open-weights model. Tuned for low-latency chat and tool use with a permissive licence for commercial deployment.
by Mistral AI · 24B 参数 · 32K token 上下文窗口
最佳适用场景
- 低延迟对话与路由
- 工具调用与函数使用
- 消费级 GPU 边缘部署
在 osFoundry 中使用 Mistral Small 3 的方式
使用您自己的密钥接入(BYOK)
打开密钥对话框并粘贴您的 Mistral AI API 密钥。osFoundry 会自动发现 Mistral Small 3——在 Pipeline 标签中将其分配给 Maestro 角色(router、direct、orchestrator 或 fallback),即可在每次对话中启用。您的密钥、您的服务商账户——零 token 加价。
部署专属端点
Mistral Small 3 为开源权重模型——可在本地免费运行,或在您的工作区部署专属 GPU 端点以获得无速率限制的预留算力。
在 Room App 中使用
Room App 在 manifest 中声明 AI 功能,然后通过 invokeAI 调用:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
从您自己的应用中调用
模型接入工作区后,您可将其托管为 API,并从您自己的服务、脚本或 CI 中(osFoundry 之外)访问。
什么硬件可以运行 Mistral Small 3
Mistral Small 3 可在单张 16GB 消费级 GPU上运行(约 15 GB VRAM,含 KV-cache 余量)。全精度推理可在单张 H100 80GB 上以 FP16 精度运行(约 58 GB)。
Mistral Small 3 与同类模型对比
许可证
Apache 2.0 — commercial use allowed — 允许商业使用、修改、分发并提供专利授权,无需支付任何使用费。
需要署名(保留版权与许可证声明)。
关于 Mistral Small 3 的常见问题
Mistral Small 3 可以免费使用吗?
Mistral Small 3 在您自己的硬件上本地运行时可免费使用。通过 osFoundry 的托管访问按用量计费(输入 Free (local) / $ 0.10 /1M,输出 Free (local) / $ 0.30 /1M)。您可随时在本地与托管方式之间切换。
我可以将 Mistral Small 3 用于商业用途吗?
可以——允许商业使用。 允许商业使用、修改、分发并提供专利授权,无需支付任何使用费。 需要署名(保留版权与许可证声明)。
Mistral Small 3 的上下文窗口有多大?
Mistral Small 3 支持 32K token 的上下文窗口。
Mistral Small 3 需要多少 VRAM?
Q4 量化下约 15 GB,FP16 全精度下约 58 GB。可在单张 24GB 消费级 GPU 上运行。
我可以在本地运行 Mistral Small 3 吗?
可以。Mistral Small 3 为开源权重模型,可在工作站 GPU 上本地运行。osFoundry 的本地运行时负责模型加载、量化与路由。
Mistral Small 3 最擅长什么?
Mistral Small 3 非常适合低延迟对话与路由, 工具调用与函数使用, 消费级 GPU 边缘部署。
如何在 osFoundry 中使用 Mistral Small 3?
在密钥对话框中粘贴您的 Mistral AI API 密钥(若为可自托管的开源权重模型,则部署其权重),在 Pipeline 标签中将 Mistral Small 3 分配给某个 Maestro 角色,然后即可在对话、通过 invokeAI 的 Room App 或您自己的应用中使用。
由 Mistral AI 发布,发布日期 2025年1月30日。