首页 / 功能 / 运行任意模型 / 热切换 LoRA

在 osFoundry 上推理时热切换 LoRA 适配器

osFoundry 在单个基础模型上热切换 LoRA 适配器——无需重新加载，亚秒级切换。可在一个基础模型上堆叠多种人格、领域专家或微调技能，按请求路由。将服务 N 种专门化变体的成本从 N 个模型部署压缩为一个。

Quick answer

每个基础模型最多 16 个活动 LoRA 适配器。
亚秒级适配器切换——无需重新加载模型。
为一个基础模型付费，路由到多种专门化变体。
在 osFoundry 内训练的适配器会自动注册。

Frequently asked questions

我能热切换多少个适配器？

在单个端点上，每个基础模型最多 16 个活动适配器。

对在别处训练的适配器适用吗？

适用——上传 .safetensors 即可注册适配器。

Related features