首页 / 功能 / 运行任意模型 / 热切换 LoRA
在 osFoundry 上推理时热切换 LoRA 适配器
osFoundry 在单个基础模型上热切换 LoRA 适配器——无需重新加载,亚秒级切换。可在一个基础模型上堆叠多种人格、领域专家或微调技能,按请求路由。将服务 N 种专门化变体的成本从 N 个模型部署压缩为一个。
Quick answer
- 每个基础模型最多 16 个活动 LoRA 适配器。
- 亚秒级适配器切换——无需重新加载模型。
- 为一个基础模型付费,路由到多种专门化变体。
- 在 osFoundry 内训练的适配器会自动注册。
Frequently asked questions
我能热切换多少个适配器?
在单个端点上,每个基础模型最多 16 个活动适配器。
对在别处训练的适配器适用吗?
适用——上传 .safetensors 即可注册适配器。
Related features