Beranda / Fitur / Jalankan model apa pun / Hot-swap LoRA
Hot-swap adapter LoRA pada waktu inference di osFoundry
osFoundry hot-swap adapter LoRA pada satu base model — tanpa reload, pergantian sub-detik. Tumpuk beberapa persona, expert domain, atau skill fine-tuned di atas satu base model dan rutekan per request. Memotong biaya melayani N varian terspesialisasi dari N deployment model menjadi satu.
Quick answer
- Hingga 16 adapter LoRA aktif per base model.
- Pergantian adapter sub-detik — tanpa reload model.
- Bayar satu base model, rutekan ke banyak varian terspesialisasi.
- Adapter yang dilatih di dalam osFoundry otomatis terdaftar.
Frequently asked questions
Berapa banyak adapter yang dapat saya hot-swap?
Hingga 16 adapter aktif per base model pada satu endpoint.
Apakah ini bekerja dengan adapter yang saya latih di tempat lain?
Ya — upload .safetensors dan adapter terdaftar.
Related features