Beranda / Fitur / Jalankan model apa pun / Hot-swap LoRA

Hot-swap adapter LoRA pada waktu inference di osFoundry

osFoundry hot-swap adapter LoRA pada satu base model — tanpa reload, pergantian sub-detik. Tumpuk beberapa persona, expert domain, atau skill fine-tuned di atas satu base model dan rutekan per request. Memotong biaya melayani N varian terspesialisasi dari N deployment model menjadi satu.

Quick answer

Hingga 16 adapter LoRA aktif per base model.
Pergantian adapter sub-detik — tanpa reload model.
Bayar satu base model, rutekan ke banyak varian terspesialisasi.
Adapter yang dilatih di dalam osFoundry otomatis terdaftar.

Frequently asked questions

Berapa banyak adapter yang dapat saya hot-swap?

Hingga 16 adapter aktif per base model pada satu endpoint.

Apakah ini bekerja dengan adapter yang saya latih di tempat lain?

Ya — upload .safetensors dan adapter terdaftar.

Related features