Home / Features / Run any model / Hot-swap LoRA
osFoundry पर inference time पर LoRA adapters Hot-swap करें
osFoundry एक single base model पर LoRA adapters को hot-swaps करता है — कोई reload नहीं, sub-second switch। एक base model के शीर्ष पर कई personas, domain experts, या fine-tuned skills को stack करें और per request route करें। N specialised variants serve करने की cost को N model deployments से एक तक Cuts करता है।
Quick answer
- प्रति base model 16 active LoRA adapters तक।
- Sub-second adapter switch — कोई model reload नहीं।
- एक base model के लिए Pay करें, कई specialised variants पर route करें।
- osFoundry के अंदर trained Adapters auto-registered हैं।
Frequently asked questions
मैं कितने adapters hot-swap कर सकता हूँ?
एक single endpoint पर प्रति base model 16 active adapters तक।
क्या यह कहीं और मेरे train किए adapters के साथ काम करता है?
हाँ — .safetensors upload करें और adapter registered है।
Related features