Home / Features / Run any model / Hot-swap LoRA

osFoundry पर inference time पर LoRA adapters Hot-swap करें

osFoundry एक single base model पर LoRA adapters को hot-swaps करता है — कोई reload नहीं, sub-second switch। एक base model के शीर्ष पर कई personas, domain experts, या fine-tuned skills को stack करें और per request route करें। N specialised variants serve करने की cost को N model deployments से एक तक Cuts करता है।

Quick answer

प्रति base model 16 active LoRA adapters तक।
Sub-second adapter switch — कोई model reload नहीं।
एक base model के लिए Pay करें, कई specialised variants पर route करें।
osFoundry के अंदर trained Adapters auto-registered हैं।

Frequently asked questions

मैं कितने adapters hot-swap कर सकता हूँ?

एक single endpoint पर प्रति base model 16 active adapters तक।

क्या यह कहीं और मेरे train किए adapters के साथ काम करता है?

हाँ — .safetensors upload करें और adapter registered है।

Related features