Home / Glossary / LLM
What is Large Language Model?
Abbreviation: LLM
Large language model (LLM) एक neural network है जो विशाल text corpora पर अगले token की भविष्यवाणी करने के लिए train किया जाता है, fluent natural-language output उत्पन्न करता है। osFoundry किसी भी provider से 100+ LLMs के बीच requests को route करता है — local, cloud, या self-hosted।
Detail
LLMs transformer-based neural networks हैं जो ~1B से लेकर 1T से अधिक parameters तक होते हैं। वे आज के अधिकांश chat, code generation, summarisation, translation, और agentic AI को power करते हैं। Quality training data, architecture, और post-training (RLHF, DPO) के आधार पर अलग-अलग होती है।
LLMs दो distribution modes में आते हैं: closed-source (केवल API के माध्यम से accessed — जैसे GPT-4, Claude) और open-weight (self-hosting के लिए downloadable — जैसे Llama, Mistral, Qwen)। osFoundry का catalog 76,000 open-weight models और 364 hosted API models को index करता है।
How osFoundry approaches Large Language Model
osFoundry हर LLM को एक interchangeable backend के रूप में मानता है। Hosted models के लिए अपनी API key लाएँ (BYOK); local inference के लिए open-weight models install करें; reserved capacity के लिए dedicated GPU endpoints deploy करें। Maestro उन rules के आधार पर per request route करता है जिन्हें आप osStudio में define करते हैं।
FAQ
osFoundry LLMs से कैसे related है?
osFoundry LLMs के ऊपर orchestration layer है। यह LLMs नहीं बनाता — यह आपको एक workspace से local, cloud, और self-hosted LLMs के बीच requests को route करने देता है।
कौन सा LLM सबसे अच्छा है?
हर चीज में कोई single LLM सबसे अच्छा नहीं है। osFoundry आपको प्रति workload अलग-अलग LLMs का A/B test करने और तदनुसार route करने देता है।
क्या मैं एक chat में कई LLMs उपयोग कर सकता हूँ?
हाँ। Maestro osStudio routing rules के आधार पर mid-conversation models switch कर सकता है।
Related terms
Related features