Home / Glossary / RAG
What is Retrieval-Augmented Generation?
Abbreviation: RAG
Retrieval-Augmented Generation (RAG) query time पर एक knowledge store से relevant context fetch करने और इसे LLM prompt में शामिल करने की technique है। osFoundry की knowledge bases RAG के लिए auto-index करती हैं और Maestro हर relevant chat turn पर उनसे retrieve करता है।
Detail
RAG दो LLM limitations को संबोधित करता है: outdated training data और limited context window। हर चीज को prompt में fit करने की कोशिश करने के बजाय, आप user query के लिए केवल relevant chunks retrieve करते हैं और उन्हें pass करते हैं।
एक RAG pipeline में आमतौर पर stages होते हैं: query → embed → vector search → optional reranking → optional filtering → assemble context → LLM call। हर stage में knobs होते हैं (embedding model, top-k, reranker, threshold) जो quality और cost को affect करते हैं।
How osFoundry approaches Retrieval-Augmented Generation
osFoundry की RAG pipeline osStudio में प्रति chat path fully configurable है। Stages drag करें, embedding और reranker models pick करें, thresholds set करें। अलग surfaces (code-chat बनाम customer-success) में अलग pipelines हो सकती हैं।
FAQ
क्या osFoundry RAG को support करता है?
हाँ — knowledge bases auto-index करती हैं, retrieval pipelines osStudio में configurable हैं, और Maestro हर relevant chat turn पर retrieve करता है।
RAG और fine-tuning के बीच क्या अंतर है?
RAG query time पर external facts retrieve करता है। Fine-tuning model weights में नया behaviour bake करता है। वे complementary हैं — facts के लिए RAG, style या specialised reasoning के लिए fine-tuning।
क्या मैं RAG pipeline को customise कर सकता हूँ?
हाँ — osStudio में प्रति chat path। प्रति use case अलग stages, models, thresholds।
Related terms
Related features