Beranda / Glosarium / RAG
What is Retrieval-Augmented Generation?
Abbreviation: RAG
Retrieval-Augmented Generation (RAG) adalah teknik mengambil konteks relevan dari knowledge store pada waktu query dan memasukkannya ke prompt LLM. Knowledge base osFoundry otomatis terindeks untuk RAG dan Maestro mengambil dari mereka pada setiap turn chat yang relevan.
Detail
RAG mengatasi dua keterbatasan LLM: data training yang sudah usang dan context window terbatas. Alih-alih mencoba memasukkan segalanya ke prompt, Anda mengambil hanya chunk yang relevan dengan query pengguna dan memberikannya.
Pipeline RAG biasanya memiliki stage: query → embed → vector search → reranking opsional → filtering opsional → rakit konteks → panggil LLM. Setiap stage memiliki knob (model embedding, top-k, reranker, threshold) yang mempengaruhi kualitas dan biaya.
How osFoundry approaches Retrieval-Augmented Generation
Pipeline RAG osFoundry sepenuhnya dapat dikonfigurasi per chat path di osStudio. Drag stage, pilih model embedding dan reranker, atur threshold. Permukaan berbeda (code-chat vs customer-success) dapat memiliki pipeline berbeda.
FAQ
Apakah osFoundry mendukung RAG?
Ya — knowledge base otomatis terindeks, pipeline retrieval dapat dikonfigurasi di osStudio, dan Maestro mengambil pada setiap turn chat yang relevan.
Apa perbedaan antara RAG dan fine-tuning?
RAG mengambil fakta eksternal pada waktu query. Fine-tuning memanggang perilaku baru ke bobot model. Mereka saling melengkapi — RAG untuk fakta, fine-tuning untuk gaya atau reasoning terspesialisasi.
Bisakah saya menyesuaikan pipeline RAG?
Ya — per chat path di osStudio. Stage, model, threshold berbeda per use case.
Related terms
Related features