ホーム / 用語集 / RAG
What is RAG?
Abbreviation: RAG
RAG(Retrieval-Augmented Generation、検索拡張生成)は、クエリ時にナレッジストアから関連コンテキストを取得し、LLMプロンプトに含める手法です。osFoundryのナレッジベースはRAG向けに自動インデックス化され、Maestroは関連するチャット応答のたびにそこから取得します。
Detail
RAGはLLMの2つの限界、すなわち学習データの古さとコンテキストウィンドウの制約に対処します。すべてをプロンプトに詰め込む代わりに、ユーザーのクエリに関連するチャンクだけを取得して渡します。
RAGパイプラインは通常、クエリ → 埋め込み → ベクトル検索 → 任意のリランキング → 任意のフィルタリング → コンテキストの組み立て → LLM呼び出しという段階を持ちます。各段階には品質と費用に影響するつまみ(埋め込みモデル、top-k、リランカー、しきい値)があります。
How osFoundry approaches RAG
osFoundryのRAGパイプラインはosStudioでチャットパスごとに完全に設定可能です。ステージをドラッグし、埋め込みとリランカーモデルを選び、しきい値を設定します。異なる画面(コードチャット vs カスタマーサクセス)で異なるパイプラインを持てます。
FAQ
osFoundryはRAGをサポートしていますか?
はい。ナレッジベースは自動インデックス化され、リトリーバルパイプラインはosStudioで設定可能、Maestroは関連するチャット応答のたびに取得します。
RAGとファインチューニングの違いは?
RAGはクエリ時に外部の事実を取得します。ファインチューニングは新しい挙動をモデル重みに焼き付けます。両者は補完関係にあり、事実にはRAG、スタイルや特殊な推論にはファインチューニングが向きます。
RAGパイプラインはカスタマイズできますか?
はい。osStudioでチャットパスごとに、ステージ、モデル、しきい値をユースケースに合わせて設定できます。
Related terms
Related features