首页 / 术语表 / RAG
What is 检索增强生成(Retrieval-Augmented Generation)?
Abbreviation: RAG
检索增强生成(RAG)是在查询时从知识库中提取相关上下文并纳入 LLM 提示的技术。osFoundry 的知识库会自动为 RAG 构建索引,Maestro 在每次相关的对话轮次中都会从中检索。
Detail
RAG 解决了 LLM 的两个局限:训练数据过时和上下文窗口有限。与其试图把一切都塞进提示,不如只检索与用户查询相关的分块并传入。
典型 RAG 流水线包括以下阶段:查询 → 嵌入 → 向量搜索 → 可选重排 → 可选过滤 → 组装上下文 → 调用 LLM。每个阶段都有旋钮(嵌入模型、top-k、重排器、阈值)会影响质量和成本。
How osFoundry approaches 检索增强生成(Retrieval-Augmented Generation)
osFoundry 的 RAG 流水线可在 osStudio 中按对话路径完整配置。拖拽阶段,挑选嵌入和重排模型,设置阈值。不同场景(代码对话 vs 客户成功)可使用不同流水线。
FAQ
osFoundry 支持 RAG 吗?
支持——知识库会自动建立索引,检索流水线可在 osStudio 中配置,Maestro 在每次相关的对话轮次中都会进行检索。
RAG 与微调有什么区别?
RAG 在查询时检索外部事实。微调则将新行为烙入模型权重。两者互补——RAG 用于事实,微调用于风格或专门化推理。
我能自定义 RAG 流水线吗?
可以——在 osStudio 中按对话路径自定义。可针对不同用例配置不同的阶段、模型和阈值。
Related terms
Related features