Главная / Глоссарий / RAG
What is Поиск с дополнением (Retrieval-Augmented Generation / RAG)?
Abbreviation: RAG
Retrieval-Augmented Generation (RAG) — это техника извлечения релевантного контекста из хранилища знаний во время запроса и включения его в LLM-промпт. Базы знаний osFoundry автоматически индексируются для RAG, и Maestro извлекает их при каждом релевантном чат-ходе.
Detail
RAG решает два ограничения LLM: устаревшие обучающие данные и ограниченное окно контекста. Вместо того чтобы пытаться вместить всё в промпт, вы извлекаете только чанки, релевантные запросу пользователя, и передаёте их.
Конвейер RAG обычно имеет этапы: запрос → эмбеддинг → векторный поиск → опциональное реранжирование → опциональная фильтрация → сборка контекста → вызов LLM. У каждого этапа есть настройки (модель эмбеддингов, top-k, реранкер, порог), которые влияют на качество и стоимость.
How osFoundry approaches Поиск с дополнением (Retrieval-Augmented Generation / RAG)
Конвейер RAG osFoundry полностью настраивается для каждого чат-пути в osStudio. Перетаскивайте этапы, выбирайте модели эмбеддингов и реранкеров, устанавливайте пороги. Разные интерфейсы (чат с кодом vs. customer-success) могут иметь разные конвейеры.
FAQ
Поддерживает ли osFoundry RAG?
Да — базы знаний автоматически индексируются, конвейеры поиска настраиваются в osStudio, и Maestro извлекает на каждом релевантном чат-ходе.
В чём разница между RAG и тонкой настройкой?
RAG извлекает внешние факты во время запроса. Тонкая настройка запекает новое поведение в веса модели. Они дополняют друг друга — RAG для фактов, тонкая настройка для стиля или специализированного рассуждения.
Могу ли я настроить конвейер RAG?
Да — для каждого чат-пути в osStudio. Разные этапы, модели, пороги для каждого сценария.
Related terms
Related features