홈 / 용어집 / RAG
What is 검색 증강 생성 (Retrieval-Augmented Generation)?
Abbreviation: RAG
검색 증강 생성(RAG)은 쿼리 시점에 지식 저장소에서 관련 컨텍스트를 가져와 LLM 프롬프트에 포함시키는 기법입니다. osFoundry의 지식 베이스는 RAG를 위해 자동 색인되며, Maestro는 모든 관련 채팅 턴에서 이를 검색합니다.
Detail
RAG는 LLM의 두 가지 한계를 해결합니다: 오래된 학습 데이터와 제한된 컨텍스트 윈도우. 모든 것을 프롬프트에 욱여넣는 대신, 사용자 쿼리와 관련된 청크만 검색하여 전달합니다.
RAG 파이프라인은 일반적으로 다음 단계를 가집니다: 쿼리 → 임베딩 → 벡터 검색 → 선택적 재랭킹 → 선택적 필터링 → 컨텍스트 조립 → LLM 호출. 각 단계에는 품질과 비용에 영향을 미치는 다이얼(임베딩 모델, top-k, 재랭커, 임계값)이 있습니다.
How osFoundry approaches 검색 증강 생성 (Retrieval-Augmented Generation)
osFoundry의 RAG 파이프라인은 osStudio에서 채팅 경로별로 완전히 구성 가능합니다. 단계를 드래그하고, 임베딩 및 재랭커 모델을 선택하고, 임계값을 설정하십시오. 다양한 표면(코드 채팅 vs 고객 성공)은 서로 다른 파이프라인을 가질 수 있습니다.
FAQ
osFoundry는 RAG를 지원합니까?
예 — 지식 베이스는 자동 색인되고, 검색 파이프라인은 osStudio에서 구성 가능하며, Maestro는 모든 관련 채팅 턴에서 검색합니다.
RAG와 파인튜닝의 차이점은 무엇입니까?
RAG는 쿼리 시점에 외부 사실을 검색합니다. 파인튜닝은 새로운 동작을 모델 가중치에 통합합니다. 둘은 상호 보완적입니다 — 사실에는 RAG, 스타일이나 특화된 추론에는 파인튜닝을 사용합니다.
RAG 파이프라인을 맞춤 설정할 수 있습니까?
예 — osStudio에서 채팅 경로별로 가능합니다. 사용 사례별로 서로 다른 단계, 모델, 임계값을 설정할 수 있습니다.
Related terms
Related features