Início / Glossário / RAG
What is Retrieval-Augmented Generation?
Abbreviation: RAG
Retrieval-Augmented Generation (RAG, ou Geração Aumentada por Recuperação) é a técnica de buscar contexto relevante em um repositório de conhecimento no momento da consulta e incluí-lo no prompt do LLM. As bases de conhecimento do osFoundry auto-indexam para RAG e o Maestro recupera delas em cada turno de chat relevante.
Detail
RAG aborda duas limitações de LLMs: dados de treinamento desatualizados e janela de contexto limitada. Em vez de tentar encaixar tudo no prompt, você recupera apenas os chunks relevantes para a consulta do usuário e passa esses.
Um pipeline RAG normalmente tem estágios: consulta → embed → busca vetorial → reranking opcional → filtragem opcional → montagem do contexto → chamada ao LLM. Cada estágio tem botões (modelo de embedding, top-k, reranker, threshold) que afetam qualidade e custo.
How osFoundry approaches Retrieval-Augmented Generation
O pipeline RAG do osFoundry é totalmente configurável por caminho de chat no osStudio. Arraste estágios, escolha modelos de embedding e reranker, defina thresholds. Diferentes superfícies (code-chat vs. customer-success) podem ter pipelines diferentes.
FAQ
O osFoundry suporta RAG?
Sim — bases de conhecimento auto-indexam, pipelines de retrieval são configuráveis no osStudio, e o Maestro recupera em cada turno de chat relevante.
Qual é a diferença entre RAG e fine-tuning?
RAG recupera fatos externos no momento da consulta. Fine-tuning embute novo comportamento nos pesos do modelo. São complementares — RAG para fatos, fine-tuning para estilo ou raciocínio especializado.
Posso personalizar o pipeline RAG?
Sim — por caminho de chat no osStudio. Diferentes estágios, modelos e thresholds por caso de uso.
Related terms
Related features