Inicio / Glosario / RAG
What is Generación Aumentada con Recuperación?
Abbreviation: RAG
La generación aumentada con recuperación (RAG) es la técnica de obtener contexto relevante de un almacén de conocimiento en el momento de la consulta e incluirlo en el prompt del LLM. Las bases de conocimiento de osFoundry se indexan automáticamente para RAG y Maestro recupera de ellas en cada turno de chat relevante.
Detail
RAG aborda dos limitaciones de los LLMs: datos de entrenamiento desactualizados y ventana de contexto limitada. En lugar de intentar meter todo en el prompt, recuperan solo los chunks relevantes para la consulta del usuario y pasan esos.
Un pipeline RAG típico tiene etapas: consulta → embeber → búsqueda vectorial → reranking opcional → filtrado opcional → ensamblar contexto → llamar al LLM. Cada etapa tiene parámetros (modelo de embedding, top-k, reranker, umbral) que afectan a la calidad y al coste.
How osFoundry approaches Generación Aumentada con Recuperación
El pipeline RAG de osFoundry es totalmente configurable por ruta de chat en osStudio. Arrastren etapas, elijan modelos de embedding y reranker, fijen umbrales. Distintas superficies (code-chat vs. customer-success) pueden tener distintos pipelines.
FAQ
¿Soporta osFoundry RAG?
Sí: las bases de conocimiento se autoindexan, los pipelines de recuperación son configurables en osStudio y Maestro recupera en cada turno de chat relevante.
¿Cuál es la diferencia entre RAG y fine-tuning?
RAG recupera hechos externos en el momento de la consulta. El fine-tuning hornea nuevo comportamiento en los pesos del modelo. Son complementarios: RAG para hechos, fine-tuning para estilo o razonamiento especializado.
¿Puedo personalizar el pipeline RAG?
Sí, por ruta de chat en osStudio. Distintas etapas, modelos y umbrales por caso de uso.
Related terms
Related features