Inicio / Glosario / Reranking
What is Reranking?
El reranking es un paso de segunda pasada en RAG que reordena los top-k chunks recuperados por relevancia para la consulta, usando un modelo más pequeño y dedicado. Los pipelines RAG de osFoundry incluyen reranking vía rerankers de Voyage por defecto.
Detail
La recuperación basada en embeddings es rápida pero burda: devuelve chunks semánticamente cercanos a la consulta, pero los top-3 no siempre son los más relevantes. Un reranker puntúa cada par (consulta, chunk) con más precisión (a menudo usando un cross-encoder) y luego reordena.
El reranking añade 50-200 ms de latencia pero mejora dramáticamente la precisión del top-3, especialmente en contenido técnico con vocabulario solapado. Coste común: unos pocos céntimos por millón de tokens rerankeados.
How osFoundry approaches Reranking
El pipeline por defecto de osFoundry hace rerank con Voyage. Umbral y top-k configurables. BYOK a Cohere o cualquier API de rerank.
Related terms
Related features