Início / Glossário / Reranking
What is Reranking?
Reranking é um passo de segunda passada em RAG que reordena os chunks top-k recuperados por relevância à consulta, usando um modelo dedicado menor. Os pipelines RAG do osFoundry incluem reranking via rerankers Voyage por padrão.
Detail
O retrieval baseado em embedding é rápido mas grosseiro — ele retorna chunks que são semanticamente próximos à consulta, mas os 3 primeiros nem sempre são os mais relevantes. Um reranker pontua cada par (consulta, chunk) com mais precisão (frequentemente usando um cross-encoder) e depois reordena.
Reranking adiciona 50-200 ms de latência mas melhora dramaticamente a precisão dos 3 primeiros, especialmente em conteúdo técnico com vocabulário sobreposto. Custo comum: alguns centavos por milhão de tokens reranqueados.
How osFoundry approaches Reranking
O pipeline padrão do osFoundry reranqueia com Voyage. Threshold e top-k configuráveis. BYOK para Cohere ou qualquer API de rerank.
Related terms
Related features