Accueil / Glossaire / Reranking
What is Reranking?
Le reranking est une étape de deuxième passage dans le RAG qui réordonne les top-k chunks récupérés par pertinence par rapport à la requête, en utilisant un modèle dédié plus petit. Les pipelines RAG d’osFoundry incluent le reranking via les rerankers Voyage par défaut.
Detail
La récupération basée sur les embeddings est rapide mais grossière — elle retourne des chunks qui sont sémantiquement proches de la requête, mais les top-3 ne sont pas toujours les plus pertinents. Un reranker score chaque paire (requête, chunk) plus précisément (souvent en utilisant un cross-encoder), puis réordonne.
Le reranking ajoute 50-200 ms de latence mais améliore considérablement la précision top-3, en particulier sur le contenu technique avec un vocabulaire qui se chevauche. Coût courant : quelques centimes par million de tokens rerankés.
How osFoundry approaches Reranking
Le pipeline par défaut d’osFoundry effectue le reranking avec Voyage. Seuil et top-k configurables. BYOK vers Cohere ou n’importe quelle API de rerank.
Related terms
Related features