Home / Glossary / Reranking
What is Reranking?
Reranking RAG में एक second-pass step है जो एक smaller dedicated model का उपयोग करते हुए query से relevance के अनुसार top-k retrieved chunks को re-order करता है। osFoundry की RAG pipelines default रूप से Voyage rerankers के माध्यम से reranking शामिल करती हैं।
Detail
Embedding-based retrieval तेज़ है लेकिन coarse है — यह chunks return करता है जो semantically query के पास हैं, लेकिन top-3 हमेशा सबसे relevant नहीं होते। एक reranker प्रत्येक (query, chunk) pair को अधिक precisely score करता है (अक्सर cross-encoder का उपयोग करते हुए), फिर re-orders करता है।
Reranking 50-200 ms latency जोड़ता है लेकिन top-3 precision को dramatically improve करता है, विशेष रूप से overlapping vocabulary वाले technical content पर। Common cost: reranked प्रति million tokens कुछ cents।
How osFoundry approaches Reranking
osFoundry की default pipeline Voyage के साथ reranks करती है। Configurable threshold और top-k। Cohere या किसी भी rerank API के लिए BYOK।
Related terms
Related features