首页 / 术语表 / 重排
What is 重排(Reranking)?
重排是 RAG 中的二次处理步骤,使用更小的专用模型按查询相关性对检索到的 top-k 分块重新排序。osFoundry 的 RAG 流水线默认通过 Voyage 重排器进行重排。
Detail
基于嵌入的检索快速但粗糙——它返回语义上接近查询的分块,但 top-3 并不总是最相关的。重排器对每对(查询、分块)进行更精确的评分(通常使用交叉编码器),然后重新排序。
重排会增加 50 至 200 毫秒延迟,但能显著提升 top-3 精度,尤其是在词汇重叠较多的技术内容上。常见成本:每百万 token 重排几美分。
How osFoundry approaches 重排(Reranking)
osFoundry 的默认流水线使用 Voyage 进行重排。阈值和 top-k 可配置。可 BYOK 到 Cohere 或任何重排 API。
Related terms
Related features