Duncan Leung

Duncan Leung https://www.duncanleung.com/blog 📚 Learning, 👨🏻‍💻 Building, 📝 Documenting... en-us duncan@leungs.email (Duncan Leung) duncan@leungs.email (Duncan Leung) Wed, 17 Jun 2026 00:00:00 GMT https://www.duncanleung.com/blog/rag-reranking-cross-encoder-recall-precision Reranking in RAG: Why Retrieval Needs a Second, Slower Opinion https://www.duncanleung.com/blog/rag-reranking-cross-encoder-recall-precision Vector search finds the right chunk but ranks it badly and waves through near-garbage that's vaguely on-topic. Reranking fixes that with a second model - a cross-encoder that reads the query and each chunk together instead of comparing two frozen vectors. The whole trick is affording an expensive judge by only running it on the cheap stage's survivors. Wed, 17 Jun 2026 00:00:00 GMT duncan@leungs.email (Duncan Leung) airagretrieval