常见误区
⚠️ 常见踩坑
误以为"上下文窗口够大就能可靠读到所有内容"——容量不等于均匀利用率;也不要把所有检索片段无脑塞满窗口,应通过重排把关键证据放到首尾。
追问
追问 1:为什么扩大上下文窗口不能直接解决这个问题?
窗口大小决定"能放多少",而 Lost in the Middle 是"放进去能不能被有效利用"的问题。注意力的位置偏置和训练分布让中段信息利用率偏低,扩窗反而可能加重稀释,所以还需重排、压缩、分段等手段。
追问 2:在 RAG 场景如何具体重排检索结果?
先用 reranker 对召回片段精排打分,再按"首尾优先"重新排布:把得分最高的两三个片段分别放到上下文开头和结尾,次相关的放中间。同时控制片段数量、去重去冗余,避免无关内容稀释关键证据。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。
🛠️ AI 工具