多跳检索通过将复杂问题分解为更小的、循序渐进的步骤来提高 grounding 质量,这些步骤需要获取和验证中间事实。 系统不会试图一步回答问题,而是迭代地检索相关信息,使用每个步骤来构建一个事实链。 这种方法降低了模型“猜测”或编造未经支持的细节的可能性,因为答案的每个部分都必须与检索到的证据相符。 例如,要回答“当 X 公司 CEO 出生时,美国的通货膨胀率是多少?”,一个多跳系统会首先从可靠来源(例如公司简介)检索 CEO 的出生年份,然后查询经济数据集以获取该特定年份的通货膨胀率。 每个步骤都经过独立验证,从而使最终输出更值得信赖。
通过明确要求中间事实,多跳检索强制执行结构化的推理过程,从而限制了逻辑上的空白。 单步检索系统通常难以处理需要连接不同数据点的问题,从而导致依赖假设的答案。 例如,一个被问到“第一辆电动汽车的发明者是否也从事可再生能源专利工作?”的模型,可能会错误地假设历史人物之间存在联系,而没有验证时间线。 一个多跳系统会首先确定发明者(例如,1880 年代的托马斯·帕克),然后检查专利数据库中他在职业生涯中对可再生能源的贡献。 这种逐步验证可确保答案锚定于特定来源,而不是模糊的关联。
此外,多跳检索提高了透明度,使其更容易审计和调试输出。 开发人员可以追踪哪些文档促成了每个中间事实,从而可以识别检索或推理中的错误。 例如,如果一个系统回答“Y 书 的作者出生的那一年,哪个城市举办了奥运会?”,则可以单独验证中间步骤(作者的出生年份 → 当年奥运会的主办城市)。 这种粒度有助于捕捉检索到的文档可能过时或未对齐的情况(例如,使用来自未经证实的博客文章中的出生年份)。 通过隔离和验证每个跳跃,系统减少了对模型内部偏见或知识的依赖,从而产生更符合事实且不易捏造的答案。