对于 RAG(检索增强生成)系统而言,可接受的检索器召回率范围通常在 80% 至 95% 之间,具体取决于应用领域。召回率衡量检索器找到所有解答问题所需相关文档的能力。一个旨在“大多数时候”正确回答问题的系统需要足够高的召回率,以免遗漏关键信息,但又不能过高,以免检索过多不相关的文档,从而可能混淆生成器。例如,一个通用问答系统可能目标召回率为 85-90%,以平衡覆盖范围和噪音。较低的召回率(如 80%)可能导致遗漏关键细节,而接近完美的召回率(95% 以上)通常需要权衡延迟或计算成本,因为需要检索更多文档。
领域要求对理想范围有很大影响。在医疗或法律等高风险领域,召回率应偏向高端(90-95%)。例如,用于诊断问题的医疗 RAG 系统必须检索所有相关的研究或指南,以避免有害的遗漏。相反,零售产品的客户支持聊天机器人可以容忍 80-85% 的召回率,因为遗漏细微的产品细节不太关键,响应可以回退到“联系支持”等选项。在软件文档等技术领域,85-90% 的召回率是实用的——确保找到大多数 API 参考,而不会用过时或不相关的代码示例淹没生成器。
实现选择也会影响可实现的召回率。仅使用密集向量搜索的系统可能达到 80-90% 的召回率,但将其与关键字搜索相结合(混合检索)可以将召回率推高到接近 95%,弥补语义相似性失败的情况。知识库的大小和结构也很重要:一个小型、组织良好的语料库(例如公司的内部文档)可以在检索文档较少的情况下实现更高的召回率,而一个庞大、非结构化的语料库(例如互联网规模的数据)可能需要调整以平衡速度和准确性。调整检索文档的数量(例如从 5 个到 20 个)和使用重排序器可以进一步优化针对特定用例的平衡。