精确率和召回率是用于评估信息检索 (IR) 系统(例如搜索引擎或推荐算法)性能的两个基本指标。精确率衡量检索到的结果中有多少实际上与用户的查询相关。例如,如果搜索引擎返回 10 个文档,其中 7 个相关,则精确率为 70%。另一方面,召回率衡量数据集中的总相关结果中有多少被成功检索到。如果整个数据集中有 20 个相关文档,而系统检索到其中的 8 个,则召回率为 40%。这些指标帮助开发人员评估系统是否返回准确的结果(精确率)以及是否捕获了全面的相关项目集(召回率)。
精确率和召回率的重要性取决于使用场景。在高精确率至关重要的场景中,呈现不相关的结果会损害用户的信任或效率。例如,在法律文件搜索系统中,寻找“版权侵权案件”的用户期望获得精确的结果,以避免筛选不相关的文档。相反,当错过相关结果会带来重大风险时,高召回率至关重要。在医学文献搜索工具中,未能检索到关键研究可能会导致不正确的诊断或错过的治疗。然而,通常存在一种权衡:增加召回率(例如,通过扩大搜索词)可能会通过包含更多不相关的结果来降低精确率,而收紧过滤器以提高精确率可能会排除相关项目。
为了平衡精确率和召回率,开发人员经常使用 F1 分数,它是这两个指标的调和平均值。例如,如果电子商务搜索功能需要展示热门产品和利基产品,则优化 F1 可以确保系统不会以牺牲另一个指标为代价来偏向一个指标。现实世界的系统也可能根据用户需求优先考虑一个指标。Web 搜索引擎可能会优先考虑精确率,以最大限度地减少第一页上的不相关结果,而科学论文存储库可能会强调召回率,以确保研究人员不会错过关键研究。了解这些指标使开发人员能够微调算法、调整排名参数或实施反馈循环(例如,用户点击)以迭代改进 IR 系统。