召回率衡量的是推荐系统识别并向用户呈现所有相关项目的能力。 简单来说,它回答了这个问题:*用户实际上会觉得有用的项目,系统成功包含在推荐中的有多少?* 例如,如果流媒体服务有 20 部用户会喜欢的电影,而系统推荐了其中 15 部,则召回率为 75%。 高召回率确保用户不会错过他们关心的项目,这对于建立信任和满意度至关重要。 如果没有足够的召回率,系统可能会忽略关键项目,从而导致用户体验分散或不完整。 这在电子商务或内容平台等领域尤其重要,在这些领域,用户希望有广泛的相关选项。
召回率通常与精度竞争,精度侧重于最小化无关的推荐。 例如,一个推荐 100 个项目(包括所有 20 个相关项目)的系统实现了完美的召回率,但如果大多数推荐没有帮助,则可能具有较低的精度。 相反,一个在 20 个项目中仅推荐 5 个高度相关项目的系统将具有高精度但召回率差。 开发人员必须根据用例平衡这些指标。 在新闻推荐中,高召回率可能优先考虑显示所有重要新闻,即使带有一些噪音。 相比之下,豪华零售平台可能会优先考虑精度,以避免无关产品使推荐变得混乱。 选择取决于目标是建议的广度(召回率)还是准确性(精度)。
召回率的实际实现需要定义“相关”的含义。 例如,在音乐应用程序中,相关性可能是用户重复收听、很少跳过或明确喜欢的曲目。 但是,随着大型项目目录的出现,计算召回率变得具有挑战性,因为检查所有可能的相关项目在计算上非常昂贵。 为了解决这个问题,开发人员通常会抽样项目子集或使用历史数据进行离线评估。 诸如协同过滤或混合模型(结合用户行为和项目元数据)之类的技术可以通过使推荐多样化来提高召回率。 例如,Netflix 可能会使用基于类型的过滤器以及观看历史记录,以确保不会忽略利基内容。 最终,召回率可以帮助开发人员确保他们的系统服务于用户的全部兴趣范围,而不仅仅是最明显的兴趣。