什么是平均倒数排名 (MRR)? 平均倒数排名 (MRR) 是一种用于评估返回排名结果的系统(例如搜索引擎或推荐模型)的性能的指标。 它衡量系统在结果列表中定位第一个正确答案的效果。 具体来说,MRR 计算多个查询中第一个相关结果出现的排名的倒数(即,逆数)的平均值。 例如,如果查询的正确答案排名第一,则倒数为 1/1 = 1。如果排名第三,则倒数为 1/3 ≈ 0.33。 MRR 对所有查询中的这些值求平均值,从而为正确答案较早出现的结果赋予更高的权重。
示例和计算 假设您使用三个查询测试搜索引擎。 对于查询 1,正确的结果排名第一(倒数 = 1)。 对于查询 2,正确的结果排名第三(倒数 = 1/3)。 对于查询 3,正确的结果排名第二(倒数 = 1/2)。 MRR 是这些倒数的平均值:(1 + 0.33 + 0.5) / 3 ≈ 0.61。 这意味着该系统平均将第一个正确答案放在结果的顶部附近,但不是完美的。 当至少一个正确结果的存在最重要时,例如在用户期望快速获得答案的问答系统中,MRR 特别有用。
应用场景和局限性 MRR 广泛用于信息检索和推荐任务中,其目标是尽早呈现最相关的项目。 例如,在从知识库检索答案的聊天机器人中,MRR 可以衡量正确答案首次出现的频率。 但是,MRR 存在局限性:它忽略了第一个正确答案之外的多个正确结果的存在,并且不会惩罚在第一个正确答案之后返回不相关结果的系统。 诸如平均精度均值 (MAP) 或标准化折扣累积增益 (NDCG) 之类的指标更适合评估多相关性场景,但 MRR 仍然是用于单相关性应用场景的简单有效的工具。