Scene Graph 评测指标
paperreading
本文字数:1.2k 字 | 阅读时长 ≈ 4 min

Scene Graph 评测指标

paperreading
本文字数:1.2k 字 | 阅读时长 ≈ 4 min

再了解 Scene Graph 的评价指标时,首先要了解一下什么是 precision 和 recall

1. precision 和 recall

在信息检索和分类问题中,Precision(精确率)和 Recall(召回率)是两个非常重要的评估指标。

下面举个例子深入了解一下

假设我们有一个疾病检测系统,它对100个病人进行了测试,结果如下:

2. Recall@K

Recall@K是一个评估模型在推荐系统或信息检索系统中性能的指标,用来衡量系统能够找回用户感兴趣的项目的能力。具体来说,Recall@K表示在系统推荐的前K个项目中,有多少比例的相关项目被成功检索

计算方法

Recall@K的计算公式为:
Recall@K=Number of relevant items in top K recommendationsTotal number of relevant items

其中:

下面举个例子深入了解一下

假设一个用户对10个项目感兴趣,我们的系统需要从100个项目中推荐10个项目给这个用户。如果在系统推荐的前5个项目中(即K=5),有3个项目是用户实际感兴趣的,而用户总共感兴趣的项目是10个,则 Recall@5的计算如下:

Recall@5=310=0.3

这意味着在前5个推荐中,系统能够检索到用户感兴趣项目总数的30%。这个指标帮助我们了解系统在限定的推荐数量下的检索能力。

3. mR@K

Mean Recall@K (mR@K) 是一个评估模型在推荐系统或信息检索系统中性能的指标,特别是在处理多标签分类问题时。它衡量的是模型能够在前K个推荐中找到的相关项目的平均比例

计算方法

  1. Recall@K: 对于每个查询或样本,首先计算Recall@K。这是指在前K个推荐项中,正确推荐的项目数与该查询的所有相关项目总数的比例。公式为:
    Recall@K=Number of relevant items in top K recommendationsTotal number of relevant items

  2. Mean Recall@K (mR@K): 然后,对所有查询的Recall@K 取平均值,得到 Mean Recall@K。公式为:
    Mean Recall@K=ni=1Recall@Kin


    其中 (n) 是查询的总数。

下面举个例子深入了解一下

假设有一个系统需要推荐电影,我们有3个用户的推荐结果如下:

计算 Mean Recall@3:
Mean Recall@3=0.5+0.5+0.66730.556

这个值表明,平均而言,系统在前 3 个推荐中能找到大约 55.6%的相关电影。

5月 06, 2025
4月 27, 2025
ufw
4月 06, 2025
ufw