回归问题涉及预测连续数值,通常使用几种指标来评估模型性能。最常用的指标包括平均绝对误差(MAE)、均方误差(MSE)、均方根误差(RMSE)和 R 平方(R²)。每个指标都从不同角度衡量模型预测与实际值的吻合程度。例如,MAE 衡量预测值与真实值之间的平均绝对差值,而 MSE 则平方这些差值以强调较大的误差。RMSE 是从 MSE 推导而来,将误差缩放到原始数据单位。R² 量化了目标变量中由模型解释的方差比例。这些指标帮助开发者评估准确性、误差大小和模型拟合度。
MAE 和 MSE/RMSE 常结合使用以了解误差行为。MAE 的解释很直接——例如,如果房屋价格预测模型的 MAE 是 5,那么平均预测值与实际值相差 5000 美元(假设价格单位为千美元)。然而,MAE 对所有误差一视同仁,这可能会掩盖异常值的影响。MSE 通过平方误差,对较大偏差的惩罚更重。例如,一个单一的 10 的大误差会给 MSE 贡献 100,而两个 5 的误差各贡献 25(总计 50)。RMSE,即 MSE 的平方根,很有用,因为它与目标变量单位相同(例如,美元或米),这使得结果更容易沟通。在安全关键系统等较大误差特别不受欢迎的情况下,开发者通常更偏爱使用 RMSE。
R² 和平均绝对百分比误差(MAPE)提供了额外的背景信息。R² 衡量模型对数据方差的解释程度,范围从 0(没有解释力)到 1(完美拟合)。例如,R² 为 0.8 意味着目标变量中 80% 的方差被模型捕获。这对于比较不同数据集或规模的模型非常有用。MAPE 计算相对于实际值的平均百分比误差,这对于商业环境中相对误差比绝对值更重要的情况很有帮助。例如,销售预测中 10% 的 MAPE 表示预测值平均与实际销售值相差 10%。开发者根据问题的要求选择指标:MAE 用于简洁性,RMSE 用于对异常值的敏感性,R² 用于解释力,以及 MAPE 用于相对误差分析。