数据回归价值分析(九道门回归模型中的评估指标)
回归是估计一个因变量与一个或多个自变量之间关系的过程。通过比较预测结果与实际结果之间的差异率来评估回归模型的性能。数据分析优质社群,等你加入哦~
残差错误率 = 预测值 - 实际值
本篇文章将涵盖各种回归模型评估指标,以及何时使用哪些指标!
▏均方误差
均值 平方 误差 = 实际值和预测值之间的平方差的均值。
均值 = 1 / n* i 到 n 的总和
平方误差 = (y - ŷ) ²
注意: MAE 的值越小,模型的性能就越好。
▏均方根误差 (RMSE)
根 均方误差,顾名思义,它是均方根值。
根 = √均方误差
注意: MAE 的值越小,模型的性能就越好。在性能方面:RMSE >MSE
▏平均绝对误差 (MAE)
平均值 绝对值 误差 = 实际值和预测值之间差值的平均值。
均值 = 1 / n * i 到 n 的总和
平方误差 = (yi - xi)
注意: MAE 的值越小,模型的性能就越好。在性能方面:RMSE = MAE
▏R² 分数
与其他指标不同,它可以用来查找目标值的预测值和实际值之间的差异。
此指标主要侧重于通过将模型与使用目标值的平均值构建的随机虚拟模型进行比较来对模型的优劣进行评分。
R² = 残差或误差之和(实际模型的残差)/平均总误差之和(随机模型的残差)
注意:当我们在数据集中添加不相关的特征时,问题就出现了,R²永远不会减少,因为它假设在添加更多数据时,增加了数据方差,而 R² 开始增加或保持不变。
▏调整后的 R²
调整后的 R² = 已修改以修复 R² 的缺点。
开发此指标的目的是通过惩罚不相关的特征来提供准确的结果,而不考虑特征数量及其相关性。
N = 数据集大小
p = 独立特征的数量
比较
- 如果比较不同线性回归模型之间的预测准度,则RMSE是更好的选择,因为它易于计算且可微分。
- 如果数据集具有异常值,选择 MAE 而不是 RMSE。
- 当数据集包含更多要素并且你需要选择最有效的要素时,将使用调整后的 R²。
- 在某种意义上,R² 和 MSE 是“等效的”,即任何一个具有最佳 R² 的模型也将具有最佳的 MSE ,反之亦然。
,
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com