最近面试的时候,很多面试官问道了我项目中的一些评价指标的算法和原理,我觉得这确实也是一个很重要的内容,所以趁这个机会综合起来一块复习一下,在刷力扣的时候也不能忘记项目最常用的内容嘛。当然还包括一些深度学习的例如我项目中目标检测和nlp算法的我会在之后更新。
总体代码我已经放入代码库,大家自取哦,希望能给大家带来一些帮助。
--------------------------------------------------------
一、回归任务评价指标
均方误差 (MSE)
原理:衡量预测值与真实值之间差异的平方的平均值,越小表示模型越准确。
公式:
:
根均方误差 (RMSE)
原理:RMSE是MSE的平方根,提供与数据原始单位相同的误差度量。
公式:
平均绝对误差 (MAE)
原理:计算所有预测误差的绝对值并取平均,反映预测的准确性。
公式:
R² (决定系数)
原理:表示模型解释的变异比例,值在0到1之间,越接近1表示模型效果越好。
公式:
为残差平方和为总平方和
平均绝对百分比误差 (MAPE)
原理:计算误差的绝对值与真实值的比率的平均值,反映相对误差。
公式:
最大误差 (Max Error)
原理:表示预测值与真实值之间的最大绝对误差,反映模型在最坏情况下的预测能力。
公式:
二、分类任务评价指标
准确率 (Accuracy)
原理:正确预测的样本数量占总样本数量的比例。
公式:
其中,TP为真阳性,TN为真阴性。
精确率 (Precision)
原理:预测为正类的样本中,真正为正类的比例。
公式:
召回率 (Recall)
原理:实际为正类的样本中,正确预测为正类的比例。
公式:
F1-score
原理:精确率和召回率的调和平均数,综合考虑模型的准确性和完整性。
公式:
ROC曲线和AUC
原理:ROC曲线通过绘制真正率(TPR)和假正率(FPR)之间的关系来评估模型性能。AUC则表示曲线下面积,越大表示模型性能越好。
公式:
TPR: (TPR(真正率)和召回率(Recall)在二分类任务中是同义词,通常可以互换使用。它们都表示模型在所有实际为正类的样本中,正确预测为正类的比例。)
FPR:
以上所有的机器学习相关的代码我都传到了我的一个仓库里,各位大佬有需求的话可以去我的仓库查看感谢感谢