Sum of Squares Total (SST)
单个数据点(观测值)于响应变量的均值差的平方和。
Sum of Squares Regression (SSR)
预测值ŷi与响应变量均值差的平方和。
Sum of Squares Error (SSE)
预测值ŷi与观测值差的平方和。
R 2 = 1 − S S E / S S T = S S R / S S T R^2 = 1 - SSE/SST = SSR / SST R2=1−SSE/SST=SSR/SST
SST = SSE + SSR
SSE = 0 -> R2 = 1 模型是好的
SSE = SST -> R2 = 0 预测值等于平均值,这个模型完全没用,直接算平均值好了
SSE > SST -> R2 < 0 预测值还不如平均值
这里的R方,有个比较有趣的结论,是本人在调用sklearn后R方为负数情况下思考的。
sklearn应该计算方式用的是1-SSE/SST所以有负数,如果是用的SSR/SST只会是[0,1]的区间。