1. **均方误差 (MSE)**: 衡量预测值与真实值之间差的平方的平均数。MSE 越小,表示模型的预测准确度越高。计算公式为:
\[ \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 \]
2. **均方根误差 (RMSE)**: 是 MSE 的平方根,提供了与原始数据相同单位的误差大小,直观上更容易理解。计算公式为:
\[ \text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2} \]
3. **平均绝对误差 (MAE)**: 衡量预测值与真实值之间差的绝对值的平均数。MAE 越小,表示模型预测的准确度越高。计算公式为:
\[ \text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i| \]
4. **R² (决定系数)**: 衡量模型对数据的拟合程度,取值范围为 0 到 1,越接近 1 表示模型的拟合程度越好。计算公式为:
\[ R^2 = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i - \bar{y})^2} \]
5. **平均绝对百分比误差 (MAPE)**: 提供预测值与真实值之间差异的百分比形式,常用于衡量预测精度。
在Python中,可以使用scikit-learn库中的相应函数来计算这些指标。例如:
```python
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
# 假设 y_true 是真实值,y_pred 是模型预测值
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
mse = mean_squared_error(y_true, y_pred)
mae = mean_absolute_error(y_true, y_pred)
r2 = r2_score(y_true, y_pred)
print(f'MSE: {mse}')
print(f'MAE: {mae}')
print(f'R²: {r2}')
```
这些指标可以帮助你评估模型的性能,并指导你进行模型的优化。