在机器学习中,过拟合和欠拟合是模型训练中常见的两种问题,它们反映了模型对数据的拟合程度及泛化能力的不足或过剩。
1. 什么是过拟合和欠拟合?
过拟合(Overfitting)
- 定义:模型对训练数据的学习过于深入,以至于连数据中的噪声或细节都被学到了,导致模型复杂度过高,泛化能力不足,在测试数据上表现不佳。
- 表现:
- 训练误差很低,但测试误差很高。
- 模型过于复杂,如高次多项式回归或过深的神经网络。
欠拟合(Underfitting)
- 定义:模型对训练数据的学习不足,无法捕捉数据的潜在规律,导致模型复杂度过低。
- 表现:
- 训练误差和测试误差都很高。
- 模型过于简单,如用线性模型拟合非线性数据。