1. CES上的真实故事
2. 数据增强
- 增加一个已有数据集,使得有更多的多样性
- 在语言里加入各种不同的背景噪音
- 改变图片的颜色和形状
例如,我们可以以不同的方式裁剪图像,使感兴趣的对象出现在不同的位置,减少模型对于对象出现位置的依赖。 我们还可以调整亮度、颜色等因素来降低模型对颜色的敏感度。 可以说,图像增广技术对于AlexNet的成功是必不可少的。
3. 使用增强数据训练
可以把这个看做是正则项,只是作用在训练的时候。
4. 翻转
5. 切割
6. 颜色
7. 几十种其他的方法
8. 总结
- 数据增广通过变形数据来获取多样性从而使得模型泛化性能更好
- 常见图片增广包括翻转、切割、变色
9. 一些Q&A
Q1: 理论上,是不是如果原始样本足够多,就不用做增广?
A1:是的,但是实际上不存在这种情况。因为图片多不代表多样性好,所以增广在一定意义上是有用的。
Q2: num_worker的值是不是根据机器GPU性能而设定?
A2: 是的。
Q3: 请问图片增广后需要一张一张确认是否有效吗?
A3: 不用一张张确认,大概看一下就行,就像在jupter notebook上打印一下看看就行
Q4: 多张图片叠加,是不是也是一种有效的增广方式?
A4: 是的,有一种叫mix-up的方式。
Q5: 如何理解多样性增加,但是分布不变?
A5: 可以认为增广不能改变均值但能改变方差,让方差变更大了。