62.合理使用预训练网络-1

news/2025/3/15 23:24:27/

62.1 什么是微调(fine-tune)

  • 微调(fine-tune),顾名思义指稍微调整参数即可得到优秀的性能,是迁移学习的一种实现方式。
    • 微调和从头训练(train from scratch)的本质区别在于模型参数的初始化,train from scratch通常指对网络各类参数进行随机初始化(当然随机初始化也存在一定技巧),随机初始化模型通常不具有任何预测能力,通常需要大量的数据或者特定域的数据进行从零开始的训练,这样需要训练到优秀的模型通常是稍困难的。
    • 而微调的网络,网络各类参数已经在其他数据集(例如ImageNet数据集)完成较好调整的,具备了较优秀的表达能力。
    • 因此,我们只需要以较小的学习速率在自己所需的数据集领域进行学习即可得到较为优秀的模型。
  • 微调通常情况下,无须再重新设计网络结构,预训练模型提供了优秀的结构,只需稍微修改部分层即可。
  • 在小数据集上,通常微调的效果比从头训练要好很多,原因在于数据量较小的前提下,训练更多参数容易导致过度拟合。

62.2 微调有哪些不同方法?

  • 以图像分类为例,通常情况下由于不同数据集需要的类别数不同,我们需要修改网络的输出顶层。这种情况下有两种微调方式:
    • 不冻结网络模型的任何层,对最后的改动层使用较大的学习率,对未改动层以较小的学习率进行训练全模型训练,进行多轮训练即可。即一步完成训练。
    • 冻结除了顶部改动层以外的所有层参数,即不对冻结部分的层

http://www.ppmy.cn/news/243341.html

相关文章

sms开发文档

sms系统设计参考毕业设计-----------学生选课管理系统的设计 一、使用axios 来实现网页中ajax请求 首先说到axios,是一个类库,他的底层基于ajax库,通常用于ajax请求 ajax又是什么 ajax是一种创建快速动态网页的技术, 传统的页…

幽默笑话-傻冒-猿粪啊

傻冒 一农夫在数高楼,一骗子过来:数几层了?罚款,每层5元。 农夫:15层。交了钱,旁观者说:傻冒。 农夫:他才傻呢,其实我数了18层。 猿粪…

程序员之间的幽默段子,句句都是经典

IT人表示屁股上还得纹一个</body> , 要不中间来个hello world!真正的程序员喜欢兼卖爆米花&#xff0c;他们利用CPU散发出的热量做爆米花&#xff0c;可以根据米花 爆裂的速度听出正在运行什么程序。 十年生死两茫茫&#xff0c;写程序&#xff0c;到天亮。 千行代码&…

幽默小笑话合集

假货的笑话 顾客&#xff1a;“你们卖的酒怎么没有酒味啊&#xff1f;” 服务员接过一闻&#xff1a;“啊&#xff0c;真对不起&#xff0c;忘记给您掺酒了。” ___ 并不是夸张 情景&#xff1a;一乘客在公汽上买票。 对话&#xff1a; 售票员&#xff1a;哪儿上的&#xff…

幽默笑话收集

1.某日&#xff0c;我在医院看病&#xff0c;忽然一位年轻妈妈怀里抱着一个可爱的小正太进了医院&#xff0c; 正太天真说&#xff1a;妈妈&#xff0c;我们来干嘛&#xff1f; 妈妈&#xff1a;打针啊~ 正太&#xff1a;干嘛要打针&#xff0c;针做错什么事了嘛&#xff1f; 针…

幽默笑话-笑话-还有菜吗等

&#xff11;、还有菜吗&#xff1f; 化学课上&#xff0c;老师讲解溶剂与溶质的关系&#xff1a; “一定的溶剂只能溶解一定的溶质。 比如说&#xff0c;你吃了一碗饭&#xff0c;又吃了一碗&#xff0c;第三碗吃下去已经饱了&#xff0c;你还能吃下去吗&#xff1f;” 有个学…

java土豪笑话_调侃土豪的段子 土豪笑话段子大全

调侃土豪的段子 土豪的十大特点&#xff1a;1、手机不贴膜&#xff1b; 2、吃泡面不喝汤&#xff1b; 3、喝酸奶不舔盖&#xff1b; 4、口香糖三粒一块嚼&#xff1b; 5、吃薯片不舔手指头&#xff1b; 6、去超市结账买塑料袋&#xff1b; 7、喝咖啡吃西餐不自拍&#xff1b; 8…

爬虫爬取幽默笑话

爬取网站为&#xff1a;http://xiaohua.zol.com.cn/youmo/ 查看网页机构&#xff0c;爬取笑话内容时存在如下问题&#xff1a; 1、每页需要进入“查看更多”链接下面网页进行进一步爬取内容每页查看更多链接内容比较多&#xff0c;多任务进行&#xff0c;这里采用线程池的方式&…