【大模型学习】第十九章 什么是迁移学习

server/2025/3/15 13:32:58/

目录

1. 迁移学习的起源背景

1.1 传统机器学习的问题

1.2 迁移学习的提出背景

2. 什么是迁移学习

2.1 迁移学习的定义

2.2 生活实例解释

3. 技术要点与原理

3.1 迁移学习方法分类

3.1.1 基于特征的迁移学习(Feature-based Transfer)

案例说明

代码示例

3.1.2 基于模型的迁移(Model-based Transfer)

案例说明

BERT用于情感分析的例子

3.1.3 基于实例的迁移(Instance-based Transfer)

3.2 迁移学习的核心原理

4. 迁移学习架构

4.1 基本架构

4.2 源域与目标域的定义

4.3 知识迁移过程


1. 迁移学习的起源背景

1.1 传统机器学习的问题

        传统机器学习方法(如监督学习)通常假设训练数据(源域)与测试数据(目标域)‌独立同分布‌(i.i.d.),且需要满足以下条件:

  • 数据充足性‌:模型需依赖大量标注数据训练才能达到高性能。
  • 场景一致性‌:模型仅在训练数据分布的范围内有效,无法适应新分布的数据。

1.2 迁移学习的提出背景

        迁移学习(Transfer Learning)的提出旨在突破传统机器学习的限制,其核心思想是:‌将已学习的知识(模型、特征、参数等)从源任务(Source Task)迁移到目标任务(Target Task)‌,以降低对目标域数据量和标注质量的依赖。

关键驱动力‌:

  • 数据获取成本‌:标注数据昂贵(如医学图像需专家标注)。
  • 领域差异普遍性‌:现实场景中数据分布动态变化(如用户兴趣迁移、传感器差异)。
  • 模型泛化需求‌:避免在相似任务上重复训练模型,提升效率。

2. 什么是迁移学习

2.1 迁移学习的定义

        迁移学习是一种机器学习范式,通过从源域(Source Domain)中提取知识并应用于目标域(Target Domain),提升目标任务的模型性能,即使源域与目标域的数据分布或任务不同。

2.2 生活实例解释

实例1:学骑自行车 → 学电动车

  • 源任务‌:骑自行车(掌握平衡、转向)。
  • 目标任务‌:骑电动车(动力方式不同,但平衡技能可迁移)。
  • 迁移效果‌:减少学习电动车所需时间。

实例2:跨语言翻译

  • 源任务‌:训练英语-法语翻译模型。
  • 目标任务‌:德语-日语翻译。
  • 迁移方式‌:复用词向量表示或注意力机制等通用语言结构知识.

3. 技术要点与原理

3.1 迁移学习方法分类

3.1.1 基于特征的迁移学习(Feature-based Transfer)

核心思想‌:基于特征的迁移学习旨在将源域和目标域的数据映射到一个共同的特征空间,使得两个领域的特征分布尽可能相似。这样做的目的是为了消除领域差异,从而可以使用源域中的知识来帮助目标任务的学习。

主要方法:

  • 特征选择:这种方法试图识别那些在不同领域中保持不变的特征。例如,在图像处理中,边缘、纹理等低级特征可能在不同的图像集之间具有一定的共性。

  • 特征变换:通过特定的变换技术来对齐两个领域之间的特征分布。这包括传统的降维技术如主成分分析(PCA),以及更现代的方法如自动编码器(Autoencoders)或对抗网络(GANs)。深度学习模型,尤其是卷积神经网络(CNNs),常被用于提取高级特征表示。

案例说明

        以医学图像分类为例&


http://www.ppmy.cn/server/175169.html

相关文章

程序化广告行业(15/89):TD、流量供应方与流量方服务解析

程序化广告行业(15/89):TD、流量供应方与流量方服务解析 大家好!一直以来,我都对程序化广告行业充满兴趣,在深入学习的过程中积累了不少知识。今天就想把这些知识分享出来,和大家一起学习进步&…

HEC-HMS水文模型技术应用

HEC-HMS是美国陆军工程兵团水文工程中心开发的一款水文模型。HMS能够模拟各种类型的降雨事件对流域水文,河道水动力以及水利设施的影响,在世界范围内得到了广泛的应用。它有着完善的前后处理软件,能有效减轻建模的负担;能够与HEC开…

mysql select distinct 和 group by 哪个效率高

在有索引的情况下,SELECT DISTINCT和GROUP BY的效率相同;在没有索引的情况下,SELECT DISTINCT的效率高于GROUP BY‌。这是因为SELECT DISTINCT和GROUP BY都会进行分组操作,但GROUP BY可能会进行排序,触发filesort&…

使用PHP进行自动化测试:工具与策略的全面分析

使用PHP进行自动化测试:工具与策略的全面分析 引言 随着软件开发的复杂性不断增加,自动化测试已成为确保软件质量的关键环节。PHP作为一种广泛使用的服务器端脚本语言,拥有丰富的生态系统和工具支持,使其成为自动化测试的理想选…

【C++】类和对象

类的基本思想是数据抽象( d a t a a b s t r a c t i o n data\ abstraction data abstraction)和封装( e n c a p s u l a t i o n encapsulation encapsulation)。数据抽象是一种依赖于接口( i n t e r f a c e inte…

Day 64 卡玛笔记

这是基于代码随想录的每日打卡 参加科学大会(第六期模拟笔试) 题目描述 ​ 小明是一位科学家,他需要参加一场重要的国际科学大会,以展示自己的最新研究成果。 ​ 小明的起点是第一个车站,终点是最后一个车站。然…

JavaScript中的对象合并与更新:使用扩展运算符和对象字面量简写

JavaScript中的对象合并与更新:使用扩展运算符和对象字面量简写 在现代JavaScript开发中,处理对象的合并与更新是一项常见的任务。无论是构建用户界面、管理应用状态还是进行数据操作,我们经常需要基于现有对象创建新的对象,并对…

HarmonyOS开发 - 电商App实例三( 网络请求axios)

使用axios开发网络请求是一个非常常见的任务,尤其是Web前端开发者,对它非常熟悉。axios是一个基于Promise的HTTP客户端,支持浏览器和Node.js环境,使用简单且功能强大。 在harmonyOS中,如果想使用axios,可以…