基于GPT-2的跨模态知识迁移:时序任务代码实战

embedded/2024/12/25 2:25:16/

GPT2预训练LM下载地址: https://huggingface.co/openai-community/gpt2

论文数据集下载:https://pan.baidu.com/s/1v5qPwgpZwIZ4_E0TeKGiig 提取码:95hh

在上一篇文章中,我对GPT-2的跨模态知识迁移到时序任务论文进行了详细解读。具体文章链接:跨模态知识迁移:基于预训练语言模型的时序数据建模

今天,我想对GPT-2的跨模态知识迁移到时序任务代码就行解读。开始解读之前,我先对GPT-2的跨模态知识迁移到时序任务论文进行简单介绍。

基于GPT2时序任务,采用的架构如图2所示。利用来自NLP预训练transformer模型的参数进行时间序列分析,重点使用GPT2模型(Radford等,2019)。作者还实验了其他模型,如BERT(Devlin等,2019)和BEiT(Bao等,2022),以进一步展示跨领域知识迁移的普适性在广泛的预训练模型中都存在。

1. 核心代码

下面是加载GPT-2预训练语言模型脚本,只取 GPT-2的前6层。论文中实验部分是冻结 GPT-2大部分参数,仅保留层归一化和位置编码相关的参数可训练。

请将下面代码中的 "/pretrained_models/gpt2"替换为你本地的 GPT-2 预训练模型路径。有关 GPT-2 模型权重的下载地址,可参考文章开头提供的链接。

# 加载预训练的 GPT-2模型,仅保留前6层
self.gpt2 = GPT2Model.from_pretrained('/pretrained_models/gpt2',output_attentions=True,output_hidden_states=True)self.gpt2.h = self.gpt2.h[:6] # 截取 GPT-2的前6层# 冻结 GPT-2大部分参数,仅保留层归一化和位置编码相关的参数可训练
for i, (name, param) inenumerate(self.gpt2.named_parameters()):if 'ln' in name or 'wpe' in name:param.requires_grad = Trueelse:param.requires_grad = False

完整文章链接:基于GPT-2的跨模态知识迁移:时序任务代码实战


http://www.ppmy.cn/embedded/148503.html

相关文章

蓝桥杯刷题——day9

蓝桥杯刷题——day9 题目一题干解题思路一代码解题思路二代码 题目二题干解题思路代码 题目一 题干 小蓝最近在研究一种浮点数的表示方法:R格式。对于一个大于0的浮点数d,可以用R格式的整数来表示。给定一个转换参数n,将浮点数转换为R格式整…

moviepy将图片序列制作成视频并加载字幕 - python 实现

DataBall 助力快速掌握数据集的信息和使用方式,会员享有 百种数据集,持续增加中。 需要更多数据资源和技术解决方案,知识星球: “DataBall - X 数据球(free)” -------------------------------------------------------------…

音乐电影分享系统:数据驱动的内容推荐机制

为了保证所开发出来的系统质量过关,让所开发出来的系统具备可靠性并能够投入运行使用,这就需要进行系统开发的最后一个关键步骤,那就是系统测试。可以说系统测试就是对系统开发前面的步骤,比如系统分析与设计等进行复查。尽管在程…

实战一次基于Fiddler 进行抓包智能化数据集成与自动化接口交互

Fiddler 进行抓包智能化数据集成与自动化接口交互?通俗易懂来讲就是通过fiddler抓包接口,自动化监听抓包,拿到数据进行上传分析解析。 今天我们来通过fiddler 的FiddlerScript 脚本来实现接口的监听然后通过脚本过滤接口进行数据抓取后上传接…

IDEA自己常用的几个快捷方式(自己的习惯)

TOC 背景 换工作了, 新的IDEA, 又要重新设置自己的快捷方式了. 灵感 1.这些个性话的配置应该是可以导出的. 然后在新的IDEA直接导入就行了, 感觉应该是有这个功能. 就是这个文件: <keymap version"1" name"Personal KeyMap" parent"$default…

拦截器魔法:Spring MVC中的防重放守护者

目录 简介HandlerInterceptorAdapter vs HandlerInterceptor创建一个防重放拦截器注册拦截器路径模式匹配适配器模式的魅力总结 简介 在构建安全可靠的Web应用程序时&#xff0c;防止请求重放攻击是一项关键任务。当用户或系统发出的请求被恶意第三方捕获并重复发送给服务器…

MySQL InnoDB 存储引擎详解

InnoDB 是 MySQL 中最常用、最强大的存储引擎之一&#xff0c;其支持事务、外键、行级锁等特性&#xff0c;非常适合对可靠性、并发性要求较高的场景。本文将详细解析 InnoDB 的核心特性、内部机制以及使用场景&#xff0c;帮助你更好地理解和优化 MySQL 数据库。 1. 为什么选择…

【漏洞复现】CVE-2022-45206 CVE-2023-38905 SQL Injection

漏洞信息 NVD - CVE-2022-45206 Jeecg-boot v3.4.3 was discovered to contain a SQL injection vulnerability via the component /sys/duplicate/check. NVD - CVE-2023-38905 SQL injection vulnerability in Jeecg-boot v.3.5.0 and before allows a local attacker to…