Lecture 11:How versatile are self-supervised models

news/2024/11/28 2:30:54/

目录

Story 1: Cross-lingual

Story 2: Cross-discipline

Story 3: Pre-training with artificial data


(story1和story2的内容在前面课程中有讲过,这里笔记部分不再详述)

Story 1: Cross-lingual

多语言BERT具有跨语言的能力,例如fine-tune在英文上,testing在中文上:

实验结果如下:

multilingual BERT不只是把不同语言同样意思的词汇对应在一起,它还存有语言的资讯

Story 2: Cross-discipline

self-supervised model不只有跨语言的能力,它还有跨学科的能力:

例如,用pre-train在英语上的BERT做DNA分类:

下图结果表明,在人类语言上pre-train,对于DNA的任务,在optimization和generalization上都有帮助:

跨学科的能力的应用举例——speech question answering:

上图中的model把speech question answering做起来,可以得到54 percent的F1 score。下图表格中绿色的线,代表先做语言辨识(把声音讯号转成文字),再在文字上面做question answering,它的正确率显然受到语音辨识正确率的影响。当语言辨识错误率为25%以上的时候,绿色线的F1 score就低于54 percent:

Story 3: Pre-training with artificial data

——在人造的资料上训练出BERT:

Pre-training on Artificial Data:

实验结果如下:

Pre-training on random tokens yields the same performance as training from scratch.——说明Data plays the role.


http://www.ppmy.cn/news/61847.html

相关文章

科普, API 是这么演变而来的

API,全称为 Application Programming Interface,中文翻译为应用程序编程接口,是为了方便应用程序之间的数据和功能交互而设计的一些标准方法。API 的使用让开发者能够快速、高效地构建应用程序,从而加速了应用程序的开发速度。在 …

如何升级npm 和 安装nvm 及 升级node.js

1.NPM如何升级? 1.1.可以使用NPM自带的命令进行升级: npm install -g npm 注:这个命令会安装最新的,安装到全局。 2.查看NPM版本 npm -v 注:要是版本过低,可使用上面所说命令进行升级。 3.怎么把node.js升…

[数据库系统] 一、添加常用约束(educoder)

1.任务:给表添加常用的约束。 2.相关知识 在数据库的使用过程中我们经常要限制属性的取值,比如有些属性不能为空,就需要添加非空约束,本关要求完成常用约束的添加和定义。 目录 (1)唯一约束 (2)添加非空约束 (3)使用默认约束…

基于numpy的鸢尾花数据获取、处理等操作。

这是搬运的。 Python 3 可信的 FileEditViewInsertCellKernelHelp 运行 代码标记原生 NBConvert标题- 《基于numpy的鸢尾花数据操作》 一、 实验准备 1.1 实验概述 我们本次实验将会使用的编程语言是Python,在本次实验当中我们将会使用结合我们学习过的numpy 中的知…

协众信息Web前端必备8个工具

1、Wappalyzer 这个工具可以让你了解到某个网站是用什么搭建的,即它的内容管理系统、电子商务平台或营销自动化工具。研究如何创建一个网站,这是一个很棒的工具。 它还创建了使用某些技术的网站列表,这些技术可以帮助你了解如何构建客户的…

创建一个react项目

文章目录 1:命令行输入2:在vs的终端中输入npm start 来启动项目3:删除src目录中的干扰项4:去掉index.js中的严格模式节点JSX介绍JSX中使用js表达式原生js调用三元运算符列表渲染条件渲染三元表达式逻辑&&运算 分支逻辑类名…

消息队列 (Message Queue)

消息队列 What 消息队列 是消息的队列;是消息的临时缓冲;是发布/订阅模式的兄弟;在多个进程/线程间实现异步通讯模式。 Why 消息队列在多个进程/线程中实现了异步通讯模式。 这里我们先介绍下同步消息处理。对于同步消息处理&#xff0…

第七章集合与字典作业

目录 1.字符串去重排序 2.列表去重 第3关 猜年龄 第4关 集合的属性、方法与运算 第5关 集合介绍 第6关 手机销售统计 第7关 集合添加元素 第8关 列表嵌套字典的排序 第9关 绩点计算 第10关 通讯录(MOD) 第11关 字典增加元素 第12关 字典的属性…