BERT系列模型

devtools/2025/3/19 19:54:29/

BERT系列模型

1 BERT模型介绍

1.1 BERT简洁

BERT是2018年10月由Google AI研究院提出的一种预训练模型.

  • BERT的全称是Bidirectional Encoder Representation from Transformers.
  • BERT在机器阅读理解顶级水平测试SQuAD1.1中表现出惊人的成绩: 全部两个衡量指标上全面超越人类, 并且在11种不同NLP测试中创出SOTA表现. 包括将GLUE基准推高至80.4% (绝对改进7.6%), MultiNLI准确度达到86.7% (绝对改进5.6%). 成为NLP发展史上的里程碑式的模型成就.

1.2 BERT架构

总体架构: 如下图所示, 最左边的就是BERT的架构图, 可以很清楚的看到BERT采用了Transformer Encoder block进行连接, 因为是一个典型的双向编码模型.
在这里插入图片描述

从上面的架构图中可以看到, 宏观上BERT分三个主要模块.

  • 最底层黄色标记的Embedding模块.
  • 中间层蓝色标记的Transformer模块.
  • 最上层绿色标记的预微调模块.

http://www.ppmy.cn/devtools/168424.html

相关文章

Leetcode 刷题笔记1 单调栈part01

leetcode 739 每日温度 对于单调栈问题,我觉得是在循环外部增加一些辅助项减少时间复杂度,但增加内存空间的利用 class Solution:def dailyTemperatures(self, temperatures: List[int]) -> List[int]:ans [0] * len(temperatures)stack []for i …

Redis常用数据类型和使用常见以及基本操作举例(适合初学者,以医药连锁管理系统为背景)

Redis的常见数据类型,包括String、Hash、List、Set、Zset等,这些数据类型都有各自的特点和适用场景。接下来,将这些数据类型与医药连锁管理系统的业务场景进行匹配。 String类型,适合存储单个值。在医药连锁管理系统中&#xff0…

C#语言的响应式设计

C#语言的响应式设计 引言 随着信息技术的不断发展,响应式设计已经成为现代软件开发中一个重要的设计理念。它不仅应用于前端开发,还逐渐扩展到后端开发以及各种编程语言中。C#语言作为一种强类型、面向对象的编程语言,逐渐在响应式设计的过…

2.git和github操作:diff链接

目录 1. 获取差异链接的核心方法方法 1:通过分支/提交比较生成链接(适用于 GitHub/GitLab/Bitbucket)方法 2:使用单次提交的差异链接(查看某次提交的改动)方法 3:通过 Pull Request(…

微服务即时通信系统---(五)框架学习

目录 ODB 介绍 安装 build2安装 odb-compiler安装 ODB运行时库安装 mysql和客户端开发包安装 boost profile库安装 总体打包安装 总体卸载 总体升级 头文件包含和编译时指明库 ODB常见操作介绍 类型映射 ODB编程 类与接口介绍 mysql连接池对象类 mysql客户端…

LabVIEW 线性拟合

该 LabVIEW 程序实现了 线性拟合(Linear Fit),用于计算给定一组数据点的斜率(Slope)和截距(Intercept),并将结果可视化于 XY Graph 中。本案例适用于数据拟合、实验数据分析、传感器…

RCore学习记录001

配置环境 我选择的操作系统环境是Ubuntu24.04的虚拟机 安装qemu7.0.0 安装依赖库 sudo apt-get install git libglib2.0-dev libfdt-dev libpixman-1-dev zlib1g-dev ninja-build build-essential git-email libaio-dev libbluetooth-dev libcapstone-dev libbrlapi-dev libb…

【c++】c++语言中““符号的用途介绍

c语言中,“&”符号有4种用途:逻辑与运算符、按位与运算符、取地址运算符、引用标识符。前三种作用在c语言和c语言中是共有的,而第4种作用是c中特有的。下边对这4种用途做个介绍。 一、几个相关的概念 1、运算符 c运算符是指用于执行程序…