BERT系列模型

devtools/2025/3/19 19:54:29/

BERT系列模型

1 BERT模型介绍

1.1 BERT简洁

BERT是2018年10月由Google AI研究院提出的一种预训练模型.

BERT的全称是Bidirectional Encoder Representation from Transformers.
BERT在机器阅读理解顶级水平测试SQuAD1.1中表现出惊人的成绩: 全部两个衡量指标上全面超越人类, 并且在11种不同NLP测试中创出SOTA表现. 包括将GLUE基准推高至80.4% (绝对改进7.6%), MultiNLI准确度达到86.7% (绝对改进5.6%). 成为NLP发展史上的里程碑式的模型成就.

1.2 BERT架构

总体架构: 如下图所示, 最左边的就是BERT的架构图, 可以很清楚的看到BERT采用了Transformer Encoder block进行连接, 因为是一个典型的双向编码模型.
在这里插入图片描述

从上面的架构图中可以看到, 宏观上BERT分三个主要模块.

最底层黄色标记的Embedding模块.
中间层蓝色标记的Transformer模块.
最上层绿色标记的预微调模块.

http://www.ppmy.cn/devtools/168424.html

Leetcode 刷题笔记1 单调栈part01

leetcode 739 每日温度对于单调栈问题，我觉得是在循环外部增加一些辅助项减少时间复杂度，但增加内存空间的利用 class Solution:def dailyTemperatures(self, temperatures: List[int]) -> List[int]:ans [0] * len(temperatures)stack []for i …

Redis常用数据类型和使用常见以及基本操作举例（适合初学者，以医药连锁管理系统为背景）

Redis的常见数据类型，包括String、Hash、List、Set、Zset等，这些数据类型都有各自的特点和适用场景。接下来，将这些数据类型与医药连锁管理系统的业务场景进行匹配。 String类型，适合存储单个值。在医药连锁管理系统中&#xff0…

C#语言的响应式设计

C#语言的响应式设计引言随着信息技术的不断发展，响应式设计已经成为现代软件开发中一个重要的设计理念。它不仅应用于前端开发，还逐渐扩展到后端开发以及各种编程语言中。C#语言作为一种强类型、面向对象的编程语言，逐渐在响应式设计的过…

2.git和github操作：diff链接

目录 1. 获取差异链接的核心方法方法 1：通过分支/提交比较生成链接（适用于 GitHub/GitLab/Bitbucket）方法 2：使用单次提交的差异链接（查看某次提交的改动）方法 3：通过 Pull Request（…

微服务即时通信系统---（五）框架学习

目录 ODB 介绍安装 build2安装 odb-compiler安装 ODB运行时库安装 mysql和客户端开发包安装 boost profile库安装总体打包安装总体卸载总体升级头文件包含和编译时指明库 ODB常见操作介绍类型映射 ODB编程类与接口介绍 mysql连接池对象类 mysql客户端…

LabVIEW 线性拟合

该 LabVIEW 程序实现了线性拟合（Linear Fit），用于计算给定一组数据点的斜率（Slope）和截距（Intercept），并将结果可视化于 XY Graph 中。本案例适用于数据拟合、实验数据分析、传感器…

配置环境我选择的操作系统环境是Ubuntu24.04的虚拟机安装qemu7.0.0 安装依赖库 sudo apt-get install git libglib2.0-dev libfdt-dev libpixman-1-dev zlib1g-dev ninja-build build-essential git-email libaio-dev libbluetooth-dev libcapstone-dev libbrlapi-dev libb…