BERT的基本理念

ops/2024/11/26 7:29:43/

BERT的基本理念

BERT的基本理念:

word2vec是一类生成词向量的模型的总称。这类模型多为浅层或者双层的神经网络,通过训练建立词在语言空间中的向量关系。

BERT是Bidirectional Encoder Representations from Transformers的缩写,意为多Transformer的双向编码器表示法,它是由谷歌发布的先进的嵌入模型。BERT是自然语言处理领域的一个重大突破,它在许多自然语言处理任务中取得了突出的成果,比如问答任务、文本生成、句子分类等。BERT成功的一个主要原因是,它是基于上下文的嵌入模型,这是它与其他流行的嵌入模型的最大不同,比如无上下文的word2vec 。

首先,让我们了解有上下文的嵌入模型和无上下文的嵌入模型之间的区别。请看以下两个句子。

句子A:He got bit by Python(他被蟒蛇咬了)

句子B:Python is my favorite programming language(Python是我最喜欢的编程语言)

阅读了上面两个句子后,我们知道单词Python在这两个句子中的含义是不同的。在句子A中,Python是指蟒蛇,而在句子B中,Python是指编程语言。

如果我们用word2vec这样的嵌入模型计算单词Python在前面两个句子中的嵌入值,那么该词的嵌入值在两个句子中都是一样的,这会导致单词Python在两个句子中的含义没有区别。因为word2vec是无上下文模型,所以它会忽略语境。也就是说,无论语境如何,它都会为单词Python计算出相同的嵌入值。

与word2vec不同,BERT是一个基于上下文的模型。它先理解语境,然后根据上下文生成该词的嵌入值。对于前面的两个句子,它将根据语境对单词Python给出不同的嵌入结果。这背后的原理是什么?BERT是如何理解语境的?下面让我们详细解答这些疑问。

首先来看句子A:He got bit by Python。BERT将该句中的每个单词与句子中的所有单词相关联,以了解每个单词的上下文含义。

具体地说,为了理解单词Python的上下文含义,BERT将Python与句子中的所有单词联系起来。

BERT可以通过bit这一单词理解句子A中的Python是用来表示蟒蛇的,如下图所示。

在这里插入图片描述

下面来看句子B:Python is my favorite programming language。同理,BERT将这句话中的每个单词与句子中的所有单词联系起来,以了解每个单词的上下文含义。所以,通过programming一词,BERT理解了句子B中的单词Python与编程语言有关,如下图所示。

在这里插入图片描述

由此可见,与word2vec等无上下文模型生成静态嵌入不同,BERT能够根据语境生成动态嵌入。


http://www.ppmy.cn/ops/136778.html

相关文章

微服务02

微服务02 1.网关路由 1.1.认识网关 什么是网关? 顾明思议,网关就是网络的关口。数据在网络间传输,从一个网络传输到另一网络时就需要经过网关来做数据的路由和转发以及数据安全的校验。 更通俗的来讲,网关就像是以前园区传达…

Python入门(13)--并发编程

Python并发编程:从入门到实践 🚀 1. 多线程编程基础 🧵 多线程是实现并发的重要方式,Python提供了threading模块来支持多线程编程。 1.1 基本线程操作 import threading import time from typing import List, Callableclass …

kafka如何知道哪个消费者消费哪个分区?

在Kafka中,消费者和分区之间的分配是通过一个称为“消费者组协调器”(Consumer Group Coordinator)的组件来管理的。 以下是Kafka如何确定哪个消费者消费哪个分区的步骤: 消费者加入消费者组: 当消费者启动时&#xf…

Java爬虫:数据采集的强大工具

引言 在信息爆炸的今天,数据已成为企业决策的重要依据。无论是市场趋势分析、用户行为研究还是竞争对手监控,都离不开对海量数据的收集和分析。Java作为一种成熟且功能强大的编程语言,其在数据采集领域——尤其是爬虫技术的应用——展现出了…

springmvc-04-Controller及RestFul

4. Controller及RestFul 4.1. 控制器Controller 控制器复杂提供访问应用程序的行为,通常通过接口定义或注解定义两种方法实现。控制器负责解析用户的请求并将其转换为一个模型。在Spring MVC中一个控制器类可以包含多个方法在Spring MVC中,对于Control…

打破局限,共创新章,BLE与LoRa的“混合双打”

随着现代物联网(IoT)技术的快速发展与普及,无线通信技术作为实现人与物、物与物之间无缝联通的底层支撑,正面临着更多“沟通”上的复杂需求。现阶段,使用单一无线通信技术来构建低功耗广域网络(LPWAN&#…

【机器学习】SVM原理详解

SVM支持向量机 1 概述 Support Vector Machine是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器 SVM学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超平面。如下图所示, w x b 0 wxb0 wxb0 即为分离超…

【漏洞复现】|爱数AnyShare智能内容管理平台Usrm_GetAllUsers信息泄露漏洞

漏洞描述 上海爱数信息技术股份有限公司自主研发的 AnyShare智能内容管理平台是一款软硬件一体化产品,主要面向企业级用户,提供非结构化数据管理方案。AnyShare基于私有云存储,为移动办公、桌面虚拟化、BYOD(自带设备办公&#xf…