NLP学习笔记十二-skip-gram模型求解

news/2024/10/31 3:17:19/

NLP学习笔记十一-skip-gram模型求解

上一篇文章,我们见到了skip-gram模型的原理,这里我们在陈述一下skip-gram模型其实是基于分布相似性原理来设计的,在skip-gram模型中,他认为一个词的内涵可以由他的上下文文本信息来概括,,那么基于这个原理,skip-gram模型设计了两个矩阵,一个是词向量表征矩阵,也就是这个向量中每一行代表了一个词的嵌入向量,也就是表征信息,又设计了一个表示词语在上下问中做背景词是的表征矩阵,在这个矩阵中每一行,表示一个词语做上下问词语时自己的表征信息。当一个词作为中心词,在乘以背景词表征矩阵,经过softmax处理,会得到一个向量,这个向量元素之和为1,向量长度为词语集合类别数,每个元素的值代表一个词语被选择的概率。当我们输入一个词语序列,我们会根据该词语序列计算2m次概率向量,因为窗口大小为m,也就是输入了2m个上下文词语,此时我们需要做的就是对两个矩阵进行更新,假设输入中心词的表征向量为 w I w_I wI,输入上下文文本词语的表征向量为 w O , 1 , w O , 2 , w O , 3 , , , , , , w O , C w_{O,1},w_{O,2},w_{O,3},,,,,,w_{O,C} wO,1,wO,2,wO,3,,,,,,wO,C
C=2m
那么此时损失函数如下:

在这里插入图片描述

这里很多人可能会疑惑,为什么是这样的所示函数,这里大家要注意啊,skip-gram模型是忽略位置信息影响的,也就是说skip-gram模型,他认为上下文中出现的词语,都是同等的概率出现的,也就是说,出现一个中心词,那么它可能对应出现的其实不是上下文文本信息,而是一个上下文词语集合,且集合中的词语没有相关性,那么就会得到上面一个公式,因为上下文词语没有位置顺序,没有相关性,那么
联合和概率就可以直接拆分:
如下:
P(a,b|c)=P(a|c)*P(b|c)

就是上面这个公式体现的原理。
然后就是使用BP算法求导更新中心词的表征向量为 w I w_I wI,和上下文文本词语的表征向量为 w O , 1 , w O , 2 , w O , 3 , , , , , , w O , C w_{O,1},w_{O,2},w_{O,3},,,,,,w_{O,C} wO,1,wO,2,wO,3,,,,,,wO,C

下面我们开始推到,并介绍相关概念:

首先看下面一个图片,下面图片其实就是得到中心词语的表征向量h,注h就是中心词的表征向量,大家要记住哈。后面还要用到。

在这里插入图片描述
再看下面一张图片: s j s_j sj就是中心词的表征向量h乘以背景词的表征向量 v w j v_{w_j} vwj得到的值,经过softmax转化就会变成对应背景词可能被选择的概率。

在这里插入图片描述

那么根据之前所说损失函数则就是下面这个表达式:

在这里插入图片描述
背景矩阵和中心词矩阵更新公式如下:

在这里插入图片描述

在这里插入图片描述
上面两个公式博主也推到了一下,确实是这样哈,就是正常推到就可以了。


http://www.ppmy.cn/news/393235.html

相关文章

连通性可预测深部脑刺激(DBS)对帕金森的疗效

深部脑刺激(DBS)对帕金森病(PD)的疗效可能取决于刺激部位与其他脑区之间的连通性,但是刺激哪些脑区,以及脑区间连通性是否能够预测患者的预后,仍然未知。在这里,我们确定了有效的DBS…

四甲基罗丹明二苯基环辛炔DBCO-TAMRA,TAMRA-DBCO,TAMRA DBCO与叠氮化合物通过无铜反应

英文名称:DBCO-TAMRA;TAMRA-DBCO 中文名称:四甲基罗丹明二苯基环辛炔 分子式:C54H57N5O10 分子量: 936.09 外观:深红色粉末 溶解性:DMSO, DMF, DCM, THF, Chloroform 纯度:>95% (HPLC) 结构式: 简介&#xf…

敏捷已死?

作者 | SCOTT MIDDLETON 译者 | 弯月 责编 | 王晓曼 出品 | CSDN(ID:CSDNnews) 敏捷运动从根本上改变了科技公司的运营方式,是Google、Facebook 和Airbnb 等一系列科技公司成功背后的核心推动力。然而,时隔二十年&…

5 Tamra Tyramide属于四甲基罗丹明 (TAMRA) 化物,5-四甲基罗丹明-酪酰胺

5-Tamra-Tyramide简述 TSA主要原理是利用酪胺Tyramide的过氧化物酶反应(酪胺盐在HRP催化H202下形成共价键结合位点),产生大量的酶促产物 该产物能与周围的蛋白残基(包括色氨酸、组氨酸和酪氨酸残基)结合,这样在抗原-结合部位就有大量的生物素沉积&…

Maleimide-PEG-Amine,马来酰亚胺PEG氨基,MAL-PEG2k-NH2用于造影剂

Maleimide-PEG-Amine,马来酰亚胺PEG氨基,MAL-PEG2k-NH2用于造影剂 马来酰亚胺-PEG-胺(Mal-PEG-NH2)是一种线性异双功能PEG试剂,通常用作交联剂或两种不同化学实体之间的间隔物。 MAL-PEG-NH2(PEG分子量为2000 Da,MAL是6-(马来酰亚胺基)己酸琥…

20位顶级设计师的桌面环境

摘要 对一个设计师来说,用来办公的桌面环境的重要性远远超过其他行业,那么看看包括 Dribbble 联合创始人和 Twitter 设计师等在内的 20 位英、美顶尖设计师他们的桌面环境都是怎样的吧。 对设计师来说,其办公时间绝大部分都是在办公桌前&…

钙通道阻滞剂/拮抗剂的应用

我们都知道钙、钾、钠离子对于维持个体内环境的重要性,离子通道一直是个有趣而复杂的话题。它们就像为某种物质专属定制的“门”或 VIP 通道,不仅分类繁多,还有着严密的“门控”机制。每个细胞都像一个电池,正常状态下&#xff0c…

nuc6i7kyk+linux+驱动,Intel 2016年最新版迷你PC!NUC Kit NUC6i7KYK 骷髅峡谷迷你PC!

英特尔? NUC 套件 NUC6i7KYK 配备第六代智能英特尔? 酷睿? i7 处理器和英特尔? 锐炬? Pro 显卡,为玩激烈的游戏释放最大性能。我们新创建了一个别出心裁的外观,加上重新设计的机箱,让您能充分利用四核处理器的每一个 Ghz,而毫…