pytorch nn.Embedding

news/2024/11/25 19:18:47/

pytorch nn.Embedding
class torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, norm_type=2, scale_grad_by_freq=False, sparse=False)

num_embeddings (int) - 嵌入字典的大小

embedding_dim (int) - 每个嵌入向量的大小

padding_idx (int, optional) - 如果提供的话,输出遇到此下标时用零填充

max_norm (float, optional) - 如果提供的话,会重新归一化词嵌入,使它们的范数小于提供的值

norm_type (float, optional) - 对于max_norm选项计算p范数时的p

scale_grad_by_freq (boolean, optional) - 如果提供的话,会根据字典中单词频率缩放梯度

weight weight (Tensor) -形状为(num_embeddings, embedding_dim)的模块中可学习的权值

输入: LongTensor (N, W), N = mini-batch, W = 每个mini-batch中提取的下标数
输出: (N, W, embedding_dim)

加载预训练模型
self.embed = nn.Embedding(vocab_size, embedding_dim)
self.embed.weight.data.copy_(torch.from_numpy(pretrained_embeddings))


1
2
3
4
embed = nn.Embedding.from_pretrained(feat)
1
加载glove
先将glove向量转换成Word2vec向量。然后使用gensim库导入。

'''转换向量过程'''
from gensim.test.utils import datapath, get_tmpfile
from gensim.models import KeyedVectors
# 已有的glove词向量
glove_file = datapath('test_glove.txt')
# 指定转化为word2vec格式后文件的位置
tmp_file = get_tmpfile("test_word2vec.txt")
from gensim.scripts.glove2word2vec import glove2word2vec
glove2word2vec(glove_file, tmp_file)

‘’‘’导入向量‘’‘’
# 加载转化后的文件
wvmodel = KeyedVectors.load_word2vec_format(tmp_file)
# 使用gensim载入word2vec词向量

vocab_size = len(vocab) + 1
embed_size = 100
weight = torch.zeros(vocab_size+1, embed_size)

for i in range(len(wvmodel.index2word)):
try:
index = word_to_idx[wvmodel.index2word[i]]
except:
continue
weight[index, :] = torch.from_numpy(wvmodel.get_vector(
idx_to_word[word_to_idx[wvmodel.index2word[i]]]))

 

#embed
embedding = nn.Embedding.from_pretrained(weight)

 

 

---------------------
作者:昕晴
来源:CSDN
原文:https://blog.csdn.net/qq_40210472/article/details/88995433
版权声明:本文为博主原创文章,转载请附上博文链接!


http://www.ppmy.cn/news/606275.html

相关文章

LeetCode简单题之Fizz Buzz

题目 给你一个整数 n ,找出从 1 到 n 各个整数的 Fizz Buzz 表示,并用字符串数组 answer(下标从 1 开始)返回结果,其中: answer[i] “FizzBuzz” 如果 i 同时是 3 和 5 的倍数。 answer[i] “Fizz” 如果…

chown:修改权限

参考文章:Linux 命令(31): chown 命令 功能:通过 chown 改变文件的拥有者和群组。在更改文件的所有者或所属群组时,可以使用用户名称和用户识别码设置。普通用户不能将自己的文件改变成其他的拥有者。其操作权限一般为…

[Spring MVC学习01] Spring MVC环境搭建以及工作流程了解

1.Spring MVC的初步了解1.1MVC是什么1.2 Spring MVC 是什么1.3Spring MVC可以帮我们做什么1.4工作原理2.Spring MVC环境搭建2.1开发环境2.2新建maven webapp2.3pom.xml坐标添加2.4配置web.xml2.5springmvc.xml配置2.6页面控制器的编写2.7添加视图页面2.8启动Tomcat服务器2.9第一…

python 直接if判断和is not None的区别

tmpName if tmpName: print tmpName #没有输出 if tmpName is not None: print tmpName #有输出,是空行

LeetCode简单题之旋转字符串

题目 给定两个字符串, A 和 B。 A 的旋转操作就是将 A 最左边的字符移动到最右边。 例如, 若 A ‘abcde’,在移动一次之后结果就是’bcdea’ 。如果在若干次旋转操作之后,A 能变成B,那么返回True。 示例 1: 输入: A ‘abcde’, B ‘cdeab…

[Spring MVC学习02]URL地址映射

1.RequestMapping的介绍2.映射单个URL3.映射多个URL4.映射URL在控制器上5.RequestMapping的常用属性5.1value属性5.2method属性5.3params属性6.小结1.RequestMapping的介绍 通过RequestMapping,我们可以把请求地址和方法进行绑定的,可以在类、方法上进行…

LeetCode简单题之仅仅反转字母

题目 给定一个字符串 S,返回 “反转后的” 字符串,其中不是字母的字符都保留在原地,而所有字母的位置发生反转。 示例 1: 输入:“ab-cd” 输出:“dc-ba” 示例 2: 输入:“a-bC-dEf-…

cnetos上php项目平移服务器操作流程

有个阿里云linux服务器的php老项目这段时间并发量提高一段时间,想了个解决办法是申请了一个月的高性能服务器、旧i服务器镜像到新服务器,前端加个负载均衡,配置到新服务器上,然后需要在不大影响使用的情况下,切换到新服…