最新GLove词向量预训练文件国内服务器下载

news/2025/2/6 2:51:03/
  • 试过去斯坦福官方网址(https://nlp.stanford.edu/projects/glove/)下Glove的同学就知道有多痛苦… 真的要多慢有多慢

  • 使用国内服务器几分钟下完 glove.840B.300d.zip(2G)真香!!!

    在这里插入图片描述

国内服务器地址:

  • 直接进去没什么东西的 https://apache-mxnet.s3.cn-north-1.amazonaws.com.cn

预训练文件下载地址:

  • 格式:https://apache-mxnet.s3.cn-north-1.amazonaws.com.cn/gluon/embeddings/glove/ + 对应的Glove压缩文件名

    1. 维基百科2014 + Gigaword 5(6B令牌,400K词汇,无章,50d,100d,200d和300d载体,822 MB下载):glove.6B.zip

      🌏国内下载:https://apache-mxnet.s3.cn-north-1.amazonaws.com.cn/gluon/embeddings/glove/glove.6B.zip

    2. 常见爬网(42B令牌,1.9M词汇,无框,300d向量,1.75 GB下载):glove.42B.300d.zip

      🌏国内下载:https://apache-mxnet.s3.cn-north-1.amazonaws.com.cn/gluon/embeddings/glove/glove.42B.300d.zip

    3. Common Crawl(840B令牌,2.2M词汇,套装,300d载体,2.03 GB下载):glove.840B.300d.zip

      🌏国内下载:https://apache-mxnet.s3.cn-north-1.amazonaws.com.cn/gluon/embeddings/glove/glove.840B.300d.zip

    4. Twitter(2B推文,27B令牌,1.2M词汇,无框,25d,50d,100d和200d向量,1.42 GB下载):glove.twitter.27B.zip

      🌏国内下载:https://apache-mxnet.s3.cn-north-1.amazonaws.com.cn/gluon/embeddings/glove/glove.twitter.27B.zip


http://www.ppmy.cn/news/202016.html

相关文章

【隧道篇 / SSL】(6.0) ❀ 02. 通过 SSL 访问 IPsec (中) ❀ FortiGate 防火墙

【简介】经常有人问可不可以通过SSL VPN到达某个防火墙,再通过防火墙与防火墙之间的IPsec VPN访问另一台防火墙后的电脑。这是可以做到的!为了做到这个功能,我们先要一步一步学习怎样配置SSL VPN。 配置环境 我们在广州有一台FortiGate 200D防…

情人节数码好物推荐,值得入手的四款数码好物分享

2023年首个情人节情人节马上要到了,在这个既传统又浪漫的节日里,各位有没有想好送什么样的礼物给自己的爱人呢?我想肯定很多人都在纠结这个事情,又怕买到不喜欢的好物,接下来小篇给大家推荐几款情人节必入数码好物礼物…

PyTorch在NLP任务中使用预训练词向量

在使用pytorch或tensorflow等神经网络框架进行nlp任务的处理时,可以通过对应的Embedding层做词向量的处理,更多的时候,使用预训练好的词向量会带来更优的性能。下面分别介绍使用gensim和torchtext两种加载预训练词向量的方法。 1.使用gensim加…

【隧道篇 / IPsec】(5.6) ❀ 05. 向导快速建立点对多IPsec ❀ FortiGate 防火墙

【简介】前面我们已经会用向导建立点对点的IPSec了,点对多的IPsec又是怎么回事呢? 点对多 VPN 如果一家企业有多家分公司,总部需要和分公司建立IPsec VPN连接,理论上来说有多少家分公司,总部就要建立多少条点对点的连接…

零宽字符隐写——2021网刃杯CTF 签到

0x01 零宽字符 零宽度字符是一些不可见的,不可打印的字符。它们存在于页面中主要用于调整字符的显示格式,下面就是一些常见的零宽度字符及它们的unicode码和原本用途: 零宽度空格符 (zero-width space) U200B : 用于较长单词的换行分隔零宽…

HTML提供了5种空格表示

HTML提供了5种空格实体(space entity),它们拥有不同的宽度,非断行空格( )是常规空格的宽度,可运行于所有主流浏览器。其他几种空格(       ‌…

常用的中文预训练模型、预训练词向量下载地址收藏

中文预训练模型下载 原版:https://huggingface.co/models Google原版bert:https://github.com/google-research/bert 中文XLNET预训练模型:https://github.com/ymcui/Chinese-XLNet (只有TensorFlow需转化) or https…

【Python】Python系列教程-- Python3 列表(十三)

文章目录 前言访问元组修改元组删除元组元组运算符元组索引,截取元组内置函数关于元组是不可变的 前言 往期回顾: Python系列教程–Python3介绍(一)Python系列教程–Python3 环境搭建(二)Python系列教程–…