linux系统下载huggingface文件教程

ops/2024/10/20 21:26:30/

文章目录

  • 准备工作
    • 添加SSH Key
    • 生成Access Token
  • 模型下载
    • 公开模型下载(bert-base-chinese为例)
    • 非公开模型下载(Llama3为例)
      • 权限申请
      • 官网预训练模型下载
      • huggingface仓库下载

准备工作

添加SSH Key

# 本地机器生成ssh key
# step1:安装git
brew install git 
# step2:验证git是否成功下载
git version
# git version 2.31.1
# step3:配置账号(如已经配置,直接跳到step5)
git config --global user.email "你的邮箱"
# 一路回车,就不需要每次记密码了
# step4:生成公共密钥
ssh-keygen -t rsa 
# step5:查看密钥
cat ~/.ssh/id_rsa.pub

复制上述生成的密钥在huggingface网站中配置,进入settings->SSH and GPG Keys->Add SSH Key,添加生成的密钥即可;查看ssh是否正常链接

ssh -T git@hf.co
# Hi XXX, welcome to Hugging Face.

然后安装LFS:

git lfs install
  • 官方文档:添加SSH Key;

生成Access Token

进入settings->Access Tokens生成个人的Acces Token;

  • 官方文档:Access Token;

模型下载

公开模型下载(bert-base-chinese为例)

以bert-base-chinese为例:

# 先下载基础文件,跳过大文件
GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/google-bert/bert-base-chinese
# 然后逐个下载LFS大文件,记得把链接中的blob更改成resolve
sudo wget https://huggingface.co/bert-base-chinese/resolve/main/pytorch_model.bin  

在这里插入图片描述
在这里插入图片描述

非公开模型下载(Llama3为例)

权限申请

  • 进入官网申请权限,审核通过后即可进行模型下载,会收到审核通知的邮件,以Meta Llama3为例;
    • 官网申请:进入官网Meta-Llama ,填写基本信息,没有国内的选项,填写其他国家和学校,就能够申请成功;
    • huggingface申请:Meta-Llama-3-8B,填写对应表单,会得到通知邮件;

官网预训练模型下载

#  * 下载Llama3仓库:https://github.com/meta-llama/llama3
git clone git@github.com:meta-llama/llama3.git
# 进入llama3
cd llama3
# 运行download脚本
bash download.sh
# 填写邮箱或官网提供的链接
# Enter the URL from email: 你的私密链接
# 填写要下载的模型链接
# Enter the list of models to download without spaces (8B,8B-instruct,70B,70B-instruct), or press Enter for all: 你要下载的预训练模型

huggingface_61">huggingface仓库下载

  • hugginface安全性升级后,下载必须通过Access Token进行认证
# 跳过大文件下载基础文件
GIT_LFS_SKIP_SMUDGE=1 git clone https://你的名字:你的accesstoken@huggingface.co/meta-llama/Meta-Llama-3-8B
# 逐个下载大文件
# 1. 账户密码的方式下载(已经不支持了)
# sudo wget https://你的名字:你的密码@huggingface.co/meta-llama/Meta-Llama-3-8B/resolve/main/model-00001-of-00004.safetensors
# 2. access token的方式,记得把blob改成resolve
wget --header="Authorization: Bearer 你的token" https://huggingface.co/meta-llama/Meta-Llama-3-8B/resolve/main/model-00001-of-00004.safetensors

http://www.ppmy.cn/ops/15919.html

相关文章

前端开发禁用F12和右键检查元素处理

只需要对应的页面引入西面这个js文件就行(创建一个.js文件,将下面代码粘贴进去页面引用后使用) window.onload function () {document.onkeydown function () {var e window.event || arguments[0];//屏蔽F12if (e.keyCode 123) {return false;//屏蔽CtrlShiftI} else if …

Day51:动态规划 LeedCode 300.最长递增子序列 674. 最长连续递增序列 718. 最长重复子数组

300. 最长递增子序列 中等 相关标签 相关企业 给你一个整数数组 nums ,找到其中最长严格递增子序列的长度。 子序列 是由数组派生而来的序列,删除(或不删除)数组中的元素而不改变其余元素的顺序。例如,[3,6,2,7] …

代码随想录-算法训练营day23【二叉树09:修剪二叉搜索树、将有序数组转换为二叉搜索树、把二叉搜索树转换为累加树】

代码随想录-035期-算法训练营【博客笔记汇总表】-CSDN博客 第六章 二叉树part09今日内容:● 669. 修剪二叉搜索树 ● 108.将有序数组转换为二叉搜索树 ● 538.把二叉搜索树转换为累加树 ● 总结篇 详细布置 669. 修剪二叉搜索树 这道题目比较难,比 添…

2024深圳杯C题的8页思路分析+所有代码可执行+参考文献+持续更新参考论文(已经更新了代码与图像)

比赛题目的完整版思路可执行代码数据参考论文都会在第一时间更新上传的,大家可以参考我往期的资料,所有的资料数据以及到最后更新的参考论文都是一次付费后续免费的。注意:(建议先下单占坑,因为随着后续我们更新资料数…

Leetcode双指针刷题(一)

给你一个数组 nums 和一个值 val,你需要 原地 移除所有数值等于 val 的元素,并返回移除后数组的新长度。 不要使用额外的数组空间,你必须仅使用 O(1) 额外空间并 原地 修改输入数组。 元素的顺序可以改变。你不需要考虑数组中超出新长度后面…

TDengine高可用架构之TDengine+Keepalived

之前在《TDengine高可用探讨》提到过,TDengine通过多副本和多节点能够保证数据库集群的高可用。单对于应用端来说,如果使用原生连接方式(taosc)还好,当一个节点下线,应用不会受到影响;但如果使用…

什么是方法重载和重写,区别是什么?

面试题目 什么是方法重载?什么是方法重写?方法重载和重写有什么区别?返回值不同算不算方法重载? 这个是对Java基础知识的考察,但我们要掌握的是写重载和重写方法有什么好处,为什么要这样写? …

常见的几种垃圾回收器

什么是垃圾回收器,可以这样理解,垃圾回收算法是概念理论,对应JAVA中的接口,垃圾回收器就是具体的实现,JVM有很多垃圾回收器,它们实现了不同的垃圾回收算法,可以用在不同jdk版本,也适…