踩坑:
1.刚开始部署在自己的windows电脑上,semgrep不支持windows ,然后就换了linux服务器
2.服务器没有梯子,huggingface无法访问,模型数据集无法下载
解决方法:
使用huggingface镜像网站下载模型, 网站在这HF-Mirror
注意:llama模型的下载需要申请权限(或者使用 魔搭社区 来下载),申请大概在1h内就能通过,看帖子说地区尽量选国外,这里我选的Australia
额,第一次遇到需要权限才能下载的模型,卡了一会。。。
权限申请通过之后,点击huggingface右上角头像,点击Access Tokens,创建一个token,复制下来
接下来在服务器中接种镜像网站进行下载,详细参考hf-mirror教程
huggingface-cli
huggingface-cli 是 Hugging Face 官方提供的命令行工具,自带完善的下载功能。
1. 安装依赖
pip install -U huggingface_hub
Copy
2. 设置环境变量
Linux
export HF_ENDPOINT=https://hf-mirror.com
Copy
Windows Powershell
$env:HF_ENDPOINT = "https://hf-mirror.com"
Copy
建议将上面这一行写入 ~/.bashrc
。
3.1 下载模型
huggingface-cli download --resume-download gpt2 --local-dir gpt2
Copy
3.2 下载数据集
huggingface-cli download --repo-type dataset --resume-download wikitext --local-dir wikitext
Copy
补充:因为本模型需要权限,所以需要先登录一下
huggingface-cli login
然后把刚才的token输入即可安装上述教程下载、
3.数据集相关问题
由于服务器没法访问huggingface,我将数据集下载到了服务器本地。
这里记录下做的相关改动
补充:这里注意,要把下载的数据解压。。。。。。。。。这里没解压,以为是加载数据集方法的问题,又卡了一上午.....
4.为了能运行成功做的一些改动