清华GLM部署记录

清华GLM部署记录

news/2024/10/17 15:27:09/

环境部署

首先安装anaconda（建议包管理比较方便）windows用户需手动配置一下环境变量，下面默认是在ubuntu环境说明
创建python环境，conda create -n your_env_name python=3.10 (注：官方是提供是python3.8，但目前主流用python3.10 因此使用python3.10. your_env_name 是可以自己命名的环境名字 )
导入需要的包，这里包版本的参考，在附件中的requirements.txt, 可以使用pip install -r requirements.txt

拉取github项目

git clone https://github.com/chatchat-space/langchain-ChatGLM.git
cd langchain-ChatGLM
启动webui：如果是ubuntu 可以直接运行命令
```
python webui.py 
```
启动api接口：如果是ubuntu 可以直接运行命令
```
python api.py
```
多卡启动，在命令前面指定CUDA_VISIBLE_DEVICES=0,1 类似这样如：
```
CUDA_VISIBLE_DEVICES=0,1,2,3 python api.py
```

可能遇到的问题

默认直接运行命令时，第一次将会从huggingface上下载模型，可能遇到网络连接的问题，解决方案如下：
- 重新运行，因为有断点重连，所以就不停的重新运行直到下完模型权重就行，默认地址为~/.cache/huggingface/hub/models–模型名称
- 打开huggingface，搜索要下载的模型，在Files and versions中将模型都下载到本地，目录结构为
  
  .
  └── 模型文件夹
  ├── added_tokens.json
  ├── config.json
  ├── configuration_codet5p_embedding.py
  ├── merges.txt
  ├── modeling_codet5p_embedding.py
  ├── pytorch_model.bin
  ├── special_tokens_map.json
  ├── tokenizer.json
  ├── tokenizer_config.json
  └── vocab.json
  
  然后在langchain-ChatGLM/config/model_config.py 中配置local_model_path 字段为模型文件夹所在的路径

更多说明

可以使用fastchat 部署做到模型和api在不同的服务器（或相同服务器）

参考连接 https://github.com/lm-sys/FastChat/blob/main/docs/openai_api.md#restful-api-server

http://www.ppmy.cn/news/1132074.html

相关文章

ubuntu安装ROS

ubuntu安装ROS

进官网，选版本，操作系统 ROS: Home 开始安装： noetic/Installation/Ubuntu - ROS Wiki Installation Configure your Ubuntu repositories Configure your Ubuntu repositories to allow "restricted," "universe,"…

阅读更多...

北京互联网公司、外企、国企大盘点

北京互联网公司、外企、国企大盘点

今天来盘点北京的泛互联网公司。涵盖了综合类、外企类、硬件类、电商类、游戏类、娱乐类、生活类、工具类、人工智能类、金融类、教育类、招聘类、汽车类、外包类、信息化类以及国企央企类等多个领域。综合类字节跳动美团百度阿里巴巴腾讯网易外企类微软谷歌亚马逊…

阅读更多...

wsl2 更新报错问题解决记录

wsl2 更新报错问题解决记录

1、问题 win10 中安装的 wsl2，启动 docker desktop 时提示 wsl2 有问题： 于是点击推荐的地址连接到微软，下载 wsl2 的更新文件。之后运行，又报错： 更新被卡住。 2、解决方法 WinR 输入 cmd 打开命令行窗口&#x…

阅读更多...

【Linux】 OpenSSH_7.4p1 升级到 OpenSSH_9.3p2（亲测无问题，建议收藏）

【Linux】 OpenSSH_7.4p1 升级到 OpenSSH_9.3p2（亲测无问题，建议收藏）

👨‍🎓博主简介 🏅云计算领域优质创作者 🏅华为云开发者社区专家博主 🏅阿里云开发者社区专家博主 💊交流社区：运维交流社区欢迎大家的加入！ 🐋 希望大家多多支…

阅读更多...

【HTTP 常用的状态码及使用场景】

【HTTP 常用的状态码及使用场景】

HTTP 常用的状态码及使用场景 HTTP常用的状态码有：HTTP状态码的使用场景： HTTP常用的状态码有： 1xx：信息提示 100：继续101：切换协议 2xx：成功 200：成功201：已创建202…

阅读更多...

当面试被问到jvm（Java虚拟机）时，如何将面试官引入自己的节奏？

当面试被问到jvm（Java虚拟机）时，如何将面试官引入自己的节奏？

本文目录前言快问快答抛砖引玉锦上添花好书推荐总结前言作为一名Java开发工程师，不管是校招还是社招jvm一定是必问必会的知识点。虽然说真正开发中用到的不多，甚至可以说用不到（对于刚入行或者Java初级），但是当面试…

阅读更多...

步进电机只响不转

步进电机只响不转

我出现问题的原因是相位线接错。我使用的滑台上示17H的步进电机，之前用的是57的步进电机。 57步进电机的相位线是A黑、A-绿、B红、B-蓝。 17步进电机的相位线是A红、A-绿、B黑、B-蓝。这两天被一个问题困扰了好久，在调试步进电机开发板的时候电机发生…

阅读更多...

Socket网络编程练习题五：客户端多用户上传文件（多线程版）并使用线程池管理线程

Socket网络编程练习题五：客户端多用户上传文件（多线程版）并使用线程池管理线程

题目想要服务器不停止，能接收很多客户上传的图片？我们知道是使用循环加多线程的方案来解决，但是如果频繁的创建和销毁线程，是非常浪费系统资源的，那应该怎么办呢？ 解决方案采用线程池，来管…

阅读更多...

最新文章