清华GLM部署记录

news/2024/10/17 15:27:09/

环境部署

  1. 首先安装anaconda(建议包管理比较方便)windows用户需手动配置一下环境变量,下面默认是在ubuntu环境说明
  2. 创建python环境,conda create -n your_env_name python=3.10 (注:官方是提供是python3.8,但目前主流用python3.10 因此使用python3.10. your_env_name 是可以自己命名的环境名字 )
  3. 导入需要的包,这里包版本的参考,在附件中的requirements.txt, 可以使用pip install -r requirements.txt

拉取github项目

  1. git clone https://github.com/chatchat-space/langchain-ChatGLM.git

  2. cd langchain-ChatGLM

  3. 启动webui:如果是ubuntu 可以直接运行命令

    python webui.py 
    

    启动api接口:如果是ubuntu 可以直接运行命令

    python api.py
    

    多卡启动, 在命令前面指定CUDA_VISIBLE_DEVICES=0,1 类似这样 如:

    CUDA_VISIBLE_DEVICES=0,1,2,3 python api.py
    

可能遇到的问题

  • 默认直接运行命令时,第一次将会从huggingface上下载模型,可能遇到网络连接的问题,解决方案如下:

    • 重新运行,因为有断点重连,所以就不停的重新运行直到下完模型权重就行,默认地址为~/.cache/huggingface/hub/models–模型名称

    • 打开huggingface,搜索要下载的模型,在Files and versions中将模型都下载到本地,目录结构为

      .
      └── 模型文件夹
      ├── added_tokens.json
      ├── config.json
      ├── configuration_codet5p_embedding.py
      ├── merges.txt
      ├── modeling_codet5p_embedding.py
      ├── pytorch_model.bin
      ├── special_tokens_map.json
      ├── tokenizer.json
      ├── tokenizer_config.json
      └── vocab.json

      然后在langchain-ChatGLM/config/model_config.py 中配置local_model_path 字段为 模型文件夹所在的路径

更多说明

可以使用fastchat 部署做到 模型和api在不同的服务器(或相同服务器)

参考连接 https://github.com/lm-sys/FastChat/blob/main/docs/openai_api.md#restful-api-server


http://www.ppmy.cn/news/1132074.html

相关文章

ubuntu安装ROS

进官网,选版本,操作系统 ROS: Home 开始安装: noetic/Installation/Ubuntu - ROS Wiki Installation Configure your Ubuntu repositories Configure your Ubuntu repositories to allow "restricted," "universe,"…

北京互联网公司、外企、国企大盘点

今天来盘点北京的泛互联网公司。涵盖了综合类、外企类、硬件类、电商类、游戏类、娱乐类、生活类、工具类、人工智能类、金融类、教育类、招聘类、汽车类、外包类、信息化类以及国企央企类等多个领域。 综合类 字节跳动 美团 百度 阿里巴巴 腾讯 网易 外企类 微软 谷歌 亚马逊…

wsl2 更新报错问题解决记录

1、问题 win10 中安装的 wsl2,启动 docker desktop 时提示 wsl2 有问题: 于是点击推荐的地址连接到微软,下载 wsl2 的更新文件。之后运行,又报错: 更新被卡住。 2、解决方法 WinR 输入 cmd 打开命令行窗口&#x…

【Linux】 OpenSSH_7.4p1 升级到 OpenSSH_9.3p2(亲测无问题,建议收藏)

👨‍🎓博主简介 🏅云计算领域优质创作者   🏅华为云开发者社区专家博主   🏅阿里云开发者社区专家博主 💊交流社区:运维交流社区 欢迎大家的加入! 🐋 希望大家多多支…

【HTTP 常用的状态码及使用场景】

HTTP 常用的状态码及使用场景 HTTP常用的状态码有:HTTP状态码的使用场景: HTTP常用的状态码有: 1xx:信息提示 100:继续101:切换协议 2xx:成功 200:成功201:已创建202…

当面试被问到jvm(Java虚拟机)时,如何将面试官引入自己的节奏?

本文目录 前言快问快答抛砖引玉锦上添花好书推荐总结 前言 作为一名Java开发工程师,不管是校招还是社招jvm一定是必问必会的知识点。虽然说真正开发中用到的不多,甚至可以说用不到(对于刚入行或者Java初级),但是当面试…

步进电机只响不转

我出现问题的原因是相位线接错。 我使用的滑台上示17H的步进电机,之前用的是57的步进电机。 57步进电机的相位线是A黑、A-绿、B红、B-蓝。 17步进电机的相位线是A红、A-绿、B黑、B-蓝。 这两天被一个问题困扰了好久,在调试步进电机开发板的时候电机发生…

Socket网络编程练习题五:客户端多用户上传文件(多线程版)并使用线程池管理线程

题目 想要服务器不停止,能接收很多客户上传的图片?我们知道是使用循环加多线程的方案来解决,但是如果频繁的创建和销毁线程,是非常浪费系统资源的,那应该怎么办呢? 解决方案 采用线程池,来管…