【ChatGLM】在电脑部署属于自己的人工智能/ChatGPT平替/可离线/可发布

news/2025/2/15 13:49:34/

【ChatGLM】在电脑部署属于自己的人工智能

1、 前言

本文能实现在自己的电脑或云服务器上部署属于自己的语言AI——ChatGLM-6B,可以离线使用,也可以生成web网页在线发给朋友尝试。

ChatGLM-6B 是一个由清华大学的团队开源的、支持中英双语问答的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。本文旨在介绍如何在电脑部署属于自己的人工智能/可离线/可发布。这是一个有趣而有意义的项目,可以让你体验到人工智能的魅力,也可以让你拥有一个自己定制的智能助手。详情点击参考ChatGLM开发者博客

GPT 模型目前只有 GPT-2 的小规模版本(1.5 亿参数)是开源的,其它版本都是闭源的,只能通过 OpenAI 的 API 来访问。ChatGLM-6B 是完全开源的,可以在Github下载和使用。GPT 模型的可用性受到限制,需要申请权限和付费才能使用。ChatGLM-6B 的可用性更高,可以在本地部署和修改。

ChatGLM-6B 和 GPT 模型对比

在这里插入图片描述

2、虚拟环境搭建

要搭建 conda 虚拟环境,你需要先安装 conda ,它是一个用于管理 Python 和其他语言的包和环境的工具。你可以从 https://www.anaconda.com/products/individual 下载并安装 Anaconda 或 Miniconda。

创建一个虚拟环境,并且指定其中的 Python 版本,这里使用了python3.10:conda create --name myenv python=3.10( myenv 是你想要给这个环境起的名字)。
激活这个虚拟环境:conda activate myenv,这样你就可以在这个环境中安装和使用包了。

3、下载安装所需的依赖

点击前往GitHub下载作者开源的文件接着进入创建好的conda虚拟环境中,进入开源文件所下载到的文件夹,例如我存放在X:\python\glm310\ChatGLM-6B中。用以下命令 cd /d X:\python\glm310\ChatGLM-6B进入

用以上命令即可进入

接着输入pip install -r requirements.txt安装所需要的依赖项
在这里插入图片描述
由于安装的依赖项中的torch模块是only cpu的,即不能把模型放进显卡运算的版本,所以我们在下载完毕后,在控制台输入pip uninstall torch卸载torch。点击进入pytorch官网翻到主页下端根据自己安装的cuda版本选择下载对应的torch-gpu。
复制划线处命令去控制台运行
如何查看cuda版本与显卡信息在控制台输入nvidia-smi即可。
在这里插入图片描述
如果没有安装cuda的请参考 在conda虚拟环境中配置cuda+cudnn+pytorch深度学习环境(新手必看!简单可行!),cuda版本推荐cuda 11.7。

4、ChatGLM模型下载与修改

点击进入作者的网盘下载模型
在这里插入图片描述
把他们下载到电脑,例如我存放在D:\ChatGLM-6B中。进入刚开始下载开源文件的文件夹打开web_demo.py文件,修改模型。

在这里插入图片描述
修改模型加载路径为模型下载的地址

tokenizer = AutoTokenizer.from_pretrained("D:\chatGLM", trust_remote_code=True)
model = AutoModel.from_pretrained("D:\chatGLM", trust_remote_code=True).half().quantize(4).cuda()
model = model.eval()

根据自身的显存修改模型,例如我的电脑显存为6G,即修改为

`# 按需修改,目前只支持 4/8 bit 量化
model = AutoModel.from_pretrained("D:\chatGLM", trust_remote_code=True).half().quantize(4).cuda()

`在这里插入图片描述
若要在线发布,把web_demo.py中最后一段代码的share=False改成Ture即可

demo.queue().launch(share=True, inbrowser=True)

5、美化与发布

美化生成的界面,最简单的方法就是在以下这行代码增加主题参数,gradio模块预设了多种不同的生成web的主题,详情可参考gradio官网

`with gr.Blocks(theme=Soft()) as demo:`

最后点击运行即可

在这里插入图片描述

顺便提一句:在控制台输入nvidia-smi -l 1可以即时监控gpu显存使用情况

效果图

在这里插入图片描述
生成在线链接发送给到微信打开效果图
在这里插入图片描述

参考文献

A. Zeng等, 《GLM-130B: An Open Bilingual Pre-trained Model》, 发表于 The Eleventh International Conference on Learning Representations, 2月 2023. 见于: 2023年3月30日. [在线]. 载于: https://openreview.net/forum?id=-Aw0rrrPUF

开发者GitHub:https://github.com/THUDM/ChatGLM-6B


http://www.ppmy.cn/news/565467.html

相关文章

天堂2 mysql一闪而过_天堂2革命闪退怎么办_天堂2革命彻底解决游戏闪退方法_手心游戏...

天堂2革命闪退怎么解决?有玩家反馈玩天堂2革命出现黑屏闪退现象,进入游戏先是黑屏然后直接闪退,针对此问题下面小编就为大家带来天堂2革命黑屏闪退的解决方法,有被黑屏闪退困扰的小伙伴们来看看吧。 《天堂2革命》彻底解决游戏闪退…

一. APP连续闪退修复方案初版

连续闪退设计方案 一、概要 1.背景 用户在使用APP时,在启动阶段crash,将根本无法使用。重启的条件下也无法正常使用的情况,也就称为连续闪退。在这种情况下就需要一种机制去保护并修复它,确保APP可以正常使用。 2.发生条件 连…

pp助手苹果版本_pp 助手停止服务/共享 ID 结束,旧版应用还能这样下载

以前的 pp 助手有提供旧版本应用下载,但是后来因为一些原因 pp 助手 iOS 端下架了,所以旧版本下载也只能另寻出路。 至于共享 ID,最近苹果官方的封杀一直半死不活,所以做旧版 ID 共享的也不好发展,具体可以参考目前已经…

pp助手可以刷机吗android,pp助手刷机 pp助手怎么刷机

小编今天带来pp助手刷机,pp助手怎么刷机的教程。想用pp助手刷机?要知道刷机有风险,刷机需谨慎。想清楚了,那么就进来看教程刷机吧。包教包会! 注意:刷机前一定要备份好自己的东西。 1.首先下载更新新版本pp…

Zpoken:NEAR ZK Light Client

1. 引言 Zpoken团队历时8个月开发了NEAR ZK Light Client,开源代码见: https://github.com/ZpokenWeb3/zk-light-client-implementation(Rust) 关键依赖为: https://github.com/mir-protocol/plonky2(R…

前缀和、差分数组:重新排序

L,r重新排序 问题描述 给定一个数组 A A A 和一些查询 L i , R i L_{i}, R_{i} Li​,Ri​, 求数组中第 L i L_{i} Li​ 至第 R i R_{i} Ri​ 个元素之和。 小蓝觉得这个问题很无聊, 于是他想重新排列一下数组, 使得最终每个查 询结果的和尽可能地大。小蓝想知道相比原数…

如何 1天看完 MySQL 45 讲

拳不离手,曲不离口 !! 端午假,我在朋友圈逛遍了天涯海角,古今中外,甚至还有上天入地。马上假期结束,我想程序员们一定会有一种手生的感觉 所以,今天写下点技巧,快速帮大家找回写 SQL 的感觉。 这…

笔记本PS/2键盘无法使用,试下这个方法

用360清理了一下系统,再开机键盘就不灵了,鼠标却可以用。 打开设备管理器,看到PS/2标准键盘有个黄色的感叹号。 属性显示PS/2 标准键盘 Windows 无法加载这个硬件的设备驱动程序。驱动程序可能已损坏或不见了。 (代码 39) 用驱动精灵也不行。…