一键部署开源AI(人工智能对话模型)(支持显卡或CPU加内存运行)--ChatGLM2-6B

news/2024/11/25 15:56:55/

一、基本介绍:

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了如下新特性:

更强大的性能:

基于 ChatGLM 初代模型的开发经验,我们全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了 GLM 的混合目标函数,经过了 1.4T 中英标识符的预训练与人类偏好对齐训练,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、CEval(+33%)、GSM8K(+571%) 、BBH(+60%)等数据集上的性能取得了大幅度的提升,在同尺寸开源模型中具有较强的竞争力。

更长的上下文:

基于 FlashAttention 技术,我们将基座模型的上下文长度(Context Length)由 ChatGLM-6B 的 2K 扩展到了 32K,并在对话阶段使用 8K 的上下文长度训练,允许更多轮次的对话。但当前版本的 ChatGLM2-6B 对单轮超长文档的理解能力有限,会在后续迭代升级中着重进行优化。

更高效的推理:

基于 Multi-Query Attention 技术,ChatGLM2-6B 有更高效的推理速度和更低的显存占用:在官方的模型实现下,推理速度相比初代提升了 42%,INT4 量化下,6G 显存支持的对话长度由 1K 提升到了 8K。
示例对比

相比于初代模型,ChatGLM2-6B 多个维度的能力都取得了提升。

二、ChatGLM2一键部署安装包下载

百度网盘下载地址:百度云

链接:稍后上传

三、一键运行

下载完成后,点击文件中的run.exe直接一键运行

运行完成后,即完成本地化ChatGLM2安装,可以直接进行使用。
在这里插入图片描述
我是用CPU+内存运行,大约占30G内存,实测问答速度不快,大约1秒出一个单词,但是智商比ChatGLM-6B高
在这里插入图片描述


http://www.ppmy.cn/news/1155360.html

相关文章

python---求面积练习:提示用户输入圆的半径,根据公式S = πr2求圆的面积

求面积练习:提示用户输入圆的半径,根据公式S πr2求圆的面积 r float(input(‘请输入要计算圆的半径:’)) PI 3.14 s PI * r ** 2 print(f’圆的面积为:{s}) r float(input(‘请输入要计算圆的半径:’)) ------…

关于 Android 没有文件存储权限保存文件的问题

我发现Android 有些APP 他们不需要申请文件存储权限就可以进行文件的保存翻阅大量文章总结如下: 前言: 从 Android 10 开始,Android 引入了一种新的存储权限模型,其中应用需要明确请求运行时权限以访问外部存储。在这种情况下&a…

求二叉树的高度——函数递归的思想

二叉树的高度:左右两个数最高的那个的1 int TreeHight(BTNode* root) {if (root NULL){return 0;}int lefhightTreeHight(root->left);int righthight TreeHight(root->right);return lefhight > righthight ? TreeHight(root->left) 1 : TreeHight…

美国市场三星手机超苹果 中国第一属华为

报告显示,截至5月份的三个月,iOS系统在美国、澳大利亚以及日本表现不俗。Android系统份额则在英国、德国以及法国实现增长。在中国城市地区,iOS份额同比基本持平,而Android份额则达到80.5%,同比增长1个百分点。 三星在…

如何做好一个管理者

一、管理的目标 管理的目的是效率和效益。管理的核心是人。管理的本质是协调,协调的中心是人。 管理的真谛是聚合企业的各类资源,充分运用管理的功能,以最优的投入获得最佳的回报,以实现企业既定目标。 二、管理的工作流程 从…

iOS 17请了一个免费的医生!它为你免费预诊断你的焦虑和抑郁

你的iPhone(多亏了iOS 17)现在有了心理健康问卷,可以帮助诊断焦虑和抑郁,并帮助你了解两者的风险。 心理健康问题通常是可怕的、复杂的和微妙的,你不能总是准确地说出你的感受属于哪一类。因此,如果你正在…

windows10下 iperf3测试带宽

iperf3下载网址:iPerf - Download iPerf3 and original iPerf pre-compiled binaries 可以用来测试TCP以及UDP带宽质量 通俗来说是用来测试网速的 准备:两台设备 1. 根据自己的设备选择下载工具(两台都要有,这里我用的Window…

Java8 新特性之Stream(二)-- Stream的中间操作

目录 1.filter(Predicate) 2.map(Function) 3.flatMap(Function) 4.distinct() 5.sorted([Comparator]) 6.limit(n) 7.skip(n) 8.peek(Consumer)