【LLM】低成本部署大语言模型, 并且还能达到部署在GPU上差不多的效果

news/2024/11/29 13:38:44/

目录

前言

部署 

效果

问题1:人类为什么需要睡觉?

问题2:世界上最高的山峰是什么?


前言

点进来看本文的应该都知道模型对硬件的要求很高, 那我也不废话了, 直接安排最近发现的一个开源项目, 它可以帮助我们降低部署模型的成本, 开源仓库链接:

GitHub - Jittor/JittorLLMs: 计图大模型推理库,具有高性能、配置要求低、中文支持好、可移植等特点

  • 内存要求:至少2G,推荐32G
  • 显存:可选, 推荐16G
  • 操作系统:支持Windows,Mac,Linux全平台。
  • 磁盘空间:至少40GB空闲磁盘空间,用于下载参数和存储交换文件。
  • Python版本要求至少3.8(Linux的Python版本至少3.7)。

可以看出对配件的要求不是很高,  显卡可有可无(有的话更好),我是在笔记本电脑上部署测试的,配置的话是:i5-1135G和32G内存(无独立显卡)


部署 

部署教程在开源仓库的README中写的很详细, 请自行查看, 部署过程中遇到问题可以评论提问


效果

问题1:人类为什么需要睡觉?

GPU服务器:

本机: 

问题2:世界上最高的山峰是什么?

GPU服务器: 

 本机:

我测试的模型是ChatGLM的, 效果如图所示, 相差不大


👍点赞,你的认可是我创作的动力 !
🌟收藏,你的青睐是我努力的方向!
✏️评论,你的意见是我进步的财富!


http://www.ppmy.cn/news/61606.html

相关文章

SpringMVC详细介绍和@RequestMapping详细使用说明

目录 SpringMVC SpringMVC 介绍 说明是 MVC MVC 全称∶ Model 模型、View 视图、 Controller 控制器。 MVC 是一种思想 MVC 示意图 理解和解读 SpringMVC 特点&概述 梳理 Spring SpringMVC SpringBoot 的关系 SpringMVC-快速入门 SpringMVC 登录流程分析 SpringM…

人工智能洗稿-免费自媒体洗稿工具

文字洗稿 文字洗稿是指通过修改、重组、删除、替换等手段对文本进行优化、清理和调整,以达到改善文章质量、增加独特性和提高可读性的目的。文字洗稿是自媒体行业的一个重要需求,尤其是在批量撰写文章或需要大量修改文本的情况下。文字洗稿分为自动洗稿…

正则表达式学习贴

1. 前言 1.1 为什么要学习正则表达式 1.1.1 极速体验正则表达式威力 /*** 体验正则表达式的威力,给我们文本处理带来哪些便利*/ public class Regexp_ {public static void main(String[] args) {//假定,编写了爬虫,从百度页面得到如下文本…

200左右什么蓝牙耳机比较好?国产200左右蓝牙耳机推荐

随着不少手机厂商取消3.5mm耳机孔,蓝牙耳机便成为了人们外出的最佳选择。最近看到很多人问,200左右什么蓝牙耳机比较好?针对这个问题,我来给大家推荐几款国产的蓝牙耳机,一起来看看吧。 一、南卡小音舱Lite2蓝牙耳机 …

Redis的20种使用场景

本文介绍Redis除了缓存以外的使用场景。 测试源码:https://github.com/vehang/ehang-spring-boot/tree/main/spring-boot-011-redis 1缓存 本文假定你已经了解过Redis,并知晓Redis最基础的一些使用,如果你对Redis的基础API还不了解&#xff…

MySQL基础(三)基本的SELECT语句

1. SQL概述 1.1 SQL背景知识 1946 年,世界上第一台电脑诞生,如今,借由这台电脑发展起来的互联网已经自成江湖。在这几十年里,无数的技术、产业在这片江湖里沉浮,有的方兴未艾,有的已经几幕兴衰。但在这片浩…

移动端动态开发能力的由来和流派

移动端动态化的由来 “动态化”并不是最近几年才产生的名词,而是从从互联网诞生的初期,这个词就已经出现了。大家所认知的早期互联网,其实就是各种各类的“动态网站”,内容数据和页面外观都不是固定的,都是随着服务器…

【网络取证篇】宝塔面板server和panel的目录功能说明

【网络取证篇】宝塔面板server和panel的目录功能说明 宝塔面板的目录结构在不同的情况下可能有所不同—【蘇小沐】 文章目录 【网络取证篇】宝塔面板server和panel的目录功能说明1、宝塔优点: (一)宝塔面板/www/server主要目录(二…