书生·浦语 大模型(学习笔记-7)LMDeploy 量化部署 LLM-VLM 实践

embedded/2024/10/18 22:27:38/

目录

一、模型的部署

二、模型部署面临的问题

三、如何解决(两种方法)

四、LMDeploy相关知识

创建conda环境(漫长的等待)

五、使用LMDeploy与模型对话

六、设置最大KV Cache缓存大小

七、W4A16量化

八、客户端连接API服务器


一、模型的部署

二、模型部署面临的问题

显存受限 

访问密集型 

三、如何解决(两种方法)

最开始应用在CV领域 

多了量化和非量化工作,可能降低性能 

四、LMDeploy相关知识

优化KV缓存管理与存储 

性能表现

 还支持视觉推理

五、部署实践(安装、部署、量化)

创建conda环境(漫长的等待)

studio-conda -t lmdeploy -o pytorch-2.1.2

激活刚刚创建的虚拟环境:

conda activate lmdeploy

安装0.3.0版本的lmdeploy:

pip install lmdeploy[all]==0.3.0

查看本地的预训练模型

使用 Transformer库运行模型,先创建指令

运行效果 

五、使用LMDeploy与模型对话

 连接到模型

lmdeploy chat /root/internlm2-chat-1_8b

 结果输出:(提问 -> 请你给我讲一个小故事)

六、设置最大KV Cache缓存大小

资源监视器中的显存占用情况(未改变参数)

改变--cache-max-entry-count参数,设为0.5

改变--cache-max-entry-count参数设置为0.01

七、W4A16量化

LMDeploy使用AWQ算法,实现模型4bit权重量化

八、客户端连接API服务器

启动API服务器后进行连接:

web页面连接


http://www.ppmy.cn/embedded/16929.html

相关文章

【优质书籍推荐】Node.js+MongoDB+Vue.js全栈开发实战

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。…

SpringBoot框架——8.MybatisPlus常见用法(常用注解+内置方法+分页查询)

1.MybatisPlus常用注解: 1.1 当数据库、表名和字段名和实体类完全一致时无需加注解,不一致时: TableName指定库名 TableId指定表名 TableField指定字段名 1.2 自增主键: TableId(typeIdType.AUTO) private Long id; 1.3 实体类中属…

【Pytorch】(十四)C++ 加载TorchScript 模型

文章目录 (十四)C 加载TorchScript 模型Step 1: 将PyTorch模型转换为TorchScriptStep 2: 将TorchScript序列化为文件Step 3: C程序中加载TorchScript模型Step 4: C程序中运行TorchScript模型 【Pytorch】(十三)PyTorch模型部署: T…

软考137-上午题-【软件工程】-软件质量

一、软件质量 软件质量是指反映软件系统或软件产品满足规定或隐含需求的能力的特征和特性全体。软件质量管理是指对软件开发过程进行独立的检查活动,由质量保证、质量规划和质量控制3个主要活动构成。软件质量保证是指为保证软件系统或软件产品充分满足用户要求的质…

图论基础知识 深度优先(Depth First Search, 简称DFS),广度优先(Breathe First Search, 简称DFS)

图论基础知识 学习记录自代码随想录 dfs 与 bfs 区别 dfs是沿着一个方向去搜,不到黄河不回头,直到搜不下去了,再换方向(换方向的过程就涉及到了回溯)。 bfs是先把本节点所连接的所有节点遍历一遍,走到下…

智能穿戴终端设备安卓主板方案_MTK平台智能手表PCBA定制开发

新移科技智能手表方案兼容WiFi、BLE、2~5G等多种通信能力。支持多个功能模块,包括:通话、计步、定位、睡眠监测、心率监测、血氧监测等。智能手表通过滑动与功能性按键提供高度直观的体验感受,从腕间即可掌控日常生活。形态支持定制包括&…

专项技能训练五《云计算网络技术与应用》实训6-2:ryu控制器安装

文章目录 ryu控制器安装1. 使用VMware安装CentOS 7虚拟机,安装时需添加多一张网卡,该网卡为自定义-VMnet1.并且记得开启CPU虚拟化,将其命名为“OVS1”。2. 安装完虚拟机后,进入虚拟机,修改网络配置(onboot改…

Vim学习笔记01~04

第01章: 遁入空门,模式当道 1.什么是vim Vim是一个高效的文本编辑工具,并且可以在编程开发过程中发挥越来越重要的作用。 事实上,有不少编程高手使用他们来进行代码的开发,并且对此赞不绝口。 2.本系列目的 但是让…