试过了,多模态大模型Qwen/Qwen2.5-VL-3B-Instruct需要21G显存,我还是太天真啊!

devtools/2025/3/6 9:37:37/

前缘概述

之前说道,我想通过自己的笔记本(6G显存)部署一个Qwen/Qwen2.5-VL-3B-Instruct,最后因为显存不够,就放弃了。

Centos7,T4,几多磨难

但随后,我便开始了在一台系统为centos7,显卡为T4的机器上进行部署。总之就是很磨难,很多坑,最后还没有成功。

我猜测,相较于T4作为一张老显卡所带来的限制,centos7所默认的glibc版本为4.8应该是更为致命。

这一块儿,反正咱先给个初步的猜测,如果你想通过vllm部署Qwen/Qwen2.5-VL-3B-Instruct,如果你是centos7,那么请你优先采用docker部署。会省去很多麻烦。

如果你是T4这样的老显卡,也要做好被虐的准备。

柳暗花明,A100还是香啊

放弃T4之后,后来,到处乞讨,终于借到了一张A100。

就,怎么说呢?给我的感觉就是,贵的东西是真的香啊!

整个部署过程,除了安装uv,虚拟环境,和激活环境,后面,就两步:


http://www.ppmy.cn/devtools/164964.html

相关文章

一文读懂加载地址、链接地址和运行地址

我们在做嵌入式系统开发时,会经常遇到加载地址、链接地址和运行地址的概念,可能会感到很困惑,搞不清它们三者的关系。希望此文能帮助大家彻底理解三者的关系。 一.概念 1.1.加载地址 加载地址,即Load Memory Address&#xff08…

libilibi项目优化(1)使用Redis实现缓存

第一版 获取视频信息使用旁路缓存 当视频信息存在缓存中时(命中),直接从缓存中获取。不存在缓存中时,先从数据库中查出对应的信息,写入缓存后再放回数据。 //获取视频详细信息RequestMapping("/getVideoInfo&q…

Java常用正则表达式(身份证号、邮箱、手机号)格式校验

目录 身份证号的正则表达式 代码解释 正则表达式 方法 isValidIDCard 注意事项 校验邮箱的正则表达式 代码解释 正则表达式 方法 isValidEmail 注意事项 手机号的正则表达式 中国大陆手机号校验(支持空字符串) 代码解释 通用手机号校验&am…

STM32之ADC

逐次逼近式ADC: 左边是8路输入通道,左下是地址锁存和译码,可将通道的地址锁存进ADDA,ADDB,ADDC类似38译码器的结构,ALE为锁存控制键,通道选择开关可控制选择单路或者多路通道,DAC为…

Linux 基本开发工具的使用(yum、vim、gcc、g++、gdb、make/makefile)

文章目录 Linux 软件包管理器 - yum理解什么是软件包和yum如何查看/查找软件包如何安装软件如何实现本地机器和云服务器之间的文件互传如何卸载软件 Linux 编辑器 - vim 的使用vim 的基本概念vim 的基本操作vim 命令模式各命令汇总vim 底行模式各命令汇总vim 的简单配置 Linux …

【算法方法总结·四】字符串操作的一些技巧和注意事项

【算法方法总结四】字符串操作的一些技巧和注意事项 【算法方法总结一】二分法的一些技巧和注意事项【算法方法总结二】双指针的一些技巧和注意事项【算法方法总结三】滑动窗口的一些技巧和注意事项【算法方法总结四】字符串操作的一些技巧和注意事项 【字符串操作】 此章节涉…

Python从PowerBI Server上取得报表数据的方法

下载PowerBI报表文件,提取数据文件读取数据并存为CSV文件 使用Python和Restful API下载PowerBI Server上报表为.pbix格式的报表文件,再把它当做zip文件解压出其中的数据文件,然后用Python读取该文件的内容并存储为CSV文件。最后详细论述Powe…

Python 面向对象高级编程-定制类

目录 __str__ __iter__ __getitem__ __getattr__ __call__ 小结 看到类似__slots__这种形如__xxx__的变量或者函数名就要注意,这些在Python中是有特殊用途的。 __slots__我们已经知道怎么用了,__len__()方法我们也知道是为了能让class作用于len()…