llama_factory Qlora微调异常 No package metadata was found for The ‘autoawq‘

ops/2024/9/23 14:16:39/

importlib.metadata.PackageNotFoundError: No package metadata was found for The ‘autoawq’ distribution was not found and is required by this application.

To fix: pip install autoawq

在这里插入图片描述
其实问题比较简单 直接安装autoawq 即可
但是对应会有版本问题:
查看当前llama factory版本

llamafactory-cli version

在这里插入图片描述
torch 版本

import torch
print(torch.__version__)
print(torch.version.cuda)
print(torch.backends.cudnn.version())

在这里插入图片描述
安装 autoawq 去Git上看大部分都支持CUDA 12.1 选择一个版本安装即可

pip install autoawq==0.2.2 -i https://pypi.tuna.tsinghua.edu.cn/simple

当前环境报错:
在这里插入图片描述
因为autoawq 内置 torch 为2.3.1 所以会与本地torch 2.2.2版本不兼容
直接进行升级即可注意匹配CUDA (当前为12.1)版本

pip install torch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 --index-url https://download.pytorch.org/whl/cu121

(小编尝试过版本降级,但总有其他依赖报错,进行放弃,升级)
查看安装是否成功:

pip show torch

在这里插入图片描述

conda list torch

在这里插入图片描述
torch 安装成功!
重新安装autoawq

pip install autoawq==0.2.2 -i https://pypi.tuna.tsinghua.edu.cn/simple

问题解决!

后记:大模型微调lora与Qlora 区别还是挺大的,Qlora 微调起来相对麻烦一些对应处理依赖也会更多一些!

主要区别总结
适用范围:LoRA 可以应用于任何未量化的模型,而 QLoRA 则专门用于已经量化的模型。
内存占用:QLoRA 通常会比 LoRA 占用更少的内存,因为它可以利用量化带来的内存节省效果。
实现复杂度:QLoRA 的实现可能比 LoRA 更加复杂,因为它需要处理量化模型特有的问题。
性能优化:QLoRA 通过使用 4-bit 量化和可学习的低秩适配器,能够在保持性能的同时显著减少内存使用


http://www.ppmy.cn/ops/107875.html

相关文章

AI基础 L7 Informed Search II

A∗ Search • The A∗ search is probably the most used type of heuristic search • It combines the cost to reach a node (g(n)) with the cost to get from the node to the goal (h(n)) f (n) g(n) 初始状态到节点 n 的实际成本 h(n)节点 n 到目标状态的估计成本 •…

尚硅谷Vue入门视频 笔记

尚硅谷视频:https://www.bilibili.com/video/BV1Zy4y1K7SH/?spm_id_from333.999.0.0&vd_sourcecec13bbe100bddfff8baf29d18ed8994 文章目录 模板语法data与el的2种写法MVVM模型事件事件修饰符事件的基本使用 计算属性简写形式 监视属性绑定样式条件渲染列表渲…

嘉立创中秋福利来啦!

单笔订单商品实付慢2万送良品铺子月饼 多品牌折扣 快来立创商城一探究竟吧~ 立创商城_一站式电子元器件采购自营商城_嘉立创电子商城 (szlcsc.com)

[物理专题]经典浮力题目的Fh图像绘制

这段代码用于绘制物体在液体中受到的浮力变化的图像,它有多个好处: 直观展示数据:通过图形化展示,可以直观地看到物体在液体中浸入深度与受到的浮力之间的关系。 教育和学习工具:这种类型的图像常用于教育目的&#x…

简单的Linux Ftp服务搭建

简单的Linux FTP服务搭建 1.需求 公司有一个esb文件传输代理,其中我们程序有文件传输功能,需要将本地文件传输到esb文件代理服务器上,传输成功之后发送http请求,告知esb将固定文件进行传输到对应外围其他服务的文件目录中&#…

MySQL—死锁

什么是死锁? 好比是两个事务都在等待对方释放锁,之后进行下一步操作,但是最后双方都没有释放资源,所以导致一直处于等待的状态。 但是服务器不会让死锁的状态一直持续,会关闭其中一个影响较小的事务(右边的…

ArcGIS Pro SDK (十二)布局 10 布局导出

ArcGIS Pro SDK (十二)布局 10 布局导出 文章目录 ArcGIS Pro SDK (十二)布局 10 布局导出1 布局导出1.1 将布局导出为 PDF1.2 将地图框导出为 JPG1.3 将与地图框关联的地图视图导出到 BMP1.4 将地图系列导出为单个 PDF1.5 将地图系列导出到单个 TIFF 文件2 布局选项2.1 获…

【网络安全】利用域名混淆绕过 CSRF 实现账户接管

未经许可,不得转载。 文章目录 正文正文 目标:account.example.com 根据 HTTP 历史记录,我发现了以下几点: 所有请求都调用了 .json 端点,例如: account.example.com/login.json account.example.com/finddata.json请求以 JSON 格式发送。 请求头中没有 CSRF-token。 看…