安装指南:LLaMA Factory、AutoGPTQ 和 vllm

ops/2025/1/19 10:11:39/

安装指南:LLaMA Factory、AutoGPTQ 和 vllm

在本文中,我们将详细介绍如何安装 LLaMA Factory、AutoGPTQ 和 vllm,这些工具在大型语言模型(LLMs)和视觉语言模型(VLMs)的微调和量化中非常有用。我们将逐步指导你完成整个安装过程,确保你能够顺利开始使用这些强大的工具。

1. 安装 LLaMA Factory

LLaMA Factory 是一个统一高效的微调框架,支持 100 多种大型语言模型和视觉语言模型。以下是安装 LLaMA Factory 的步骤:

步骤 1:克隆 LLaMA Factory 仓库

打开终端或命令提示符,运行以下命令:

bash复制

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

步骤 2:安装依赖

使用以下命令安装 LLaMA Factory 的依赖:

bash复制

pip install -e ".[torch,metrics]"

这将安装 PyTorch 和评估指标相关的依赖。如果你需要其他额外的依赖,可以使用以下命令:

bash复制

pip install -e ".[torch,metrics,deepspeed,liger-kernel,bitsandbytes]"

2. 安装 AutoGPTQ

AutoGPTQ 是一个基于 GPTQ 算法的易于使用的 LLM 量化包。以下是安装 AutoGPTQ 的步骤:

步骤 1:克隆 AutoGPTQ 仓库

打开终端或命令提示符,运行以下命令:

bash复制

git clone https://github.com/PanQiWei/AutoGPTQ.git
cd AutoGPTQ

步骤 2:安装依赖

使用以下命令安装 AutoGPTQ 的依赖:

bash复制

pip install .

如果你需要使用 Triton 后端,可以使用以下命令:

bash复制

pip install auto-gptq[triton] --no-build-isolation

注意事项

  • CUDA 支持:确保你的系统支持 CUDA,并且安装了适当的 CUDA 版本。

  • ROCm 支持:如果你使用的是 AMD GPU,可以设置 ROCM_VERSION 环境变量来安装 ROCm 支持。

  • Intel® Gaudi® 2 支持:如果你使用的是 Intel Gaudi 2 HPUs,需要设置 BUILD_CUDA_EXT=0 环境变量。

3. 安装 vllm

vllm 是一个用于高效推理的库,支持多种量化方法。以下是安装 vllm 的步骤:

步骤 1:安装 vllm

使用以下命令安装 vllm:

bash复制

pip install "vllm>=0.4.3,<=0.6.5" -i https://pypi.tuna.tsinghua.edu.cn/simple

这个命令会从清华大学的镜像源安装 vllm,确保下载速度更快。

步骤 2:验证安装

安装完成后,可以使用以下命令验证 vllm 是否安装成功:

bash复制

pip show vllm

4. 常见问题及解决方案

问题 1:依赖冲突

如果你遇到依赖冲突问题,可以尝试以下命令:

bash复制

pip install --no-deps -e .

问题 2:CUDA 版本不兼容

确保你的 CUDA 版本与 vllm 和 AutoGPTQ 的要求一致。如果版本不兼容,可以尝试安装不同版本的 CUDA 或者使用其他镜像源。

问题 3:安装失败

如果安装失败,可以尝试以下步骤:

  1. 清理缓存

    bash复制

    pip cache purge
  2. 重新安装

    bash复制

    pip install --upgrade pip
    pip install "vllm>=0.4.3,<=0.6.5" -i https://pypi.tuna.tsinghua.edu.cn/simple

5. 结论

通过以上步骤,你应该能够成功安装 LLaMA Factory、AutoGPTQ 和 vllm。这些工具将帮助你在大型语言模型和视觉语言模型的微调和量化方面取得更好的效果。如果你在安装过程中遇到任何问题,可以参考官方文档或在相关社区寻求帮助。

希望本文对你有所帮助!如果有任何问题或建议,欢迎随时提出。


http://www.ppmy.cn/ops/151353.html

相关文章

macos arm 本地/docker/本地k8s 安装jupyterhub 并登陆

概述 很多文章写的启动官方docker镜像后,新建linux用户即可直接登录,不知道是否版本原因,总之目前最新版我亲测不可以,踩坑两天,这里记录下解决过程,以及各种细节在文档中的位置.以及为什么官方镜像不能直接使用的原因. part1 本地安装jupyterhub https://jupyterhub.readth…

计算机网络 第一章 概述 1.5

1.5 计算机网络体系结构 1.5.1 常见的三种计算机网络体系结构 为了使不同体系结构的计算机网络都能互连起来&#xff0c;国际标准化组织于1977年成立了专门机构研究该问题&#xff0c;他们提出了一个使全世界各种计算机可以互连成网的标准框架——开放系统互连基本参考模型&am…

VIVADO FIFO (同步和异步) IP 核详细使用配置步骤

VIVADO FIFO (同步和异步) IP 核详细使用配置步骤 目录 前言 一、同步FIFO的使用 1、配置 2、仿真 二、异步FIFO的使用 1、配置 2、仿真 前言 在系统设计中&#xff0c;利用FIFO&#xff08;first in first out&#xff09;进行数据处理是再普遍不过的应用了&#xff0c…

探秘Node.js模块Modules:从入门到精通

文章目录 一、引言二、Node.js 模块初相识2.1 模块的概念与意义2.2 模块的类型 三、Node.js 模块的使用方法3.1 核心模块的调用3.2 文件模块的创建与运用3.2.1 创建自定义模块3.2.2 引入自定义模块 3.3 ES Modules 的运用3.3.1 启用 ES Modules3.3.2 导入导出规则 四、node_mod…

“深入浅出”系列之音视频开发:(3)岗位要求

算法工程师-视频编解码 职位描述 在这里&#xff0c;你将参与JVET / VVC的下一代视频编码标准设计和算法研究&#xff1b; 在这里&#xff0c;你将参与视频编码&#xff08;包括但不限于VVC/AV1/AVS3&#xff09;优化&#xff1a;通过信号处理和机器学习的快速编码决策、数据…

C++(二十二)

前言&#xff1a; 本文承接上文&#xff0c;将详细讲述C中&#xff0c;参数与指针。 一&#xff0c;无响应参数。 首先复习一下之前曾学习过的函数&#xff1a; void change(int a,int b) { int temp; tempa; ab; btemp; } 看起来是一个简单的交换a与b值的函数。 完整代…

SpringBoot Starter 通用接口加密组件(防篡改)+ RequestBodyAdvice和ResponseBodyAdvice原理

实现参考博客&#xff1a; RequestBodyAdvice和ResponseBodyAdvice原理&#xff1a; RequestBodyAdvice和ResponseBodyAdvice原理详解-CSDN博客 SpringBoot Starter 通用接口加密组件&#xff08;防篡改&#xff09;&#xff1a; SpringBoot Starter 通用接口加密组件_spri…

Redis 部署模式

Redis 提供了三种部署模式&#xff1a;单兵模式、哨兵模式、和 集群模式&#xff0c;每种模式有不同的特点和适用场景。下面分别介绍这三种模式。 1. 单兵模式&#xff08;Standalone&#xff09; 单兵模式是最简单的 Redis 部署模式&#xff0c;适合对高可用性要求不高的场景…