0.写在前面
最近开学换了新的服务平台实例,发现里面的配置很旧,又发现网上没有相关最新教程。
以安装cuda12.2为例 … 本来想直接安装我驱动能够支持的最新的cuda 后来发现这样及其不方便 ,大家还是安装经典的,用的多比如11.8 ,12.1,12.4,这样安装torch方便,比如
conda install pytorch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 pytorch-cuda=12.1 -c pytorch -c nvidia
1. 确认 NVIDIA 驱动是否支持 CUDA 12.2
CUDA 的运行依赖 NVIDIA 驱动程序,确保你的 NVIDIA 驱动版本足够新。如果版本过低,先升级驱动。
检查当前驱动版本
运行以下命令,查看当前 NVIDIA 驱动程序的版本:
nvidia-smi
在输出的顶部,你会看到 Driver Version
,例如:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.182.03 Driver Version: 470.182.03 CUDA Version: 11.4 |
+-----------------------------------------------------------------------------+
2. 下载和安装 CUDA 12.2
2.1 下载 CUDA 12.2 安装包
去 CUDA 官方下载页面 下载 12.2 版本的安装包。
示例:
以 Ubuntu 20.04 为例,选择以下选项:
- Operating System:Linux
- Architecture:x86_64 //不知道就在服务器输入:uname -m
- Distribution:Ubuntu //不知道就在服务器输入:lsb_release -a
- Version:20.04 // 由上条命令可得
- Installer Type:deb (local) // 有local就行
点击 Download 按钮,复制安装命令。
3.2 添加 CUDA 仓库并安装
在终端中执行官方给出的安装命令。例如:
wget wget https://developer.download.nvidia.com/compute/cuda/12.1.1/local_installers/cuda_12.1.1_530.30.02_linux.run
sudo sh cuda_12.1.1_530.30.02_linux.run
进入options->Toolkit options->记住安装位置
换掉老版本
3.3 设置环境变量
安装完成后,将 CUDA 添加到环境变量中。在 .bashrc
文件中添加以下内容:
export PATH=/usr/local/cuda-12.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64:$LD_LIBRARY_PATH
保存并运行:
source ~/.bashrc
3.4 验证 CUDA 安装
运行以下命令检查是否成功安装:
nvcc -V