介绍
笔者实验室的图形工作站基于Ubuntu 18.04,请先安装Ubuntu操作系统。推荐安装Ubuntu 18.04 LTS,LTS意味着Long Term Support,你可以在官网下载并刻录U盘安装。Ubuntu操作系统官网下载,可以看到该系统支持到2023年4月,是较为稳定的版本。
显卡驱动的安装
如果你确定你的显卡驱动被正确的安装了,可以跳过这一步
在刚装好Ubuntu操作系统时,默认的显卡驱动是nouveau,这是一种开源但低效的驱动,你需要更换成对应版本的驱动。
第一步:查看显卡版本,获取安装包
lshw -numeric -C display
在这里可以看到一串十六进制数字,这好像不是我们熟悉的显卡型号,实际上,这是这是显卡型号的16进制表达,你需要解码其中的含义,可以去这个网站,在那个下面的空白框中输入这串数字(如我的就是1e81),你就可以得到显卡型号。
接下来就是在nvdia官网下载对应的驱动,在这里选择你的显卡型号,和对应的linux及语言等。
搜索之后,你可以进一步滑下来查看是否支持你的显卡
此时一般会弹出下载链接,记住他,同时记住安装包的名称,然后执行,
sudo apt-get install make
#下面的链接应该是你获取到的
sudo wget https://cn.download.nvidia.cn/XFree86/Linux-x86_64/440.82/NVIDIA-Linux-x86_64-440.82.run
第二步 安装
首先需要检查nouveau是否被正确卸载,执行
sudo apt-get install vim
vim /etc/modprobe.d/blacklist.conf
在其中加入一行命令来禁用nouveau
blacklist nouveau
重启系统
reboot
执行下列命令,如果没有任何输出,则禁用成功
lsmod | grep nouveau
转为文本命令窗口,准备安装
sudo telinit 3
进入安装包所在目录,执行
bash NVIDIA-Linux-x86_64-440.82.run
按着步骤安装就行了
CUDA的安装
第一步:检查安装环境
进入cuda官网,选择对应版本,他会给出安装的指令,比如我的就是
wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
sudo sh cuda_10.2.89_440.33.01_linux.run
值得注意的是,你的系统环境需要满足一定的条件,详见官方文档
最常见的一些错误就是,显卡驱动仍然是默认的nouveau,详见第一步
二是gcc版本太高,比如图中可以看出Ubuntu18.04下gcc不能高于7.3.0,此时需要降级
你可以选择很多种方式,如果想要刚好安装gcc7.3比较麻烦,但你可以用apt来安装
sudo apt-get install gcc-6
cd /usr/bin
ls
此时你会看见bin目录下的已经安装的gcc
你需要将gcc-6链接成gcc,首先删除原来的软连接,将gcc-6链接上去,执行
sudo rm -rf gcc
sudo ln -s gcc-6 gcc
第二步:安装
执行你上次得到的命令执行即可,图为安装完成,这还没有安装成功的,需要进一步操作
重新启动系统,进入终端
reboot
#重新连接
执行以下几行,这里的路径应该是你的安装路径
export PATH="/usr/local/cuda-10.2/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH"
再执行
nvcc -V
可以看到这样的信息就说明成功了!
你还可以编译samples来检查是否正常安装,这里不多叙述了
cuDNN的安装
根据你的cuda版本选择对应的cuDNN,在官网选择你需要的版本,记下下载链接,用wget命令下载并解压
wget https://developer.download.nvidia.cn/compute/machine-learning/cudnn/secure/7.6.4.38/Production/10.1_20190923/cudnn-10.1-linux-x64-v7.6.4.38.tgz?If1F9NslzoB6a4LmyJhaQpBONTd2SZjQod-58RnXpsEHYrwZU0dMUgR9KDav1Ie07nzTQgX5s8eL3EnuBGACBEk-K2o-Kg3DUXjeWllNjIi6U9miGGsxm4a48bgHb2c5otF5uhRtR6jPKcQtnLksbXDvleDWrFDzhX-yu6s7ReA5DPnOr2UhDx3MOKj0nxjkKISQ3GLJrRQadOIXmsvRsnWoeMaR7bC64A --no-check-certificate
tar -zxvf cudnn-10.1-linux-x64-v7.6.4.38.tgz
将cuda文件夹(刚解压出来的那个)中相应文件拷贝到相应的cuda安装文件夹下
并更改其权限,安装工具库
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda-10.2/lib64/
sudo cp cuda/include/cudnn.h /usr/local/cuda-10.2/include/
sudo chmod 777 /usr/local/cuda-10.2/lib64/libcudnn*
sudo chmod 777 /usr/local/cuda-10.2/include/cudnn.h
sudo apt-get install libcupti-dev