在装tensorflow-gpu之前,很重要的一点,一定要充分了解自己的电脑,再去安装!不然后面会踩很多坑!
我的电脑是win10-64位、GetForce GTX 1650 Ti,以及anaconda环境的Python3.8(当然python不合适还可以换)。了解自己的显卡特别重要!
然后再去安装适合自己电脑的cuda和cudnn。
此处需要首先确认了自己的显卡是否支持cuda,这个可以通过在NVIDIA:Your GPU Compute Capability查到,先找到对应系列,再去系列下面找型号,如果有就表示支持。但我没有找到我的1650Ti,听说是因为官网没更新。此时有大佬说可以通过软件GPU-Z来查看是否支持CUDA以及算力的情况(但是我没尝试)。后来自己实践,确定1650Ti是可以安装cuda的。
由于我对硬件懂得不多,所以以下可能有些专业词汇不太恰当,主要记录本人的安装过程。
第一步:查看配置
关于自己电脑显卡的配置,是通过查询自己购买电脑官网得知的,自己是GetForce GTX 1650 Ti。然后发现自己有一个软件叫:NVIDIA GetForce。这个是对应我自己的显卡驱动软件,一般都是开着的。
右键点击,打开它的控制面板->系统信息:
查看组件,找到cuda的支持版本。
这里还有一种方法是:在cmd里输入:
nvidia-smi
可以看到:你的Gpu信息和gpu使用情况(这样应该也呢个确定你可以安装cuda)。重点看第一行,有cuda version。这个不代表已经安装了cuda,而是表示可以安装cuda的最高版本!!这也是和上图对应的。
第二步:安装cuda
确定可以安装的cuda之后,我们再来看tensorflow-gpu这张版本对应表。
可以发现 tensorflow CUDA cuDNN Python VS这五个是一连串的对应关系
其中前四个的对应关系(一定)要弄对。vs2015和2017都行?vs电脑貌似自带?反正我没有下载。
因为,我是Python3.8的,然后我查到,正好我能安装到cuda11.0,所以我后面就下载了cuda11.0.228+cudnn-x64-v8.0.2.39。但是我最后装的tensorflow-gpu实际是2.4.1的。emmm具体为啥不是2.3.0,就很“碰巧”的装了2.4.1对了,然后2.3.0当时因为一个Bug测试不对,后来就卸载了,不过后来发现bug不是版本问题,但是也懒得尝试2.3.0了。不过我的电脑装的2.4.1也是可以运行的哦。
(看了很多教程,一直感觉版本安装的其实越高越不好,好像Pytorch之前都不支持coda11.0来着,不过现在是支持了)
然后,可以从自己电脑支持的CUDA入手 在表格中查找适合自己的配置,然后依次进行安装。
cuda Toolkit安装地址:https://developer.nvidia.com/cuda-downloads
cuda安装的还挺慢的,他让自己定cuda的安装位置,But!最后不知道什么原因他还是给我装进了C盘。我看有小伙伴一度安装完之后,没有找到cuda的位置。安装过程如下:
这里,我看大佬都是选择的自定义,因为后面有一个插件不安装,因为听说安了总会出错,第一个“精简”其实选了也没错,就是全部给你安了(emmm在这里,我选择的是“精简”,也就是全安了,也没有报错,为啥选精简,因为当时以为真的“精简”,后来发现是“all”)
如果选择:自定义,那么按照大佬们的教程是:
安装完毕后,查看环境变量,会发现:
cuda已经在了
此时,cmd里查看版本信息nvcc --version
成功。
如果你找不到你的cuda安那里了。
cmd里面:where nvcc
就找到你的cuda到哪了。
第三步,安装cudnn.
cudnn安装:https://developer.nvidia.com/rdp/cudnn-archive
按照刚才的tf表格,找到对应的cudnn!下载,解压。(安装到哪都无所谓,你找的到就行)
把cudnn中的这三个目录,复制下来。
复制到cuda目录下:
然后在Path中添加4个路径:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\binC:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\lib\x64C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\libnvvp
(这里copy别的大佬里面的,请对照自己的添加!)
然后,cmd进入到你的demo下:
(我的是:cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\extras\demo_suite)
运行
deviceQuery.exe
bandwidthTest.exe
如果两个都pass,那么cuda以及cudnn都安装成功啦~
貌似感觉这一切都很顺利,然鹅,cuda和cudnn虽然安装完毕,令人抓狂就是在于安装之后,安装tensorflow-gpu却发现自己始终没有使用到gpu运行tf。后面开始填坑之路,但愿大家没有遇到这些错误,如果遇到了,请对照解埋坑(还有一些坑,遇到了,可能忘了怎么填了,也可能留下来暂时也没找到填坑方法,欢迎指正~)
下一节讲如何安装tensorflow-gpu,以及如何看是否是在gpu上运行的。