本文目标为搭建tensorflow-gpu环境。最终的环境为python 3.6 + cuda9.0 + cuDNN7.1 + tensorflow1.8-gpu。
由于电脑之前安装了tensorflow的cpu版本,现在要使用gpu版本,需要卸载已安装的cpu版本。由于我的python环境是anaconda集成环境,之前tensorflow安装采用的是pip安装,这里卸载直接采用pip卸载
pip uninstall tensorflow
本机环境:
- windows 10 , 64位系统
- i5-7500HQ
- NVIDIA GeForce GTX 1050
- Python:Anaconda集成环境,Python 3.6.2
安装CUDA
tensorflow官网要求最新的tensorflow-gpu应该使用cuda9.0版本。
运行支持 GPU 的 TensorFlow 所需满足的要求
- CUDA® 工具包 9.0。如需了解详情,请参阅 NVIDIA 的文档。请务必按照 NVIDIA 文档中的说明将相关的 CUDA 路径名附加到
%PATH%
环境变量中。- cuDNN v7.0。如需了解详情,请参阅 NVIDIA 文档。请注意,cuDNN 通常安装在与其他 CUDA DLL 不同的位置。请务必将您安装了 cuDNN DLL 的目录添加到
%PATH%
环境变量中。- CUDA 计算能力为 3.0 或更高的 GPU 卡
- 要使用不同版本的 cuDNN,您必须从源代码构建。
在NVIDIA官网的CUDA版本列表找到9.0下载。传送门
安装的时候有个槽点:由于我需要的python的环境,所以不需要整合Visual Studio,安装CUDA的时候一定不要勾选 Visual Studio Integration(这里需要自定义安装,默认的精简安装会选择这个选项!)。貌似这个Visual Studio Integration会匹配你的VS(本机装了VS2017),如果VS版本不对就会安装失败。所以强烈建议,不使用VS整合Tensorflow的同学一定不要勾选Visual Studio Integration。
安装完成后,会自动设置好环境变量。CUDA_PATH、CUDA_PATH_V9_0。如下图
可以在命令行检查环境是否正确。在命令行下输入:nvcc --version
,若有版本输出,则表明cuda环境是OK的,我的输出如下:
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Sep__1_21:08:32_Central_Daylight_Time_2017
Cuda compilation tools, release 9.0, V9.0.176
安装cuDNN
安装cuDNN需要注册登陆NVIDA DEVELOPER网站。由于我们的cuda版本是9.0,故cuDNN选择版本cuDNN v7.1.4 Library for Windows 10
下载得到一个压缩文件:cudnn-9.0-windows10-x64-v7.1_2.zip。
配置cuDNN环境变量,两种方案,一种NVIDIA cuDNN Guide给出,一种Tensorflow Installation Guide给出。
1、Tensorflow方案(我采用这种方式,亲测可用)
cuDNN 通常安装在与其他 CUDA DLL 不同的位置。请务必将您安装了 cuDNN DLL 的目录添加到
%PATH%
环境变量中
为了保险起见,我在系统PATH环境变量中,添加了3个关于cuDNN的目录。
2、NVIDIA方案(和CUDA环境交叉)
- 解压缩
- 复制
<installpath>\cuda\bin\cudnn64_7.dll
到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin
目录下 - 复制
<installpath>\cuda\ include\cudnn.h
到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\include
目录下 - 复制
<installpath>\cuda\lib\x64\cudnn.lib
到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\lib\x64
目录下 - 设置cuDNN环境变量:配置过CUDA_PATH即可。
- cuDNN installation Guide
安装Tensorflow-gpu
tensorflow installation guide,有时打不开,需要翻墙
在 Anaconda 内部,我们建议使用
pip install
命令来安装 TensorFlow,而不要使用conda install
命令。要安装 GPU 版本的 TensorFlow,请输入以下命令:
C:\> pip3 install --upgrade tensorflow-gpu
验证安装:
import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
print(sess.run(hello))
输出:
T:\src\github\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:1356] Found device 0 with properties:
name: GeForce GTX 1050 major: 6 minor: 1 memoryClockRate(GHz): 1.493
pciBusID: 0000:01:00.0
totalMemory: 2.00GiB freeMemory: 1.61GiBb’hello,tensorflow!’