eGPU 能否一战?- Tensorflow GPU 基准测试

news/2024/10/30 11:20:34/

文章目录

  • 前言
  • 硬件环境
  • Tensorflow 版本
  • 基准测试脚本
  • 基准数据来源
  • 测试方法
  • 测试结果
  • 结论

前言


开始学习 Tensorflow,但是又不想投资一台专用的 GPU 工作站。我现在使用的主力电脑是:Thinkpad X1 Carbon,计划购置 eGPU 来加速 Tensorflow。

购置之前做了一些功课,发现对 eGPU 的游戏性能测试很多,但是缺乏准确的 Tensorflow Benchmarks 数据。只能摸着石头过河,根据网上资料进行推断,最终购买了 Gigabyte AORUS RTX 2070 Gaming Box。

安装好 Tensorflow-gpu 1.12 后,做了一个比较完整的 Tensorflow Benchmarks,看看 eGPU 在深度学习加速中,能否和内置 GPU 一战。

硬件环境


Thinkpad X1 Carbon 6th (2018) + Gigabyte AORUS RTX 2070 Gaming Box

CPU:Intel(R) Core(TM) i7-8550U CPU @ 1.80GHz (4核8线程)
Memory:16.0 GB @ 2133MHz
Storage:Samsung 512GB SSD
GPU 0:Intel(R) UHD Graphics 620
GPU 1:NVIDIA GeForce RTX 2070 @ 8GB(AORUS RTX 2070 Gaming Box @ H2D)
OS:Windows 10 Version 1809

Tips:

  • RTX 2070 Gaming Box 官方提供了两个版本的 firmware。出厂为:F1.0 标准版;为提高计算能力,更新为:H2D 高性能版。

Tensorflow 版本


采用了 Anaconda 编译版本,运行在 Anaconda 工作环境中。

Tensorflow GPU 版本及 CUDA、cuDNN 版本:

(base) C:\Users\administrator>conda list "tensorflow-gpu|CUDA|cuDNN" --name tf-gpu
# packages in environment at C:\Users\administrator\Anaconda3\envs\tf-gpu:
#
# Name                    Version                   Build  Channel
cudatoolkit               9.0                           1
cudnn                     7.3.1                 cuda9.0_0
tensorflow-gpu            1.12.0               h0d30ee6_0

基准测试脚本


  • 采用了 Tensorflow 官方基准测试脚本(Github - A benchmark framework for Tensorflow)。

注意!

  • 测试脚本的 master branch 对应 Tensorflow latest nightly version,与 release version 并不兼容。因此,需要 clone 对应版本的 branch。例如:我 clone 的是 cnn_tf_v1.12_compatible。
  • Anaconda 包含了 git 软件包,用指令:conda install git 来安装。
  • 使用 git 命令,直接从 Github 上将 benchmarks 脚本 clone 回来。
git clone --single-branch --branch cnn_tf_v1.12_compatible https://github.com/tensorflow/benchmarks.git

基准数据来源


我没有其它的 GPU/TPU 用于性能对比,因此采用了网上的数据,引用了以下基准测试结果:

  • 基准 | Tensorflow
  • 机器人之家 - TensorFlow GPU基准测试:2080 Ti vs V100 vs 1080 Ti vs Titan V
  • 知乎 - 3A平台上搭建机器学习平台(二)Benchmarks测试

测试方法


  • 所有模型都在合成数据集上进行训练,这能将GPU性能与CPU预处理性能有效隔离开来。
  • 对每个模型进行3次训练实验。测量每秒处理的图像数量,然后在3次实验中取平均值。
  • 测试命令:
python tf_cnn_benchmarks.py --num_gpus=1 --variable_update=parameter_server --model=<model_name> --batch_size=<batch_size>

实验中使用的 model_name 和 batch_size:

Model NameBatch Size
resnet5064
resnet15232
inception364
vgg1664
alexnet512

测试结果


模型 / GPU2070 eGPU1080-Ti20802080-TiVega 64V100
ResNet-50176.93203.99 (86.7%)209.89 (84.3%)286.05 (61.9%)190.58 (92.8%)386.63 (45.8%)
ResNet-15262.2282.83 (75.1%)82.78 (75.2%)110.24 (56.4%)68.71 (90.6%)131.69 (47.2%)
Inception v3113.24130.2 (87.0%)141.9 (79.8%)189.31 (59.8%)103.82 (109.1%)242.7 (46.7%)
VGG16110.23133.16 (82.8%)123.01 (89.6%)169.28 (65.1%)101.95 (108.1%)233 (47.3%)
AlexNet2258.942720.59 (83.0%)2567.38 (88.0%)3550.11 (63.6%)1573.01 (143.6%)4707.67 (48.0%)

单位:image/sec;百分比:2070 性能 / 当前 GPU 性能。

从测试结果来看:

  • AORUS RTX 2070 Gaming Box 大约是 2080/1080-Ti 的 83% 性能,2080-Ti 的 61.5% 性能,V100 的 47% 性能,比 Vega 64 略好。
  • 从 userbenchmark.com 的测试来看,RTX 2070 的游戏性能大约是 GTX 1080-Ti 的 86%。也就是说,eGPU 由于 Thunderbolt 3 的带宽限制,引起的性能下降约为 4%,完全在可接受的范围。
  • 由于 eGPU 的价格远远高于同型号内置 GPU(约高出¥2000 左右),因此性价比无法与内置 GPU 相比。
  • 但从另一方面看,内置 GPU 需购置一整套系统来维持运作。一套 RTX 2070 的主机约 ¥9500,这个价格又远远超过 eGPU 的价格了。

结论


  • eGPU 在性能上和内置 GPU 相当,损失约 4% 的性能。
  • 价格可以接受,性价比远超 GPU 主机。
  • 兼顾了性能和可移动性。
  • 通常 eGPU 扩展坞自带了 PD 充电功能,可直接给笔记本供电。
  • 噪声远小于 GPU 主机(办公室的 GPU 工作站实在是太吵,只好搬到机房去,在家不可能使用这么吵的主机)。
  • 用于深度学习入门及应用研究,同时又不打算购置一台 GPU 主机的用户,eGPU 是最佳选择!

Tips:

  • 选购 eGPU 可以参考 Best eGPU Enclosures Reviewed – External GPU Buyer’s Guide 2019。
  • 从性能、功能、便携、稳定性、价格多方面综合衡量,AORUS RTX 2070 Gaming Box 是最佳选择之一。

http://www.ppmy.cn/news/325637.html

相关文章

windows 10 右键新建菜单添加 Typora 或者Notepad++

添加 Typora&#xff1a; 1、打开注册表&#xff1a;regedit 2、在以下注册表路径下查看是否注册成功: 计算机\HKEY_CLASSES_ROOT\Applications\ 下查找 Typora.exe 3、新建以下.reg 文件&#xff0c;保存&#xff0c;执行&#xff0c;重启 Windows Registry Editor Version…

[MetalKit]45-Using eGPUs with Metal 在 eGPU上使用 Metal

本系列文章是对 metalkit.org 上面MetalKit内容的全面翻译和学习. MetalKit系统文章目录 对于那些像我一样需要原生 GPU 性能&#xff0c;却只有一个笔记本电脑&#xff0c;又不想再买一个台式机的人来说&#xff0c;解决方案似乎就是外置 GPU(eGPU)。但是 macOS 原来却并不支持…

一、MacBook Pro 使用eGPU-WTG篇,mac告别虚拟机

笔记本&#xff1a;MacBook Pro 18款13寸灰9R2 Windows To Go篇 硬件&#xff1a; 惠普S700 500G SSD 绿联移动硬盘盒2.5英寸Type-C 3.1 可拆线款 USB有线鼠标 1台win10 电脑 typeC转USB转接头 WTG思路&#xff1a;在移动硬盘里安装windows系统&#xff0c;refind也装在wi…

专业显卡深度学习_MacOS+AMD-eGPU打造深度学习环境 | 第2期

如果你准备入手苹果电脑,如果你还在N卡和A卡之间艰难抉择,如果你需要用苹果电脑研究深度学习,那么本文值得一读。最后给出的评测数据可以帮助你判断苹果电脑搭配外置显卡坞的性价比,以及决定是否在MacOS上运行深度学习程序。 1. 背景简介 在windows上经历过剪辑时蓝屏四次之…

egpu+mac+bootcamp

高级多显示器要求配上mac还要用windows加持这种组合&#xff0c;在经历了一番研究后决定上egpu。总的来说还是个比较风险的手法... 13macOS(2015 or later version) win10 家庭版 (on bootcamp)参考这篇文章极好的&#xff0c;原理也做到了由浅入深&#xff1a; https://egp…

MacBook外置显卡eGPU折腾笔记

MacBook外置显卡eGPU折腾笔记 硬件选购 当今市场上个人电脑的独立显卡,基本上能选的只有NVIDIA和AMD了,如果你想买外置显卡来打游戏的话,NVIDIA和AMD的都可以,但如果是像我一样准备用来做深度学习加速的,那最好还是选择NVIDIA了。 另外,如果要用来做深度学习加速,一定要…

在Ubuntu中使用雷电3外接显卡(eGPU)进行深度学习

sud种种很凑巧的因素&#xff0c;需要用这么一套设备做深度学习。 笔记本是联想yoga s730&#xff0c;两年前在某多多入手&#xff0c;显卡坞是技嘉gaming boxGTX1070&#xff0c;某鱼入手。 折腾了一上午&#xff0c;踩了一些坑&#xff0c;终于把这东西配置好了&#xff0c;下…

二、MacBook Pro 使用eGPU-连接eGpu篇,mac变身小台式机

接上篇文章&#xff0c;WTG做好以后&#xff0c;将要连接eGpu啦 硬件&#xff1a;蓝宝石RX590 8G D5超白金 OC 显卡坞&#xff1a;雷蛇 Core 战核X 每种显卡坞的操作可能不同&#xff0c;这里我的扩展坞是雷蛇的战核X&#xff0c;本文基于此硬件的实际操作。推荐个网站&#x…