深度学习设备购置RTX 2080Ti + i7 9700k+ Z390 A主板

news/2024/11/8 15:14:02/

文章目录

    • 购置清单
    • GPU选购参考指标
    • CPU及主板选购参考
    • 固态硬盘选择
    • 参考教程及相关问答
    • Reference

目标:构建一个深度学习个人工作站
组装性能: 组装好后先装了windows系统用鲁大师跑分,最终63w分,超越99%用户,其中GPU性能良好排名第5,在显示测试时一度达到1000+fps,实力非常能打!!!

购置清单

硬件型号数量参考价格
CPUI7-9700k12899
GPURTX 2080ti18999
内存金士顿 DDR4 2666 8GB2259 * 2
主板ASUS Z390-A11749
机箱Tt(Thermaltake) 启航者S51139
电源海盗船 850W 支持2080ti1949
SSD固态硬盘三星 250GB M.2接口 860 EVO1389
  • 为什么不选择i7 8700+B360主板?

  • 一个非常重要的问题就是:与i7 8700搭配的主板B360仅拥有1个PCU-E X16显卡插槽,具体参数参考链接 ,因此不支持多显卡技术。

  • 未来如果需要跑大型神经网络实验需要利用两个显卡的算力时,就不再需要重新购买主板机箱重新搭建,可以在i7 9700k+Z390-a显卡主板机箱内直接加显卡,从而构建支持多显卡的高性能深度学习工作站。

  • CPU可支持内存条频率2666,选购内存条时需要注意频率可用

  • 主板板型ATX板型,外型尺寸 30.5 x 24.4 cm,需要考虑可以放置下主板的机箱

GPU选购参考指标

  • GPU:

    GPU的选购从高性价比出发和高性能出发,最后选择了RTX 2080ti 和 TITAN RTX两款型号。

    • 高性价比 — RTX 2080ti

      • GIGABYTE GEFORCE RTX 2080ti

        京东购买链接

    • 高性能 — TITAN RTX

      • NVIDIA TITAN RTX

        亚马逊Titan RTX 深度学习显卡 链接

    • Q:怎么选择一块做深度学习的GPU?(CUDA核心?时钟频率?RAM大小?)

      A:针对不同神经网络架构,需要考虑显卡的参数优先级如下:

      • 卷积神经网络以及Transformer模型(Convolutional networks and Transformers):

        Tensor Cores > FLOPs > Memory Bandwidth > 16-bit capability

      • 循环神经网络(Recurrent networks):

        Memory Bandwidth > 16-bit capability > Tensor Cores > FLOPs

      即如果我想要用于跑循环神经网络,我需要优先考虑显存带宽,然后是16位半精度计算能力,接下来是Tensor核,最后考虑32位浮点数计算能力。

    • RTX 2080ti和Titan RTX的重要参数性能对比如下:

      参数RTX 2080tiTitan RTX
      CUDA核心4352个4608个
      显存容量11GB24GB
      核心频率1350/1635MHz1770MHz

上图为NVIDIA各型号GPU性能对比,除去前三价格高达五六万的GPU, RTX 2080ti和TITAN RTX 已经是性价比最高的最适合用于搭建深度学习环境的机器(已用紫色框图标出)。

CPU及主板选购参考

  • CPU主要考虑intel i7 8700k和i7 9700k两个版本:

    • 其中i7 8700k在京东英特尔官方旗舰店目前缺货,京东上的第三方卖家对i7 8700k的出价是2749,并由第三方卖家开发票并负责售后。
    • 而i7 9700k在京东英特尔官方旗舰店有售,价格为2899,和主板一起搭配购买还可以省449,综合考虑,购买i7 9700k的性价比更高也更有保障。
  • 主板:

    官方推荐主板 Z390 ,单独购买的话京东链接为1749元,和CPU一起搭配购买京东链接总价4199,可节省449元。

主板详细参数如下:

类型规格
主板芯片Intel Z390
CPU类型第九代/第八代Core i9/i7/i5/i3/Pentium/Celeron
内存类型4 x DDR4
最大内存容量64GB
PCI-E插槽3×PCI-E X16显卡插槽,3×PCI-E X1插槽
多显卡技术支持NVIDIA 2-Way SLI技术
存储接口2×M.2接口,6×SATA III接口
USB接口4×USB3.1 Gen 2接口,4×USB3.1 Gen 1接口,6×USB2.0接口
视频接口1个DP接口,1个HDMI接口
电源接口1个8针,1个24针电源接口
其他接口1×RJ45网络接口,1×光纤接口,5×音频接口,1×PS/2键鼠通用接口
RAID功能支持RAID 0,1,5,10
主板板型ATX板型
外形尺寸30.5×24.4cm

固态硬盘选择

我们挑选的与i7 9700k相对应的Z390-A主板配备有2×M.2接口,6×SATA III接口。(MSATA是专门针对笔记本用的固态硬盘,小尺寸,与我们工作站主板不适配),固态硬盘主要考虑存储容量和接口:

  • 存储容量选择:240GB-256GB

    这里我们搭建深度学习环境对固态硬盘的存储容量需求并不是很大,只需要安装linux系统以及在其上搭建环境,并安装一些必要的软件,因此购买240GB-256GB容量的SSD固态硬盘就已经够用。

  • 接口:M.2接口

    固态硬盘有三种常见接口:M.2 、 SATA 3.0 以及 MSATA

    • M.2 接口

      M.2接口有两种通道,也是有速度差异的。PCI-E通道和sata通道。这也取决于自身的主板硬件的支持与否。PCI-E理论接口速度高达32Gbps!相比SATA 通道的6Gbps高了五倍多。在价格差别不大的情况下,尽可能选择M.2插口的固态硬盘。

    • SATA 3.0

      这种接口为很多笔记本用户所选择的原因就在于通用性很强,既可以取代原装硬盘,也可以利用专用的光驱盒装在光驱位,理论速度6Gbps,对比32Gbps的M.2性能要弱很多。

参考教程及相关问答

参考教程链接_需要梯子

Q:多GPUs会让我的训练过程更快吗?

A:CNN和RNN可以很容易做并行化,但是包含transformer的全连接神经网络并不能直接做并行化,需要由专门的算法使其能够在GPU上执行。

现在很多开源库如TensorFlow和PyTorch可以为循环神经网络和卷积神经网络做并行化。针对卷积,你可以看到2/3/4个GPU带来的大约1.9倍/2.8倍/3.5倍的提速。对于循环神经网络,序列长度是针对NLP问题最重要的参数,与卷积神经网络相比会得到一个相似或稍弱的速度提升效果。

全连接网络,包括transformer,在数据并行化方面性能很差需要更高级的算法来对这部分的网络进行加速。如果你想要运行transformer在多GPUs上,你应该先尝试在一个GPU上运行它并观察是否运算得更快。

Q:NVIDIA的利弊?

Pros:NVIDIA的标准库使得在CUDA上构建第一个深度学习库非常简单,因为AMD的OpenCL显卡就没有这样强有力的标准库。这个早期的优势和NVIDIA的强力社区支持相结合使得CUDA社区增长扩大得非常快。

Cons:NVIDIA的新政策是在“数据中心(data center)”使用CUDA只允许在Tesla型号的GPUs上运行,不允许GTX或RTX系列。但关于数据中心也没有明确的定义。而Tesla卡花费10倍价格并不能带来足够的性能和速度提升。

Reference

Titan RTX评测 _ CV任务

6200美元,高性价比构建3块2080Ti的强大工作站

这一篇文章有提到一个重点:“请购买 after-market GPU(如 EVGA 或 MSI),而不是英伟达 Founders Edition。”

7000美元,搭建4块2080Ti的深度学习工作站

RTX 2080时代,如何打造属于自己的深度学习机器


http://www.ppmy.cn/news/234611.html

相关文章

主板上的南桥和北桥是什么意思?

我们的主板上有两个很重要的芯片,分别叫北桥芯片组、南桥芯片组,它们的作用是什么呢?要知道早期的制造工艺相对粗糙,晶体管的数量相对偏少,因此曾经的处理器集成度较低,必须要由主板芯片组来承担大量功能&a…

Z790和Z690主板区别 Z790和Z690主板哪个好

z790主板和z690主板区别是什么 区别一:PCIE通道数量 增加了PCIe4.0通道的数量,从12条提升至20条,而减少了PCIe 3.0通道的数量,从16条减少到8条 区别二:20Gbps USB3接口数量从4个提升到5个 区别三:提供了对高…

Android 11.0 系统开机自启动第三方app

1.前言 在11.0的系统rom定制化开发中,由于有些第三方app,需要在接收到开机广播后,启动app,但是在10.0以后第三方app就接收不到开机广播了 只有系统app才可以接收到开机广播了,所以在app内通过接收开机广播自启动就没法实现了 这就需要在系统中添加监听开机完成广播的功能, …

联想微型计算机620S,小巧、精致!联想ideacenter 620s远不止如此

【PConline 单机评测】目前个人PC基本上分为台式机与笔记本电脑两大类型,台式机笨重的机箱成为限制它最大的缺陷,现在越来越多的人因为台式机机箱太大而选择笔记本电脑。现在的电脑硬件技术越来越完善,笔记本电脑的性能已经足够支持我们完成日…

黑苹果AX201网卡驱动小白教程,小新pro13不换网卡也能上网!

前言 最近买了台小新pro13,捣鼓了一下黑苹果。安装完之后不能上网,经过大神的指导,成功让小新pro13的黑苹果正常上网。当然了,如果你想更完美体验黑苹果,可以拆机更换网卡,例如DW1820A。我要求不高&#x…

黑苹果记(ThinkPad X200)

由于特殊原因(...)需迅速学习iPhone开发,本屌只有4年前ThinkPadX200小黑一台,暂无经济实力入手苹果机器,在试验虚拟机Mac系统未果的情况下(装上Xcode之后运行慢到菊花残),只得被迫走…

联想小新系列笔记本 黑苹果BIOS配置

Configuration 项目配置Wireless LANEnabledIntel Virtual TechnologyEnabledIntel Threading TechnologyEnabledBIOS Back FlashEnabledAlways On USBEnabledCharge in Battery ModeEnabledOneKey BatteryDisabledController ModeAHCI Mode Security 项目配置Intel Platfor…

Pytorch1.12.1+cu113安装记录

因为torch1.7.0对于SiLU算子导出不支持,需要1.7.1才支持.于是索性准备更新一下自己的算法版本库,查询到CUDA11.3支持的最高Pytorch版本为1.12.1,于是统一做一下更新.这里采用离线下载的方式,因为在线下载实在是太蛋疼了 1. Pytorch离线包下载 这是官方提供的版本,我这里不直接…