NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021

news/2024/10/29 19:42:37/

本方案中,推荐配置报价更新日期:2021/03/06

变更原因:

1)近期唯利是图的厂家将RTX显卡大部分卖给挖矿的,造成断货、暴涨

2)RTX A6000上市、增加新GPU配置方案

3)GX630M保证6块GPU卡全部在Pcie 16X(6个 16x)带宽,而不是市场其他品牌机型是4个16x+2个8x

 

nvidia的 Ampere架构-RTX 3090上市,该卡是第一个拥有超1万个流处理器的最强算力GPU卡,由于该卡外形尺寸巨大,长度达313mm,厚度3个槽,另外功耗到350w,常规GPU计算机/工作站最多支持1~2块,市场上是否有支持更多RTX3090的硬件配置?
西安坤隆公司的UltraLAB GX630M深度学习工作站可支持到最大6块RTX3090卡或7块RTX3070,用于深度学习训练和推理,该配置的深度学习工作站的张量计算单元(Tensor Core)FP16性能理论达到1.7PTflops

(一)UltraLAB深度学习工作站支持RTX30情况

 

No

机型

关键配置

备注

1

GX380i

/GX390i

intel第9/10代高频

(8核@5Ghz-10核5.2GHz)

最大2块RTX30系列

内存最大128GB

静音级

2块RTX3090性能超4块Titan RTX,

2块RTX3080性能超4块RTX2080ti

2

GT410P

intel第10代至尊处理器

(10核4.6GHz-18核4.2GHz),

内存最大256GB

最大5块RTX30系列,

20个硬盘位

静音级

4块RTX3080性能超7块Titan RTX和8块2080Ti

3

GX630M

2颗Xeon(最大56核)

最大6-7块RTX30系列

20个硬盘位

静音级

是目前具有最高GPU算力的工作站


UltraLAB深度学习工作站-GPU配备规格

下表是UltraLAB深度学习机型可供配置组合(按最高性能指标降序)

 

No

型号

卡数

CUDA核数

FP32 (单位Tflops)

张量计算FP16(单位Tflops)

显存带宽GBs

显存合计GB

应用推荐

 

1

A6000

7

75264

280

2184

768

336

CNN+RNN

2

RTX3090

7

73472

249

1995

936

168

CNN+RNN

3

A6000

6

64512

240

1872

768

288

CNN+RNN

4

RTX3080

8

69632

238

1904

760

80

CNN

5

Tesla V100

16

81920

238

1760

653

192

CNN+RNN

6

RTX3090

6

62976

213

1710

936

144

CNN+RNN

7

RTX3080

6

52224

179

1428

760

60

CNN

8

RTX3090

5

52480

178

1425

936

120

CNN+RNN

9

A6000

4

83968

160

1248

768

192

CNN+RNN

10

RTX3080

5

43520

149

1190

760

50

CNN

11

RTX3090

4

41984

142

1140

936

96

CNN+RNN

12

RTX3070

7

41216

142

1141

448

56

CNN

13

RTX2080Ti

9

39168

121

990

616

99

CNN

14

RTX3070

6

35328

122

978

448

48

CNN

15

RTX3080

4

34816

119

952

760

40

CNN

16

Titan RTX

7

32256

114

910

672

168

CNN+RNN

17

RTX2080Ti

8

34816

108

880

616

88

CNN

18

RTX3090

3

41984

107

855

936

72

CNN+RNN

19

RTX3070

5

29440

102

815

448

40

CNN

20

RTX3080

3

34816

89

714

760

40

CNN

21

RTX3070

4

23552

81

652

448

32

CNN

22

A6000

2

21504

80

624

768

96

CNN+RNN

23

RTX3090

2

20992

71

570

936

48

CNN+RNN

24

Titan RTX

4

18432

65

520

672

96

CNN+RNN

25

RTX3070

3

23552

61

489

448

24

CNN

26

RTX3080

2

17408

60

476

760

20

CNN

27

RTX2080Ti

4

17408

54

440

616

44

CNN

28

RTX2080s

4

12288

44

252

496

32

CNN

29

RTX3070

2

11776

41

326

448

16

CNN

30

A6000

1

10752

40

312

768

48

CNN+RNN

31

RTX3090

1

10496

36

285

936

24

CNN+RNN

32

Titan RTX

2

9216

32

260

672

48

CNN+RNN

33

RTX3080

1

8704

30

238

760

10

CNN

34

RTX2080Ti

2

8704

28

220

616

22

CNN

35

RTX2080s

2

3072

22

126

496

16

CNN

36

RTX3070

1

5888

20

163

448

8

CNN

37

Titan RTX

1

4608

16

130

672

24

CNN+RNN

38

TITAN V

1

5120

14.90

110

652.80

12

 

39

RTX2080Ti

1

4352

13

110

616

11

CNN

 

 

从上述表格看:

(1) 6块RTX3090(6个全pcie 16x)已经接近nvidia DGX-2性能

(2) 4块RTX3090性能超9块RTX2080Ti或7块Titan RTX

(3)2块RTX3080性能超4块Titan RTX

(二)UltraLAB 深度学习工作站配置方案2020v4

2.1 图灵超算工作站GX380i配置方案-科研型

 

GX480i-01.jpg

 

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

1.1

UltraLAB GX380i 14932-SAX

intel第9代处理器(6核@4.9Ghz) /32GB DDR4/RTX3080 10GB/960GB SSD /4TB SATA/双塔式(2000w) /23"图显

10GB

30

238

CNNRNN

¥35,500

1.2

UltraLAB GX380i 14932-SBT

intel第9代处理器(8核@4.9Ghz) /32GB DDR4/

RTX3090 24GB/1.9TB SSD /8TB SATA/双塔式(2000w) /23"图显

24GB

36

285

CNNRNN

¥49,990

1.3

UltraLAB GX380i 14932-SA2X

intel第9代处理器(8核@4.9Ghz ) /32GB DDR4 /2*RTX3070/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显

16GB

41

326

CNN

¥49,990

1.4

UltraLAB GX390i 15064-SB2X

intel第10代处理器(10核@5.0Ghz) /64GB DDR4 /2*RTX3080/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显

20GB

60

476

CNN

¥62,600

1.5

UltraLAB GX390i 15096-SC2T

intel第10代处理器(10核5.0Ghz) /96GB DDR4 /2*RTX3090/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显

48GB

71

570

CNNRNN

¥79,990

1.6UltraLAB GX390i 15096-SC2E

intel第10代处理器(10核5.0Ghz) /96GB DDR4 /2*A6000/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显

96GB80624

CNNRNN

¥145,000


2.2 图灵超算工作站(GT410P)配置推荐-高性能型
 

GX490M-4.jpg

 

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

2.1

UltraLAB GT410P 14664-MB4X

intel第10代至尊处理器

(10核4.6Ghz )、64GB DDR4 /4*RTX3070/2TB SSD M2.SSD +6TB SATA/双塔式(双2000w) /27"-4K图显

32GB

81

652

CNN

¥94,500

2.2

UltraLAB GT410P 14596-MB5X

intel第10代至尊处理器

(12核4.5Ghz )、96GB DDR4 /5*RTX3070/2TB SSD M2.SSD +8TB SATA/双塔式(双2000w) /27"-4K图显

40GB

102

815

CNN

¥110,000

2.3

UltraLAB GT410P 145128-PC3T

intel第10代至尊处理器

(12核4.5Ghz )、128GB DDR4 /3*RTX3090/ 4TB Pci-SSD+ 10TB SATA/ 双塔式(双2000w)/27"-4K图显

72GB

107

855

CNNRNN

¥135,000

2.4

UltraLAB GT410P 14596-PC4X

intel第10代至尊处理器

(12核4.5Ghz )、96GB DDR4 /4*RTX3080/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显

40GB

119

952

CNN

¥119,000

2.5

UltraLAB GT410P 144192-PC4T

intel第10代至尊处理器

(14核4.4Ghz )、192GB DDR4 /4*RTX30904TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

96GB

142

1140

CNNRNN

¥159,990

2.6

UltraLAB GT410P 144128-PC5X

intel第10代至尊处理器

(14核4.4Ghz )、128GB DDR4 /5*RTX3080/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显

50GB

149

1190

CNN

¥139,990

2.7

UltraLAB GT410P 144256-PD5T

intel第10代至尊处理器

(14核4.4Ghz)、256GB DDR4 /5*RTX3090/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

120GB

178

1425

CNNRNN

¥185,000

2.8UltraLAB GT410P 144256-PD5E

intel第10代至尊处理器

(14核4.4Ghz)、256GB DDR4 /5*A6000/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

240GB2001560

CNNRNN

¥335,000

 


2.3 图灵超算工作站(GX630M)配置推荐-极致型

 

GX480M-02D1.jpg

 

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

3.1

UltraLAB GX630M 243192-MB6X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /6*RTX3070 /1.92TB SSD+2TB M2.SSD/42TB存储/双塔式(双2000w)/27"-4K图显

48GB

122

978

CNN

¥199,990

3.2

UltraLAB GX630M 243256-MB7X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /7*RTX3070 /1.92TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显

56GB

142

1141

CNN

¥220,000

3.3

ltraLAB GX630M 243256-PC5X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/256GB DDR4 /5*RTX3080 /1.92TB SSD+4TB P-SSD/70TB存储/双塔式(双2000w)/27"-4K图显

50GB

149

1190

CNN

¥223,000

3.4UltraLAB GX630M 241384-PC6X

2*Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /6*RTX3080 /1.9TB SSD+4TB P-SSD/70TB并行存储/双塔式(双2000w)/27"-4K图显

60GB1791428CNN¥248,000

3.5

UltraLAB GX630M 243192-MB4T

2*Xeon金6244(16核4.3GHz)/睿频4.3GHz/192GB DDR4 /4*RTX3090 /1.9TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显

96GB1421140

CNNRNN

¥256,000

3.6

UltraLAB GX630M 241384-PD5T2*Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /5*RTX3090 /1.92TB SSD+4TB P-SSD/90TB并行存储/双塔/27"-4K图120GB1781425

CNNRNN

¥299,000

3.7

UltraLAB GX630M 243768-180T6T

2*Xeon金6256(24核4.3GHz)/   睿频4.5GHz /768GB DDR4 /6*RTX3090(三槽)/3.84TB SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显

144GB

213

1710

性能近16块Titan V

¥375,000

 3.8UltraLAB GX630M 243768-180T7T

2*Xeon金6256(24核4.3GHz)/   睿频4.5GHz /768GB DDR4 /7*RTX3090(双槽)/4TB P-SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显

168GB2491990

最快最完美,性能超DGX-2

 ¥399,900
 3.9UltraLAB GX630M 243384-150T4E

2*Xeon金6256(24核4.3GHz)/睿频4.5GHz /384GB DDR4 /4*A6000  /4TB P-SSD+150TB并行存储/双塔式(双2000w)/32"-4K图显

192GB1601250

CNN+  RNN+  推理

 ¥399,900

3.10

UltraLAB GX630M 2331T-150T7E

2*Xeon金6254(36核3.9GHz)/睿频4.0GHz/1TB DDR4 /7*A6000 /双3.84TB SSD+6.4TB-P-SSD/240TB 并行存储/双塔式(双2000w) /32"-4K图显

336GB

280

2180

最强最完整

¥650,000

 

上述配置可以看出:

(1)UltraLAB GX630M大部分配置都已超越9块RTX2080ti/7块Titan RTX性能

(2)UltraLAB GX630M(编号3.7)的配置规格,其性能已经接近nvidia DGX-2,但其价格是DGX-2的1/10价格

 

欢迎测试验证

 

 


http://www.ppmy.cn/news/170796.html

相关文章

Win11+RTX3060显卡 配置cuda和cudnn

目录 Win11RTX3060配置CUDA等深度学习环境1. 下载前的准备工作2. 下载Anaconda3. 下载cuda4. 下载cudnn5. 小结 Win11RTX3060配置CUDA等深度学习环境 1. 下载前的准备工作 查看nvidia设置,右击它 点击nvidai控制面板,点击系统信息: 选择C…

ReID专栏(二)多尺度设计与应用

前言 多尺度流层可以更有效地提取多尺度信息,而基于显著性的学习融合层有利于重要特征通道的自动选择,因此MuDeep在学习鉴别模式方面很强大。其实这也是目前大多数深度学习任务发表论文的趋势,即多尺度、显著性特征的表示。 本教程禁止转载。…

iptables 基础

iptables防火墙 主要实现数据包的过滤、封包重定向和网络地址转换(NAT)等功能 iptables:用户空间的命令行工具,用于管理配置netfilter:真正实现功能的是netfilter运行在内核空间 iptables的4表5链 链:通过…

高考在即,京准GPS北斗卫星授时系统(子母钟)助力标准化考场

高考在即,京准GPS北斗卫星授时系统(子母钟)助力标准化考场 高考在即,京准GPS北斗卫星授时系统(子母钟)助力标准化考场 【摘要】时钟系统是校园网络中一个重要的精准计时系统,随着网络的普及&am…

android使用fat-aar打包,本地aar和第三方依赖库以及遇到的问题

android使用fat-aar打包,本地aar和第三方依赖库以及遇到的问题 为什么会用到fat-aar如何使用打出来的aarlib中存在多个架构,例如x86\x86_64我在打包okhttp和retrofit的时候遇到的问题 你遇到其他问题怎么处理? 为什么会用到fat-aar 需要把有…

【Python】实现一个类似于Thief的摸鱼软件

一 背景说明 之前用Thief摸鱼(Thief官网),觉得挺好用。对于其最基本的TXT摸鱼,准备在Python中扩展一下功能,使其能够通过爬虫,支持爬取热门小说网站的内容。 软件已经开源到:MoFish软件开源地址 功能是&…

台式计算机和笔记本,大一买买笔记本还是台式电脑好?

对于这个问题,我认为大一新生买笔记本电脑更好。 一是笔记本电脑可以随身携带,比如说本地上学的同学每天放学后可以轻松带回家。 二是台式机现在也不便宜,尤其是显卡由于之前的矿潮,涨价严重,一块2499元的RTX3060现在要…

笔记本电脑可以做网站服务器,个人笔记本能做网站服务器吗

个人电脑怎么做服务器?其实个人电脑跟服务器区别不大,只要一般的电脑配置可能没有服务器的配置性能高,如果用个人电脑做服务器的话,不能运行高计算能力要求相关的应用。当然,用于一般的个人网站之类的小应用,还是可以…