深度学习常用显卡比较

news/2024/10/22 13:21:19/

Titan RTX深度学习评测结果

NVIDIA TITAN RTX 专为数据科学、AI 研究、内容创作和通用 GPU 开发而构建。它基于 Turing 架构搭建,具有 4608 个 CUDA 核心、576 个用于加速 AI 的全速混合精度 Tensor Core 核心和 72 个用于加速光线追踪的 RT 核心。TITAN RTX 还包含 24 GB GPU 显存,支持使用大批量样本训练神经网络、处理大型数据集,并适用于大型动画模型和其他占用大量内存的工作流程。

AI硬件供应商Lambda Labs对Titan RTX、RTX 2080Ti、Tesla V100(32GB)、GTX 1080Ti、Titan Xp、Titan V只对单GPU在各种深度学习训练任务上的训练速度进行测试结果。

在 FP 32 单精度训练上,Titan RTX 平均:

  • 比 RTX 2080Ti 快 8%;
  • 比 GTX 1080Ti 快 46.8%;
  • 比 Titan Xp 快 31.4%;
  • 比 Titan V 快 4%;
  • 比 Tesla V100(32 GB)慢 13.7%。
    在这里插入图片描述
    在 FP 16 半精度训练上,Titan RTX 平均:
  • 比 RTX 2080 Ti 快 21.4%;
  • 比 GTX 1080 Ti 快 209.7%;
  • 比 Titan Xp 快 192.1%;
  • 比 Titan V 慢 1.6%;t
  • 和 v100(32 GB)的对比还有待调整。
    在这里插入图片描述
    batch-size:
    在这里插入图片描述
    FP32 - 每秒钟处理的图像数量:
    在这里插入图片描述
    FP16 - 每秒钟处理的图像数量:
    在这里插入图片描述

NVIDIA英伟达GPU显卡算力

GPU显卡分类:

  • Tesla:用于技术和科学计算
  • Quadro:用于专业可视化
  • Jetson:用于AI自主机器
  • GeForce和TITAN:

在这里插入图片描述
官方说明在GPU算力高于5.0时,可以用来跑神经网络。显存越高,意味着性能越强大,因为显存越大,batch size就越大,CUDA核可以更加接近满负荷工作。

常见显卡的计算力:
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

深度学习GPU选择

GPU几个比较重要的参数:

  • GPU架构:
    不同款的GPU可能采用不同设计架构,比如GeForce 10系列的GTX 1080/1080Ti采用的是Pascal架构,而GeForce 20系列的RTX 2080/2080Ti采用的是Turing架构。不同架构的GPU,即使其他参数差不多,性能差别可能非常大。
  • CUDA核心数量
    CUDA核心数量越大越好,Geforce GTX 1080的CUDA核心数量是2560个。而Geforce RTX 2080Ti的CUDA核心数高达4352个。
  • 显存位宽
    代表GPU芯片每个时钟周期内能从GPU显存中读取的数据大小,这个值越大代表GPU芯片和显存之间数据交换的速度越快,性能越好。Geforce GTX 1080的显存位宽为256bit,Geforce RTX 2080Ti显存位宽为352bit。
  • GPU工作频率
    代表GPU每秒钟工作次数,单位为MHz,跟CPU的频率类似。该值越大代表性能越好。
  • 显存带宽
    代表GPU芯片每秒与显存交换的数据大小,这个值等于 显存位宽*工作频率,单位为GB/秒,该值越大,代表GPU性能越好。Geforce GTX 1080的显存带宽为320GB/秒,而它的升级版Geforce RTX 2080的带宽为448GB/秒。
  • 显存容量
    显存越高,意味着性能越强大,因为显存越大,batch size就越大,CUDA核可以更加接近满负荷工作。Geforce GTX 1080的显存为8GB,而该系列的旗舰版Geforce GTX 1080Ti的显存为11GB。Tesla系列显卡由于特殊的应用场景,有些型号的卡显存高达16G/24G不等。
  • 功耗
    GPU能耗,像Geforce这种消费级的显卡一般功耗非常高,Geforce GTX 1080的最大功耗为175W,Tesla P4的最大功耗为75W。像那种数据中心大规模级别的GPU部署,低功耗的显卡一年电费能省很多。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

参考资料
首个Titan RTX深度学习评测结果出炉:2019年你该选择哪款GPU?
推荐开发者使用的 GPU
NVIDIA英伟达GPU显卡算力一览(包含Tesla和GeForce、TITAN及RTX系列等)
英伟达显卡算力榜(nvidia GPU compute capability)
您的 GPU 计算能力
IT周见智
Choosing the Best GPU for Deep Learning in 2020
如何选择 GPU 搭建深度学习机器
深度学习GPU选择
Which GPU(s) to Get for Deep Learning: My Experience and Advice for Using GPUs in Deep Learning


http://www.ppmy.cn/news/127555.html

相关文章

cpu集成显卡性能排行(独立显卡和集成显卡哪个更好)

手机CPU和gpu的性能排行,高通真的打遍天下无敌吗? intel atom z3770或者nvida tegra k1随便就能把msm8974ac(高通805)秒出翔 G530集成显卡性能如何? G530处理器集成Intel HD1000核心显卡,性能比较一般,相当曾经老平台的GT210入门…

集成显卡和独立显卡那个好

集成显卡和独立显卡各有优缺点,具体哪一个更好要根据使用场景和需求来决定。 集成显卡是内置在电脑主板中的显卡,一般性能较低,适合于日常办公、网页浏览等简单任务。它的优点是价格较为便宜,且不会占用额外的电源和空间&#xff…

快速玩转Yolov5目标检测—没有好的显卡也能玩(一)

对目标检测关注很久了,比较有代表性的项目就是Yolov5了,前段时间终于安耐不住实验了一把。 多的不说了,先看下测试效果: 这是实时检测停车场的效果,还不错吧: 这是实时检测的北京卫视的效果: 安…

不知道显卡选择GeForce和Quadro哪个更好?超全科普来看

GeForce这个名字在游戏玩家的脑海中根深蒂固,但Quadro可能不太熟悉。与 GeForce 一样,Quadro 卡是图形卡,但它们是为不同目的而创建的。因此,它们也有不同的规格。两者之间的巨大价格差异可能会让一些人相信他们正在购买更好的显卡…

显卡怎么选

显卡怎么选? 冰小柠柠柠 人不得有点爱好嘛。 内容审核中 内容将在审核通过后自动发布 显卡可能是你电脑中最贵、也是对玩游戏影响最大的配件了。 按照以下几点来选: 流处理器的数量显卡的架构显卡的频率显卡的显存容量、位宽和显存频率散热规格 2…

rtx和gtx区别_gtx和rtx显卡哪个好

原文链接 更新时间:2021-01-29 16:52:54作者:haoxt gtx与rtx是NVIDIA英伟达的高端旗舰级独立显卡,许多用户纠结显卡买rtx还是gtx,那么同样是高端独立显卡,rtx和gtx有什么区别?gtx和rtx显卡哪个好&#xff…

04SpringCloud 消息中间件

为什么要使用消息中间件 同步通信:耗时长,受网络波动影响,不能保证高成功率,耦合性高。 同步,异步 并发:一段时间(1S)多个请求数 并行:时间节点,多个指令…

【BaseArray 数据结构】

文章目录 一、BaseArray 数据结构1. 属性2. 方法 二、BaseArray 使用场景三、BaseArray 底层运行原理 BaseArray 是一个通用的、基于数组的数据结构,它是许多其他数据结构(如链表、栈、队列等)的基础。以下是 BaseArray 的详细介绍、使用场景…