英伟达Tesla P100超级计算机组件全面登陆PCIe总线

news/2024/10/17 20:31:07/

英伟达公司已经推出了其Tesla P100加速芯片,采用PCIe卡形式且可接入标准服务器节点以支持人工智能与超级计算机级别的工作负载处理工作。

P100公布于今年4月在加利福尼亚州召开的英伟达GPU技术大会上:这款16纳米FinFET图形处理器在一块600平方毫米晶片上容纳有150亿个晶体管。其设计目标在于每秒实现万亿级别计算,适用软件包括神经网络训练以及天气与粒子模拟。这款GPU采用英伟达的Pascal架构,能够实现CPU与GPU之间的页面迁移。

每块P100包含4个每秒40 GB英伟达NVLink端口,分部接入GPU集群。NVLink为英伟达公司设计的高速互连机制。IBM公司的Power8+与Power9处理器皆支持NVLink,允许主机的Power CPU核心直接与各GPU相对接。

这些来自蓝色巨人的芯片主要服务于美国政府所拥有的各超级计算机及其它高负载设备。不过在民用领域,我们普遍使用x86处理器支撑后端工作负载。

时至今日,数据中心内的绝大部分计算处理器由英特尔公司提供;然而英特尔方面并不支持英伟达的NVLink,而且似乎也没有在这方面做出努力的计划。因此,英伟达方面拿出了自己的解决办法,即PCIe版本的Tesla P100卡,帮助服务器构建人员将加速处理器同其x86设备相结合。这意味着GPU能够通过NVLink实现彼此间的高速通信,同时经由PCIe总线接入主机CPU。

目前PCIe P100分为两种型号:其一HBM2堆栈内存为16 GB且内存传输带宽为每秒720 GB;其二成本更为低廉,HBM2内存为12 GB且内存传输带宽为每秒540 GB。二者皆采用PCIe gen-3 x 16通道以实现每秒32 GB传输能力。

二者在处理64位双精度运算与32位单精度运算时的持续性能水平分别为4.7万亿次与9.3万亿次;16位半精度运算则为18.7万亿次。这一水平略低于原始P100在双、单与半精度运算中的5.3万亿次、10.6万亿次与21万亿次。原因在于,PCIe卡的性能由于发热量的考虑而必须有所牺牲——毕竟我们不希望塞满了GPU加速节点的机架由于全力运转而被融化。

另外,NVLink P100的额定功率为300瓦,而其16 GB PCIe表亲的功率水平为250瓦,12 GB版本的功耗则更低。

顺带一提,如果大家希望在非NVLink服务器上使用全速、全功率Tesla P100,其实也是能够实现的:系统制造商能够在主机上添加PCIe gen-3接口,从而实现额外的性能提升。不过如果大家只希望使用PCIe,那么目前的低功耗、低性能PCIe选项已经非常理想。

“PCIe P100将成为主力系统——即大规模计算设备,”英伟达公司高级产品经理Roy Kim在接受采访时表示。他同时建议称,每个服务器节点可以接入4到8块该PCIe卡。

这些PCIe设备预计将在2016年第四季度正式推出,且面向克雷、戴尔、惠普、IBM以及其它英伟达合作伙伴发布。其最终定价将取决于经销商,但根据我们得到的消息,其价格会与目前的英伟达K80基本持平——后者的售价约为4000美元。

而在价值层面,英伟达方面告诉我们,P100 PCIe卡将在今年晚些时候作为欧洲各顶级超级计算机的构建组件,其中包括位于瑞士卢加诺国家超级计算中心的Piz Daint。
本文转自d1net(转载)


http://www.ppmy.cn/news/177984.html

相关文章

上海贝尔s1240程控交换机

有没有懂上海贝尔s1240的大佬,有问题想咨询一下,有偿。

大族激光打标机与西门子300以太网通讯协议

大族激光打标机与西门子300以太网通讯协议 技术交流 资源共享 博主QQ:68823886 原创文章,转载请注明: 转载自莫如技术团队 本文链接地址: http://mooru.cn/19029.html

性能远超小型机?新华三推出最新HPE Superdome Flex 280服务器

今年6月,新华三宣布推出专门针对企业数字化转型的关键业务服务器HPE Superdome Flex 280,用于承载SAP HANA或Oracle数据库等核心应用,同时兼顾大规模物联网和人工智能数据集等新技术带来的创新需求。 源自HPE的Superdome Flex系列产品&…

飞思卡尔智能车经验

本人参加了第九届飞思卡尔智能车比赛,光电组。现在分享下自己的心得和体会,希望能够给后来人带来点帮助。为什么不在智能车论坛发,因为那个论坛我现在不经常上了,如果有人回复我怕不能及时回复,下面这些内容适合新手&a…

西门子200SMART-通讯

第一章 通信概述 1.1 概述 1.2 OSI网络架构模型介绍 1.3 RS232/RS485/RJ45介绍 1.4 S7-200Smart PLC通信协议 第二章 串口通讯 2.1 串口通讯概述 2.2 Modbus串口通讯(1) 2.2 Modbus串口通讯(2) 2.3 S7-200 Smart Modbus RTU应用实…

西门子S7-200 SMART 入门级项目案例详解

这里写自定义目录标题 一、起保停控制二、单按钮控制三、正反转控制四、混合控制五、顺序控制 一、起保停控制 二、单按钮控制 三、正反转控制 四、混合控制 五、顺序控制

西门子200SMART笔记

第一章 PLC概述 上位机 控件库 HslControls SunnyUI 初级课程 传感器接线方式 棕色(BN) 蓝色(BL) - 黑色(BK) 信号线 NPN型 1M(M)接 24VPNP型 1M(M)接 0V PLC输出接线 电路图 —> 梯形图 过载 停止信号 输入端接常闭 ----> 因为接了常闭 所以输入点有信号 程序中的常…

IBM存储DS5020 配置

一.管理软件安装: 将DS5020随机带的管理光盘storage manager 10.6,放入可以用来管理工作的机器,可以是WINXP也可是WINDOWS SERVER 2003,安装默认即可,过程省略。 二.环境: 1&a…