原帖地址:http://www.anandtech.com/show/9969/jedec-publishes-hbm2-specification
高带宽存储器(HBM)技术解决了与现代DRAM相关的两个关键问题:它显着增加了计算设备(例如GPU)可用的带宽并降低了功耗。第一代HBM在容量和时钟速率方面有许多限制。但是,第二代HBM有望消除它们。
制定DRAM标准的主要半导体工程贸易组织JEDEC最近发布了第二代HBM(HBM2)的最终规范,这意味着该组织的成员已经批准了该标准。新的存储技术建立在原始JESD235标准的基础上,该标准描述了堆叠式存储设备,这些存储设备使用通过硅通孔(TSV)互连,并具有以中等数据速率工作的非常宽的输入/输出(I / O)接口。 JESD235A将帮助工程师进一步提高HBM存储芯片的性能,容量和功能。 HBM Gen 2对于即将推出的AMD和NVIDIA视频卡特别有用,这要归功于HBM2可以提供高达512 GB / s ~ 1 TB / s的内存带宽以及板载8、16甚至32 GB的内存。
HBM Gen 1:良好,但有局限性
最初的JESD235标准定义了具有1024位接口和最高1 Gb / s数据速率的第一代HBM(HBM1)存储芯片,该芯片堆叠了两个,四个或八个DRAM设备。在基本逻辑芯片上每个设备具有两个128位通道。每个HBM堆栈(也称为KGSD-已知的良好堆叠管芯)最多支持八个128位通道,因为其物理接口限制为1024位。每个通道实质上都是具有2n预取架构(每个内存读写访问为256位)的128位DDR接口,它具有自己的DRAM组(取决于密度,为8或16组),命令和数据接口,时钟速率,每个通道可以独立于堆栈中的其他通道甚至在一个DRAM裸片中工作。 HBM堆栈使用无源硅中介层连接到主机处理器(例如GPU)。
SK Hynix(唯一一家将其商业化的公司)生产的HBM第一代存储器KGSD堆叠了四个2 Gb存储器管芯,每个引脚的数据速率为1 Gb / s。 AMD使用这些KGSD(每个堆栈具有1 GB的容量和128 GB / s的峰值带宽)来构建其斐济GPU封装系统(SiP)和Radeon R9 Fury / R9 Nano视频卡。图形适配器具有4 GB的VRAM板载,在2016年还不多。虽然AMD的旗舰视频卡目前似乎没有容量问题,但每个图形适配器具有4 GB的内存是一个限制。 AMD最新的图形卡具有512 GB / s的内存带宽,以今天的标准来看,这是一个很大的数目,但即使如此,这也可能成为未来高端GPU的限制。
HBM Gen 2:事情变得更好
JSF235A标准概述了第二代HBM(HBM2)技术,它继承了具有2n预取架构,内部组织,1024位输入/输出,1.2 VI的物理128位DDR接口。 / O和核心电压以及原始技术的所有关键部分。就像之前的版本一样,HBM2在每个KGSD的基本逻辑裸片(2Hi,4Hi,8Hi堆栈)上支持两个,四个或八个DRAM设备。 HBM Gen 2将堆栈中的DRAM设备的容量扩展到8 Gb,并将支持的数据速率提高到每针1.6 Gb / s甚至2 Gb / s。另外,新技术带来了重要的改进,以最大程度地提高实际带宽。
HBM2的主要增强功能之一是其伪通道模式,该模式将通道分为两个单独的子通道,每个子通道分别具有64位I / O,从而为每个存储器的读写访问提供128位预取。伪通道以相同的时钟速率运行,它们共享行和列命令总线以及CK和CKE输入。但是,它们具有独立的存储体,它们分别解码和执行命令。 SK Hynix表示,伪通道模式可优化内存访问并降低延迟,从而提高有效带宽。
如果出于某种原因,ASIC开发人员认为伪通道模式不是其产品的最佳选择,那么HBM2芯片也可以在传统模式下工作。虽然存储器制造商期望HBM2提供比以前更高的有效带宽,但取决于存储器控制器的开发人员,下一代存储器子系统的效率如何。无论如何,我们需要先测试实际的硬件,然后才能确定在相同的时钟频率下HBM2优于HBM1。
与第一代HBM相比,HBM2的其他改进包括用于通道的硬和软修复的通道重新映射模式(HBM1支持各种DRAM单元测试和修复技术以提高堆栈的产量,但不支持通道重新映射),防过热保护(KGSD可以提醒内存控制器温度不安全)等。
第二代HBM存储器将使用比第一代HBM更高的制造技术来生产。例如,SK Hynix使用其29nm工艺为其HBM1堆栈制造DRAM管芯。对于HBM2内存,该公司打算使用其21nm工艺。得益于更新的制造技术和更高的有效带宽,HBM2在其数据速率上应该比HBM1具有更高的能源效率,但是目前我们还没有确切的细节。无论如何,HBM2可能比GDDR5和GDDR5X更节能,因此很有可能在将来成为高端显卡的首选存储器。
三星电子本周表示已经开始批量生产HBM2存储器,但并未透露太多细节。三星的HBM2 KGSD具有4 GB的容量,每个引脚2 Gb / s的数据速率,并且基于四个8 Gb DRAM芯片。内存芯片将使设备制造商能够构建具有16 GB内存的SiP。值得注意的是,三星决定为其HBM2堆栈使用8 Gb DRAM芯片。由于使用8 Gb DRAM IC,该公司可以通过更改DRAM层数相对容易地增加或减少其KGSD的容量,因此这一决定似乎是合乎逻辑的。 DRAM制造商使用其20nm工艺生产HBM2 DRAM KGSD。不幸的是,三星没有透露新内存堆栈的实际功耗。
HBM2内存堆栈不仅比HBM1 KGSD更快,容量更大,而且容量更大。 SK Hynix的HBM1封装尺寸为5.48毫米×7.29毫米(39.94平方毫米)。该公司的HBM2芯片的尺寸为7.75毫米×11.87毫米(91.99平方毫米)。此外,HBM2堆栈也将比HBM1 KGSD高(0.695毫米/0.72毫米/0.745毫米对0.49毫米),这可能需要ASIC(例如GPU)的开发人员在其SiP上安装散热器以补偿任何热量。内存堆栈和GPU之间的高度差异会消失,以保护DRAM,并保证高带宽内存的足够散热。
第二代HBM2的占用空间更大,这意味着即将推出的具有多个存储器堆栈的SiP将需要更大的硅中介层,这意味着它们将比基于第一代HBM的SiP稍贵。由于HBM1和HBM2的交错微凸点图案的几何参数相同,因此对于两种类型的存储器,无源硅中介层的复杂度将保持相同。一个好消息是,要启用512 GB / s的带宽,只需要两个HBM2堆栈,这意味着从每mm2的带宽角度来看,新的内存技术仍然非常高效。
FormFactor和Teradyne在2015年半导体晶圆测试研讨会上的演讲中的幻灯片
由于SK Hynix的HBM1 KGSD比该公司的HBM2堆栈小,因此它们将比第二代高带宽存储器更适合小型SiP 。因此,这家韩国DRAM制造商可能会保留其HBM1芯片的生产一段时间。
新的用例和行业支持
由于具有更高的容量和数据速率,HBM2存储器堆栈在配置方面将非常灵活。例如,有可能建立一个2 GB KGSD,其256 GB / s的带宽仅使用两个8 Gb内存管芯。这种内存堆栈可用于为笔记本电脑或超小型个人计算机设计的图形适配器。此外,它还可以用作带有内置图形的混合微处理器的外部缓存(与英特尔使用其eDRAM缓存以提高其集成图形处理器的性能相同)。尚待观察的是提供256 GB / s带宽的HBM2堆栈的成本。如果HBM2和必要的中介层仍然与HBM1一样昂贵,则它将很可能继续仅用于高级解决方案。
由于DRAM制造商准备了各种KGSD配置,因此期望新型设备开始使用HBM2。三星和SK Hynix相信,除了图形卡和HPC(高性能计算)卡外,各种服务器,网络和其他应用程序还将利用新型内存。 SK Hynix表示,截至2015年9月,已有10多家公司在开发具有HBM支持的片上系统(包括ASIC,x86处理器,ASSP和FPGA)。
第一代HBM存储器可提供出色的带宽和能效,但是它仅由一家DRAM制造商生产,并没有得到各种ASIC开发商的广泛支持。相比之下,三星电子和SK Hynix这两家控制着全球DRAM总产量50%以上的公司将生产HBM2。美光科技尚未确认其建造HBM2的计划,但是由于这是一种行业标准类型的内存,因此,如果该公司希望生产它,则可以打开大门。
总体而言,业界对高带宽存储技术的支持正在增长。有10家公司致力于HBM支持的SoC,领先的DRAM制造商正加紧生产HBM2。第二代HBM的潜力似乎很高,但成本仍然是主要问题。无论如何,看到来自AMD和NVIDIA的具有HBM2 DRAM的下一代图形卡,并发现它们由于新的Polaris和Pascal架构以及新型的内存而具有的功能,将非常有趣。