DDR4、GDDR5、GDDR6内存的区别

news/2024/11/16 12:47:18/

计算机内存主要有两种类型:主内存(RAM)图形内存(VRAM),前者利用 DDR4(很快还会有 DDR5),而后者利用 GDDR5(和 GDDR6)标准。但这两者有什么区别,在这篇文章中,我们将DDR4 与 GDDR5 和 GDDR6内存进行比较并检查它们之间的异同。

DDR4 与 GDDR5 内存

  • DDR4 的运行电压低于 GDDR5,准确地说是 1.2 V,GDDR5 高达 1.5v,这是因为后者基于 DDR3 内存标准,该标准也具有 1.5v 电压。
  • DDR4 和 DDR3 每个通道都使用 64 位内存控制器,双通道使用 128 位总线,4通道使用 256 位总线。GDDR5 内存每个通道一个微不足道的 32 位控制器。
  • 虽然 CPU 内存配置更宽但通道更少(DDR3/DDR4 的每个 DIMM 一个),但GPU 可以支持任意数量的 32 位内存通道,这就是许多高端 GPU(如 GeForce RTX 2080 Ti 和 RTX 2080)分别具有 384 位和 256 位总线宽度的原因。

这两款 RTX 20 系列卡都通过 8 个(对于 2080)和 12 个(对于 Ti)32 位内存控制器或通道连接到 1GB 内存芯片。GDDR5 和 GDDR6 也可以在所谓的翻盖模式下运行,其中每个通道而不是连接到一个内存芯片被分成两个。这也使制造商能够将内存容量增加一倍,并使具有 192 位总线宽度的 GTX 660 等混合内存配置成为可能。

GTX 660 Ti 有六个内存堆栈,在翻盖模式下位于顶部(每个堆栈包含两个芯片)。这将总线宽度减少到 192 位而不是 256 位

GTX 660 PCB

翻盖模式

  • DDR4 和 GDDR5 内存之间的另一个核心区别涉及 I/O 周期,就像SATA,DDR4 在一个周期内只能进行一次操作(读或写)。GDDR5 可以在同一周期内处理输入(读取)和输出(写入),实质上是将总线宽度加倍。
  • 还有突发长度(每次传输传输的数据)和预取的问题,DDR4 和 GDDR5 的 BL 均为 8,预取为 8n,(每个周期 32 个字节)。

所有这些可能会使 DDR4 内存处于不利地位,但这种配置实际上适合这两种设置,CPU 基本上是顺序的,而 GPU 运行数千个并行内核。前者受益于低延迟和更纤薄的通道,而 GPU 需要更高的带宽和宽松的时序。

GDDR5 对比 GDDR5X 对比 GDDR6

  • GDDR6 之前是 GDDR5X,它更像是一种半代升级。GDDR5X 的每个引脚的传输速率高达 14GBit/s,是 GDDR5 的两倍,同时还将电压从 1.5v 降低到 1.35v。
  • 这是通过使用更高的预取来实现的。与 GDDR5 不同,GDDR5X 具有 16n 预取架构(而 G5 上为 8n)。这允许它每个周期(每个通道)获取 64 字节(512 位)的数据,而 GDDR5 被限制为 32 字节(256 位)。
  • GDDR5X还具有16 BL,其允许存储器传送64B高速缓存行。GDDR5 和 DDR4 的突发长度限制为 8(或每周期 32B x 2)和 8n 预取。

类似于从 GDDR5 到 GDDR6 的过渡如何将突发长度和预取(8 到 16)加倍,DDR5 也有一些附

加功能:

  • 与 GDDR5 类似,DDR5 利用每个 DIMM 两个独立的 32 位内存控制器/通道。因此,每个 DDR5 DIMM 都是双通道的,而一对则是四通道配置。
  • 除此之外,每个 DDR5 通道的突发长度 (BL) 和预取为 16,允许 DIMM 上的每个通道传输与两个 DDR4 DIMM 相同数量的数据。还支持 32 长度模式,只需一次传输即可获取多达 64 字节的缓存行。
  • DDR5 的 JEDEC 速度最高可达 8,400 Mbps,而 DDR4 的速度限制为 3200 Mbps。请注意,如今的供应商拥有 4000MHz (MT/s) 套件,但这些套件实际上已超频。

 

  • DDR5 有 32-bank 结构,有 8 个 bank 组(每个 BG 四个),是 DDR4 的两倍。这有效地使内存访问可用性加倍。作为补充,DDR5还采用了Same Bank Refresh功能,与 DDR4 不同,当内存条正在运行或刷新,允许访问其他内存bank。
  • 相比之下,GDDR5X 和 GDDR6 具有类似于 DDR4的 16 Bank结构,而 GDDR5 仅限于 8 Bank。
  • 与 DDR4 一样,I/O 总线将通过 MUX 同时与两个 BG(每个通道)交互,从而实现更高的有效预取和传输速率。

  • DDR5 还将内存密度从 16Gb 一路(向上)增加到 64Gb,并且 VDD 和 VPP 电压都从 1.2v 下降到 1.1v,以减少功耗。

要了解突发长度的含义,需要知道内存是如何访问的。当 CPU 或缓存请求新数据时,地址被发送到内存模块和对应行,然后定位对应列(如果不存在,则加载新行)。然后整个列通过内存总线以突发方式发送,对于 DDR4 和 GDDR5,每个突发为 8(或 16B)。DDR5(和 GDDR5X/6),已增加到多达 32 个(最高 64B)。每个时钟有两个突发,它们以有效数据速率传输。

GDDR6 与 GDDR5X 一样,具有 16n (BL16) 预取,但分为两个通道。因此,GDDR6 每个通道提取 32 个字节,总共 64 个字节,就像 GDDR5X 一样,是 GDDR5 的两倍。虽然这不会提高 GDDR5X 的内存传输速度,但它提供了更多功能。突发长度也和 GDDR5X 16(64B)一样。

与 DDR4 一样,GDDR5 和 GDDR6 均具有 16 Bank 配置

GDDR6 可以获取与 GDDR5X 相同数量的数据,但可以跨越两个独立的通道,使其能够像两个较小的芯片一样工作,而不是像一个更宽的单个芯片。除此之外,GDDR6 还将密度增加到 16Gb(与 GDDR5X 相比为 2 倍,JEDEC 最大值为 32Gb)并通过将基本时钟从 12Gbps 增加到 14Gbps(最大值为 16Gbps)来显着提高带宽。

DDR4/DDR5/GDDR5=DDR;GDDR5X/GDDR6= QDR

DDR3、DDR4、GDDR5 和较新的 DDR5 标准使用双倍数据速率或 DDR 数据传输方案。这意味着位(等于 BL)在时钟 (WCK) 的上升沿和下降沿传输,使用 GDDR5X,显存四倍频模式

因此,数据位每个周期切换四次(比 DDR 快两倍)或比字时钟 (WCK) 快四倍。GDDR5X 和 GDDR6 都可以在 DDR 或 QDR 模式下运行。但是,在DDR中运行前者时,有效速度下降了一半。借助 GDDR6,可以以高达 14 Gbps 的全速使用 DDR 和 QDR 模式。例如,以 14Gbps 运行的 GDDR6 模块,对于 DDR 设备,WCK 以 7GHz 运行,对于 QDR 设备以 3.5 运行。在这两种情况下,命令和地址时钟 CK 将以 1.75GHz 运行,命令和地址线本身以 1.75Gbps 运行。

GDDR6 与 GDDR6X

NVIDIA 是第一家在其 RTX 30 系列 GPU 中选择 GDDR6X 内存的供应商,至少是高端 GPU。它将每引脚带宽从 14Gbps 增加到 21Gbps,将总带宽增加到 1008GB/s,甚至超过 3072 位宽的 HBM2 堆栈。

GDDR6XGDDR6GDDR5XHBM2
B/W Per Pin21 Gbps14 Gbps11.4 Gbps1.7 Gbps
芯片容量1 GB (8 Gb)1 GB (8 Gb)1 GB (8 Gb)4 GB (32 Gb)
No. Chips/KGSDs1212123
B/W Per Chip/Stack84 GB/秒56 GB/秒45.6 GB/秒217.6 GB/秒
总线宽度384 位384 位352 位3072 位
Total B/W1008 GB/秒672 GB/秒548 GB/秒652.8 GB/秒
DRAM电压1.35 伏1.35 伏1.35 伏1.2V
数据速率QDRQDRDDRDDR
SignalingPAM4二进制二进制二进制

该图像有一个空的 alt 属性; 它的文件名为 GDDR6X_Data_Eye-1024x641.png

GDDR6X 内存背后的秘密武器是 PAM4 编码。简而言之,与使用 NRZ 或二进制编码的 GDDR6 相比,它使每个时钟的数据传输增加了一倍。

该图像有一个空的 alt 属性; 它的文件名为 NRZ_v_PAM4-Labeled-1024x638.png

使用 NRZ,只有两个状态,0 和 1。PAM4 将其翻倍为四个,00、01、10 和 11。使用这四个状态,可以在每个周期发送四位数据(每个边缘两个)。PAM4 的缺点是价格高,尤其是在 GDD6X 的较高频率下。这就是之前没有人尝试在消费者内存中实现它的原因。

这是一个缺点。虽然 GDDR6 的突发长度为 16 字节 (BL16),但 GDDR6X 仅限于 BL8 或 8 字节,但由于 PAM4 信号,它的每个 16 位通道也将在每次操作中传送 32 字节。因此,带宽的大部分改进来自 GDDR6X 上更高的工作频率。GDDR6X 不是 JEDEC 标准,而是美光的专有解决方案。

高带宽内存 (HBM)

首先由AMD的斐济显卡普及,高带宽内存或HBM是一种具有宽总线的低功耗内存标准。与 GDDR5 相比,HBM 实现了更高的带宽,同时以小尺寸消耗更少的功率。

 HBM 采用低至 500 MHz 的时钟以符合低 TDP 目标,并通过大量总线(通常为 4096 位)来弥补带宽损失。AMD 的 Radeon RX Vega 卡是消费硬件中 HBM2 实现的最佳示例。HBM2 解决了 HBM1 的 4GB 限制,但有限​​的产量加上内存短缺使 AMD 无法利用消费级 GPU。  


http://www.ppmy.cn/news/266418.html

相关文章

使用hex6x.exe将out文件生成hex文件方法

首先你要有*.cmd文件和hex6x.exe和*.out文件。 其中out文件是上面一篇中提到的,在CCS里面编译成功的输出文件*.out。 *.cmd文件,里面的内容是这样的: debug\SEEDVPM642boot.out -a -memwidth 8 -boot -bootorg 0x90000400 -bootsection .boo…

题目内容: 一个多项式可以表达为x的各次幂与系数乘积的和,比如: 2x6+3x5+12x3+6x+20 现在,你的程序要读入两个多项式,然后输出这两个多项式的和,也就是把对应的幂上的系数相加然后

题目内容: 一个多项式可以表达为x的各次幂与系数乘积的和,比如: 2x63x512x36x20 现在,你的程序要读入两个多项式,然后输出这两个多项式的和,也就是把对应的幂上的系数相加然后输出。 程序要处理的幂最大…

hex6x.exe的使用

使用hex6x.exe将out文件生成hex文件方法 前言: 本文以CCS5.2,编译器版本为v7.3.4编译生成的*.out为例。生成hex文件需要有*.cmd文件和hex6x.exe和*.out文件。其中out文件是在CCS里面编译成功的输出文件*.out。 1.准备hex6x.exe应用程序 (1&…

小米6x更换关机音量键记录

拆机感悟记录 背景: 老妈用的手机,掉水里了,说当时已经关机,放了一会,然后出现不断开关机的现象,就觉得可能某个部件烧掉了。完后,手机电量耗尽,过了一两天,手机充电&am…

小米6X手机解锁(bl锁)

1. http://www.miui.com/unlock/index.html,申请解锁2. 手机:“设置 -> 更多设置 -> 开发者选项 -> 设备解锁状态”中绑定账号和设备。错误提示:“绑定失败 错误码401”,有网友说“关闭查找手机”,也有说关机…

惠普服务器系统装好服务器黑屏,惠普装win7系统黑屏怎么解决_惠普装win7系统黑屏如何修复...

随着品牌电脑的发展,许多用户都开始选择适合自己的品牌电脑,可是这样也不能保证到手的电脑不会出现故障,比如最近有用户自己的惠普电脑在安装win7系统时出现黑屏的现象,许多用户面对这种情况都不知所措,也不懂得如何解…

hp服务器不显示错误代码,惠普服务器开启不了

Caution POST 9/22/2014 12:44 9/22/2014 12:44 1 Post Error - Message: 1615-Power Supply Failure or Power Supply Unplugged in Bay 1 - Error: 208 警告 开机自检 错误提示 电源模块错误或者电源插槽1里面没有插电源(错误代码208) Caution POST 9/22/2014 12:44 9/22/201…

惠普服务器停电后进不了系统,惠普电脑出现了startup menu 然后按f10进不去bios。进入的是Windows启动项...

惠普电脑出现了startup menu 然后按f10进不去bios。进入的是Windows启动项以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! 惠普电脑出现了startup menu 然后按f10进不去bios。进入的是Windows启动项 通常HP 电脑…