中文 英语
18.luck新利
的意见

的道路上更高的内存带宽

我们在另一个世代的尖端HBM的变化。

受欢迎程度

在HBM首次宣布以来的十年里,我们已经看到了两代半进入市场的标准。HBM的“宽,缓慢”架构推出第一1吉比特每秒的数据速率(Gbps)运行在1024位宽界面。产品的数据率和界面宽度提供了带宽的每秒128字节(GB / s)。HBM2信号率翻了一番,2016年2 Gbps的带宽256 GB / s。两年后,HBM2E出现,最终实现数据速率3.6 Gbps, 460 GB / s。

这增加的动力性能无法满足带宽要求先进的工作负载。首先在这些AI /毫升培训。在相同的十年HBM的引入,AI /毫升培训一直在流泪。领先的培训模型从几百万缩放参数十年前,在2020年超过1700亿。模型尺寸每3 - 4个月翻倍,每年10倍的速度增长。这种增长需要扩展的服务计算中的一切在硬件和软件架构。

高内存带宽,并将继续是,计算性能的关键推动者。因此,我们发现自己在另一个世代的尖端HBM的变化。虽然最终规范尚未公布,我们预计HBM3数据率将超过5.2 Gbps,导致超过665 GB / s的带宽。随着带宽扩展,附加HBM内存容量——在三个方面。

HBM系统是2.5 d / 3 d结构。“3 d”部分是指HBM内存设备。这些都是3 d成堆的DRAM芯片。HBM代,DRAM芯片的密度增加了,堆栈的大小也是一样,它现在可以16 DRAM芯片高度。第三维的产能扩张,也会增加总带宽,是扩展HBM记忆频道数量的加速器,在早期实现一个或两个,六在当今最先进的体系结构,在未来8或更多。

一个HBM记忆频道需要1024携带数据的痕迹。此外,还有命令和地址线需要将总数超过1700。加速器与8 HBM3设备架构需要超过13000的痕迹。订单的大小超过可以实现传统的PCB。所以,使用硅插入器,可以最后腐蚀需要成千上万的痕迹。系统中插入器安装包和加速器HBM内存设备安装在插入器——这就是“2.5 d”架构的一部分。

内存性能时,Rambus展示领袖。我们引入了一个18 Gbps GDDR6内存子系统和一个HBM2E内存子系统运行在4 Gbps。这些都是记录的性能水平,是无与伦比的。现在预计下一代HBM, Rambus宣布我们的8.4 Gbps HBM3-Ready内存子系统能够交付超过每秒TB的带宽(TB / s)。在这个数据速率,加速器附带8 HBM3内存设备可以实现8.6 TB / s的内存带宽。

为了有效地管理这些数据,Rambus内存子系统包括模块化和高度可配置的内存控制器。控制器优化最大化吞吐量和减少延迟,和它的运行时内存参数可编程。血统的50多个HBM2和HBM2E客户实现,它展示了在各种各样的配置效率和数据流量场景。

而即使在成立之初,HBM在1 Gbps宽,相对较慢,当操作8.4 Gbps,非常快。路由成千上万的痕迹,速度和保持信号完整性是一个巨大的挑战。来帮助设计师成功利用的潜力HBM3记忆,Rambus提供了插入器和包参考设计的2.5 d体系结构的实现。

高内存带宽之路是永无止境的。即将引入HBM3开辟了一个新的阶段的旅程,在系统性能提高到一个新的水平。

额外的资源:



留下一个回复


(注意:这个名字会显示公开)

Baidu