中文 英语

如何选择正确的记忆

不同的类型和方法会对成本、功率、带宽和延迟产生很大的影响。

受欢迎程度

说到设计内存,没有一刀切的方法。考虑到内存类型和使用场景的长列表,系统架构师必须绝对清楚其应用程序的系统需求。

第一个决定是是否将内存作为SoC的一部分放在逻辑芯片上,还是将其作为片外内存。

“延迟和吞吐量之间的权衡是至关重要的,而电力成本是巨大的,”at的业务和企业发展副总裁Patrick Soheili说eSilicon.“每次你从一个平面移动到另一个平面,它都是100倍的因素。这同样适用于片内存储器和片外存储器。如果你能把它们都连接在一个芯片上,那就永远是最好的。”

出于这个原因和其他原因,芯片制造商的首选是在逻辑芯片上安装尽可能多的RAM或闪存。但在大多数情况下,这是不够的。即使是微控制器,过去被定义为具有片上内存的处理元件,也开始为更高端的应用添加片外补充内存。

at公司DDR、HBM、闪存/存储和MIPI IP的产品营销集团总监Marc Greenberg表示:“当逻辑芯片上的内存尺寸超过经济上可以生产的容量时,片外内存是显而易见的选择。节奏.“目前有很多低成本、低功耗的内存产品,都是基于来自多家制造商的多种类型的SPI(串行外围接口)总线,包括具有汽车速度等级的内存。SPI总线正在加速并增加宽度。”

事实上,Cadence看到了对200MHz Octal-SPI IP接口的大量需求——包括控制器和物理接口。

为了更好地理解人们如何看待汽车或其他应用中的内存电源设计,我们可以退一步,试着理解内存在速度和功耗方面的总体带宽问题,Navraj Nandra指出Synopsys对此.“在应用需求方面,人们不断提高微处理器/CPU的性能,这就要求内存容量和内存带宽。但你不能同时拥有两者,即使这是应用程序所需要的。”

内存中的关键权衡是带宽、延迟、功耗、容量和成本。Nandra说,工程师有时会忘记成本部分,但它推动了许多实施决策点。

必须考虑内存容量与内存速度之间的关系,每种类型的内存都有不同的权衡。例如,如果应用程序由每秒千兆比特的速度或带宽驱动,则HBM可能是正确的选择,因为它比DDR内存有更高的带宽。如果应用程序的主要问题是容量问题,比如内存接口上可以容纳多少gb的存储,那么DDR可能是更好的选择。

“DDR提供容量,HBM提供带宽,”Nandra说。“如果问题是关于功耗,那么与HBM或GDDR相比,低功耗DDR更好。使用GDDR或HBM可以获得性能。有了DDR和LPDDR,你真的可以节省电力。”

嵌入式内存
如果内存作为SoC的一部分嵌入,则有许多架构考虑因素。

“例如,如果你观察泄漏,SRAM的泄漏主要是位单元,”他说手臂罗伯·艾特肯。“周边也有贡献,但你可以在设计过程中玩弄它。如果你有一定数量的位元,你就会有一定的泄漏,所以你必须从这个点开始,然后解决它。根据你的野心有多大,有一些电路设计技巧可以让你摆脱一些限制,通常是以牺牲性能为代价的。其中一些包括各种类型的井斜或功率门控,这些方法的组合有助于减少泄漏。”

在这一点上,重要的是要理解,如果需要一定数量的比特,并且有这么多的泄漏,系统架构师必须找出哪种配置最适合他们拥有的各种内存。Aitken说,考虑因素包括位线长度等。“一般来说,比特线越短,内存就越快。这是因为SRAM传感的工作方式,本质上,单个位元必须释放位线,当它释放足够多时,传感放大器就会触发并说,“哦,那里有一个信号。’所以需要放电的位线越多,需要的时间就越长。”

幸运的是,对于任何给定的内存配置,都可以在一定范围内做出选择。

他解释说:“我的记忆中可以有很多短位行,也可以有少量长位行,但字数和比特数仍然是完全相同的。”“这只是记忆中列的排列方式。这是一个可以实现的架构,内存生成器可以让你做到这一点。你可以试着说,“在这种情况下,我想让列mux为8,”也就是每个输出位都有8位行,因为这样可以很好地平衡速度和功率。或者你可能会说这实际上比你需要的快,所以你可以使用列倍数为4,因为它能提供更好的功率和速度。作为SoC架构师,你最终会通过练习来了解实现东西的最佳方式,它们也会以不同的方式适合平面图,因为它们有些更方,有些更矩形。”

成本问题
虽然功率在一段时间内主导了许多设计决策,但成本是这个等式中的另一个关键因素。

艾特肯说:“仅仅从内存的角度来看,你需要考虑是否需要更大的空间,这就意味着更高的成本。”“对于大量内存,有一些二阶权衡变得很重要,比如比特单元面积与外围面积的比率。一旦你选择了一个位单元,它的面积基本上是固定的。但它周围的外围区域可以变得更大或更小,这通常会使它更快或更低的功率。当您这样做时,它会增加SoC的成本,这可能会显示,也可能不会显示,这取决于您拥有多少个给定实例。通常,当你观察一个SoC时,有几个非常大的实例主导着该区域,所以外围区域或性能的微小变化会对它们产生巨大的影响。有很多情况真的不重要,因为如果它们的规模扩大了一倍,没有人会注意到。然后还有另一组通常是架构上重要的实例,这些东西有某种终极性能要求或超低电压或芯片的某些重要方面。在这些情况下,面积成本因素通常不如满足速度标准或泄漏标准或其他主导因素重要。”

汽车的优先级
这一点在汽车市场尤为重要,因为成本是决定使用哪些零部件的关键因素。

“动力很重要,但在其他一些市场,它并没有成为一个超级关键的因素,”该公司产品管理高级总监弗兰克•费罗(Frank Ferro)表示Rambus.“功率对每个人来说都很重要,但在汽车系统中,真正的权衡是成本与带宽。如果我必须对它们进行排名,我会说性能和价格并驾齐驱。权力将远远排在第三位。”

汽车是当今芯片设计的热门市场之一。对于自动驾驶汽车来说,用于获得所有实时信息反馈的传感器数量正在爆炸式增长,而对于一辆汽车来说,要实现不同级别的驾驶辅助,就需要多个传感器输入高级逻辑。需要处理的数据量是巨大的,因为在视觉和雷达的情况下,这些数据是通过传感器网络传输的。

Ferro说:“芯片制造商正在寻找能够处理超过100gbps或更高带宽的存储系统,因为你可以进入不同级别的驾驶员辅助汽车,最终是自动驾驶汽车。”“为了做到这一点,内存选择的数量开始缩小了很多,因为可以为你提供必要的带宽来处理所有传入的数据。”

他说,一些早期的ADAS系统设计包括DDR4和LPDDR4,因为这是当时可用的。两者都有优点和缺点。“DDR4显然是最便宜的选择,而且它们的产量最高,”他说。“它们当然非常划算,也很容易理解。在DDR4上进行错误更正更简单,也更容易理解。LPDDR4也是一个选择。”

展望未来,Ferro希望在不同的系统中能够共存各种各样的内存类型。“如果他们严重受成本驱动,那么他们将考虑DDR甚至LPDDR4之类的东西。但如果它们严重受带宽驱动,那么它们就会考虑HBM或GDDR之类的东西。这实际上取决于你在架构阶段的位置。有不同的ADAS级别,系统和时间框架也需要什么,因为什么时候发货很重要。如果您今年得到了一个系统,那么它的解决方案将与明年或后年开发的系统不同。这些都是我们在上市时间与成本的连续统一体上看到的。”

然后,在高性能方面,从系统设计的角度来看,带宽-功率的权衡是关键的挑战。“如何以合理的功率在芯片上的合理区域内获得更多带宽?”例如,如果你有一个HBM,从功率和面积的角度来看,它是非常高效的,因为它使用了3D堆叠技术,所以从功率效率的角度来看,HBM是非常棒的。从面积的角度来看,一个HBM堆栈占用的空间相对较小,所以从电源性能的角度来看,这是一个非常漂亮的解决方案。你可以在小范围内获得高密度、高功率、低功率。”

其他人也同意。HBM产品营销经理Tien Shiah表示:“GDDR在gpu上比DRAM更快,但与HBM相比没有可比性三星.“HBM是微柱网格阵列最快的存储形式。您可以有4高或8高的堆栈,这在8个通道上提供1024个I/ o,每个通道有128位。这是标准显卡I/O总线宽度的四倍。每个引脚可以达到2Gbps,在1.2伏特下将达到2.4Gbps。”


图1:三星HBM2 DRAM来源:三星

这对于外部内存来说是巨大的吞吐量。但在这里,成本也是一个权衡因素。

Ferro说:“你将为HBM支付更多的钱,所以如果你能消化成本,这是一个很好的解决方案。”“如果你不能消化成本,那么其他公司就会考虑在一块电路板上能挤多少ddr或lpddr,然后把它们并排放在一起,试图用更传统的解决方案模仿HBM的一些性能。”

理解记忆
由于内存市场服务于许多不同的应用程序,因此要清楚地了解如何在设计中使用内存可能是一件棘手的事情。了解各种选择可能会有所帮助。

公司知识产权部门总经理Farzad Zarrinfar说:“你基本上可以把你的硅产品打入几个关键的垂直市场。Mentor是西门子旗下的企业.一些垂直市场可能是智能手机应用、高性能计算、汽车、物联网、虚拟现实、混合现实等。你会发现硅技术是不同的。没有一种硅技术可以解决所有问题。例如,物联网对功耗和成本非常敏感,人们利用超低功耗40nm或28nm的最先进技术,如ULP或HPC+。这些都非常适合物联网。在汽车领域,28nm制程的需求很大,而且还在下降。”

内存编译器的选择是另一个难题,大多数内存提供商为他们的内存产品提供它们。智能编译器可以帮助提供解决方案,因为它可以根据不同的需求进行优化。例如,一些应用可能需要超低动态功率,而汽车有自己的要求,我们唯一不变的是变化。事情正在发生变化。安全、温度等级等方面都有非常明确的要求。”

所有这些需求都会影响内存设计,这是工程团队需要考虑的。

他说:“当我们设计内存时,我们有特定的目标,可能是+125摄氏度或150摄氏度的环境温度,这意味着一些结温。”“我们有一份基于目标市场的营销需求文件。然后我们就知道我们需要什么样的设计了。然后你需要有来自半导体代工的模型说明这是我们拥有的模型的范围。汽车温度正迫使半导体代工厂增加传统的工作温度范围。虽然不是每个流程节点和类型都支持每个模型的每种排列,但必须进行充分的验证,以确保各种组合将实现所需的结果。”

在一天结束时,对更大带宽、更少延迟、更低功耗和更低成本的更大容量的需求只会增加。随着当今可用的内存类型的数量,包括片外内存和嵌入式内存,系统架构师必须始终更好地兼顾其特定应用程序的理想内存方法的选项。

有关的故事
新的记忆竞争者?
fefet是一种很有前途的下一代记忆材料。
记忆的未来
专家们,第3部分:安全性,进程变化,高级节点上其他IP的短缺,以及过多的代工进程。
中国会在记忆领域取得成功吗?
该国正指望DRAM和NAND技术来减少贸易逆差。
人工智能如何影响记忆系统
不同的架构绕过内存瓶颈的方法
内存市场:历史会重演吗?
中国不可能支持三家DRAM公司,但其中一家很可能会成功。



留下回复


(注:此名称将公开显示)

Baidu