中文 英语

创建当前瞬变醒来和睡去

如何降低功率,性能,和更低的峰值电流。

受欢迎程度

硅节电技术正在帮助减少数据中心所需的权力和其他高强度计算环境,但他们还添加了一个设计团队的重大挑战。

岛屿在高性能的芯片去睡眠和醒来,当前需求迅速变化。这种情况发生在几微秒,最多。加载的快速变化对监管机构创建一个挑战。

“权力继续爬成倍增长,至少峰值功率,“Sameer Gupta说,基础设施电力业务的高级经理在瑞萨。和峰值功率与功率瞬变有关。

而新方法规定帮助管理高动态范围,仔细设计有助于管理瞬变本身力量。芯片设计者必须需要保持力量平衡,保持速度,同时降低峰值电流。

数据中心能源仍然是一个挑战
长期以来一直提出的问题的能量数据中心使用。结合能源消费的全球能源使用量的1%(加或减,这取决于报告)。虽然可观,但也不是那么糟糕了最初预期。这部分是由于更节俭能源使用今天的芯片比最初预期。

在那些节能的重要因素之一是权力的能力上下块内服务器芯片需求变化。由电源关闭未使用的电路,可以保存大量的能源。驱动备份那些块发生相对较快,远远比可能更快如果整个未使用的服务器是关闭。

而这种能力导致净节省能源,它创建一个不同的问题。一块去睡觉的时候,它会导致一个重要电力负荷的变化。使电压出现短暂飙升到监管机构可以调整到新的功率。同样地,当一块再次醒来,突然增加了现有的电力负荷和电压可以下垂短暂由于当前重要的侵入,几十安培。

图1:改变当前的(绿色)对电源电压的影响(黄色)。当前步骤90安培10-µs故障原因在供应。来源:瑞萨

监管机构面临的挑战是能够快速反应负载变化,当前从一个非常低的水平,如果一个系统是睡着了,高水平的密集型任务。

监管机构调整
直流-直流监管机构经常用来一步输入电压——通常大约12 V - VDD个别芯片需要,这些天小于2 v。这些转换监管机构,这意味着数字开关内部的连接和断开输入电压调节器。

这个开关提供了一个周期内的脉冲电流,得到平滑的监管机构。面临的挑战是,用一个简单的监管机构,得到一个大电流冲击每循环。平均电流(RMS)相对较高,尤其是high-drawing芯片cpu和gpu可以引起热问题和增加所需的鲁棒性的设计。

“多相”电力开发解决这个问题。这涉及到几个平行监管机构连接后输出电感器,这意味着他们都有助于当前,希望同样。什么改变是每个脉冲的时机。而不是一个大的脉冲,你得到一个较小的脉冲序列,彼此的阶段。一个脉冲在第一阶段是第二,紧随其后的是一个脉冲通过所有的阶段等等。

图2:一个四阶段。每个阶段理想的贡献同样但交替脉冲时间与其他阶段。资料来源:根据瑞萨的形象。

通过这样做,单一大电流脉冲的监管机构目前个人的数量除以阶段,有效地传播。理想情况下,输出的结果是相同的,但更稳定。

图3:一个概念插图多阶段的监管机构的影响。用更少的均方根电流电压保持不变。来源:布来安梅奥/半导体工程

这种力量的控制部分循环传统上一直使用模拟电路完成。电流型监管太缓慢。电压模式是快,但目前缺乏必要的信息,使其难以稳定。

瑞萨表示,将控制转移到数字域提供了一个不同的,更快的方法。测量电压和电感,从计算迅速(而不是慢慢地测量)当前,提供更严格的控制。校准是下坡的确认提供的电流脉冲。

“数字化的优势是你有完全控制,“古普塔说。数字的方法也给访问更好的操作数据。“服务器家伙希望不仅在架拉遥测信息级别,但也支持全系统监控和远程管理的能力。”

:解决电源的岛屿
所有这些已经成为必要的一样大systems-on-chip(soc)变得越来越复杂的抽运功率。块可以在不需要时使入睡,觉醒任务时准备好了。虽然这可能看起来简单,如果应用到芯片上的几大块,不再的情况下,无论这些芯片的数据中心,智能手机,或其他地方。

“一些芯片拥有数以百计的权力领域,他们想要的细粒度控制关闭哪一个,哪一个醒来,”戈德温-梅宾说,应用程序工程科学家,数字设计小组Synopsys对此。如果太多的力量上下同时,瞬态电流可以是巨大的。与先进的流程问题变得更糟。“我们正在朝着更低的节点,总电容增加,这意味着平均电流需要充电和放电(网)的增加,“他补充说。

创建两个维度power-ramping挑战。一个是驱动的速度上下为一个单独的块。另一个是上下驱动多个块。块通常设计在不同的团队,所以块本身可能不是“意识到”的其他模块也为在同一时间。

块不改变电源状态可以影响其他块如果权力颤抖了起来。“时间不是一个问题的块是打开,“指出顾磊杰(Rajat乔杜里,产品管理总监Voltus IC电源完整性解决方案节奏。“但是你要确保你不会引起太多的噪音已经运作了。”

如果块在同一功率岛,他们会改变功率在一起,但他们可能不知道。如果他们是在不同的岛屿,它不能保证他们会一起坡道,即使它是可能的。这种情况使得权力架构和设计的关键方面早期的设计。

在芯片级,架构师必须了解的用例驱动功率切换。在一个岛,上演升高可以缓和当前上涨的一种方式。这是通过延迟不同块的升高。甚至几纳秒的延迟可以在平静的当前发挥重要作用。但不同的岛屿,你没有独立的知识将变化的力量,所以明确分期并不是一个真正的解决方案。

相反,权力仲裁员可以用来处理太多的块同时改变的力量。而不是一个内置的延迟之间特定的块,仲裁者可以请求,哪块之间插入延迟发生在请求一个力量改变在同一时间。允许块信号反馈回仲裁者当他们稳定在一个新的功率的仲裁者有更好地了解发生了什么。

“有一种叫做“power-good”信号,”-梅宾解释道。“电源管理单元发送一个sleep命令到CPU,以及CPU返回power-good信号说,‘是的,我完全放电,我睡着了。的电源管理接收确认,说,“好吧,这家伙已经死了。现在,我将发送请求下一步。”

仲裁者的细节——也就是说,对于一个给定的规则集芯片——将完全依赖于应用程序。他们成为权力的一部分设计。

从芯片级块水平
甚至与芯片级管理,个体块可能包含数以百万计的晶体管,还会导致更多的瞬态时所需的功率的变化。除了管理不同区块之间的时间,通常在一块来管理时间,。这个不需要仲裁,因为众所周知,整个块上下意志力在一起。又一个分段能量的问题。

这是使用电源开关——他们中的许多人,事实上,所以,每个可独立控制开关和定时。“这个开关不会有current-driving供电能力的所有细胞,”-梅宾指出。“你需要数以百计的开关功率一百万细胞的实例。”

开关可以以不同的方式被测序,每个影响整体升高或省电时间。顺序链创建一个序列进行的开关,一个接一个。但这通常是太慢了。其他的布局方法,如鱼骨和high-fanout,允许更精细的控制。单个开关可能推迟了彼此,但只有几纳秒,产生更快的总功率的事件。唤醒延迟由细胞移动距离,只是增加了延迟更长的线,可能就足够了。

图4:不同的分段功率开关的接通和内部逻辑块。来源:Synopsys对此

另一个工具是可编程延迟小部件。他们与延迟程序,相对于一个唤醒信号,决定什么时候打开。

图5:延迟块之间的小部件可以插入,开机时间设定。左边的延迟小部件将ns 20日之后收到它刺激信号从分区1;右边的ns后10日将从分区2接收它的信号。资料来源:根据Synopsys对此图像。

这些不同的方法产生不同的权力斜坡率和电流激增。最终,美国必须达成一种平衡,电流冲击的大小和唤醒延迟。

图6:电压斜坡率和电流瞬变,更快的方法生成更多的冲击电流。来源:Synopsys对此

起床时间不同根据你想要的地方。由一个电源开关的电路控制在一块,它可以几个时钟周期。2 GHz的时钟,每周期是0.5 ns,所以起床在纳秒数。

当然,一个完整的块将需要更长时间由于插入开关之间的延迟。同样,在芯片级,你现在有块的分期。对于大型的芯片,这可以带来升高周期的范围数百纳秒。电感一路上进一步介绍一些延迟当你移动到包和超越。一个巨大的激增,如功率调节器,可引起microsecond-level飙升的10µs包括复苏。

峰值电流片上可以看到巨大的。监管机构的负担减少了使用多个水平的去耦电容,或“开瓶。“这些都是非常熟悉芯片的电源插脚,已经几十年了。但是他们现在也洒到块芯片的帮助与瞬变。

开瓶通常被描述为过滤噪音,他们做的。但是看着他们的另一种方法是他们作为储存能量的快速释放。“开瓶细胞作为当地的充电站,当你需要它,”-梅宾说。当电流负荷变化迅速,很快开瓶贡献一些当前而上游——监管机构本身和其他来源,高级开瓶——提供其余的电流。他们大小的触发器,所以他们不需要太多空间。

使用太过随意的开瓶片上,然而,可以导致漏电流的增加。片外离散电容器是专门为一个特定的水平的质量和泄漏。芯片上的限制,然而,必须符合CMOS工艺,这并不是对这类电容器进行了优化。所以他们相对漏水的。

对芯片设计流程的影响
power体系结构设计的一般有三个阶段在一个新的芯片。最初的设计,在芯片的计划完成。然后是验证,一旦大量的设计,希望证明最初的设计是充分的。当地的问题,然而,可能创建需要第三阶段——导致工程变更订单(ECOs)。

在设计的早期,没有向量,所以没有特定的信号数据用于测试电源的设计。相反,有预算平均功率为不同的块,这就是设计师将与力量,专注于静态功耗。“我们设计电网基于静态红外下降,基于平均功率,”-梅宾说。

这很好理解。“设计师有一个相当不错的想法他们要拥有多大的权力在一块级别,因为那是每一个芯片设计的一部分,”节奏的乔杜里说。“他们得到合理准确,在20%左右。”

这是一个时间的实验,探索不同的体系结构,过渡和权力仲裁选项。创建物理电网发生,实验可能包括确定哪些金属层将用于电网的不同部分和“带”将会有多宽。

明显缺席的这部分设计是设计瞬变的能力,尤其是在激进的硅节点。“更新的节点上,他们可能不知道当地的电流,峰值”乔杜里说。块的经验和知识将帮助提供一个初步设计,希望将足够健壮。

“越来越多的人试图解决电源瞬态问题通过静态红外高效而不是等待动态红外,因为动态是太迟了,”-梅宾补充道。“解决问题的最好方法是尽可能早地让你的模拟矢量,并确保你的静态红外下降是基于现实的力量,不是vectorless力量。”

因为芯片、打包和董事会现在如此紧密地交织在一起,它不再是足以独自做动力分析芯片——特别是对于瞬变,在电感是至关重要的。“当你看到更多的噪音,你可能需要做一个完整的分析与方案模型,“乔杜里说。“你有一个非常详细的模型芯片。然后你有一个非常详细的提取模型的包。然后你可以添加一个简单的模型,你可以把它所有的芯片级模拟。”

部分挑战是噪音芯片之间的预算,计划,和董事会不再工作。”当你降低你的电源芯片,你的噪音利润萎缩,”指出乔杜里。“以前,公司会说,‘好吧,你有2%的噪声容限,你有另一个2%包。”但现在,供给水平下降了,你没有奢侈的添加剂2%。所以他们说,‘嘿,也许如果我在那里,我可以做一个结合4%或3%。”

评估动态功率
逻辑验证动态功率可以第一次评估。“你所有的向量,利用仿真结果ir降分析”-梅宾说。“会有很多窗户的设计周期,短时间内,将会有一个巨大的电流激增,因为块打开和关闭没有他人的知识。”

模拟是特别有用的在这种情况下,因为它可以锻炼一个大型的向量序列将在模拟运行太慢。模拟器运行时,权力分析工具找出任何电流峰值,可能需要额外的关注。今天,模拟器直接流数据分析工具。

进一步的效率已经被精简了一些流媒体格式。“一个不需要转储所有信号设计,“Preeti Gupta说,RTL产品管理主管有限元分析软件。“如果他们倾销仅关键信号,像失败输出?为什么不能电动工具填写事件的网?“这已经缩减数据流。

如果所有这些成功收益,有一个很好的机会,一旦布局完成载荷下产生的电力基础设施会保存的很好。然而,很有可能会看到一些孤立的节点电压下垂在最后的动力分析。面临的挑战是保持这一数字降至几十的节点,而不是成百上千。

然后可以调整每一个最后的节点。“当你地方,你可能有非常高的电流或太多的细胞附近的路由,导致局部峰值,“乔杜里说。“他们可以修复,将细胞分开或使特定的当地电网强。”

间隔细胞有时被称为“细胞填充。”“如果我单独的细胞,把垫细胞之间,我有分布式或交错的权力要求电压下降最小化,“-梅宾说。“这是经常做的时钟细胞,因为它们转换速度非常高。”

电网可以通过添加“增强”权力表带与现有的低阻力。“他们使电网密度,这意味着他们有更广泛的肩带,“-梅宾说。”,他们逐步插入通过或通过梯子沿着网格从更高的金属低。”

类似的效应可以获得金属填充时补充道。芯片不能拥有的空地,所以金属等领域长期以来一直用于填补。“如果你连接这个填充金属和地面,它能提高你的力量和地面网络,”-梅宾说。

它也可能会减少一些细胞的驱动降低当前的侵入。“裁员细胞影响设置和保存,这意味着你的时间会受到影响,”-梅宾说。“但是如果你的动态红外下降发生在一个并非时间关键的路径,谁在乎呢?”

另一个选择是划分负载。“他们做的另一件事是将输出电容,”他说。“假设有一个触发器开车十负载。我复制这个失败,每一个驱动五个细胞。我把输出。“关键是这两个分裂版本不会在完全相同的时间开关。他们之间会有一些小小的延迟。

最后,电源管理可以是一个组织的所有权问题。“执行的一个挑战是模拟器团队验证团队在设计公司,”警告Ansys的古普塔。”和方法论团队通常是一个单独的团队力量,或者他们前端设计团队的一部分。就把这两个团队一起讨论它,找出谁是正确的仿真器功率流的所有者是一个挑战。”

结论
管理数据中心电源是一种妥协和融合监管机构设计和芯片设计的努力。理想情况下,监管机构可以承受任何电源瞬态,但芯片设计者发挥自己的作用,更仔细地管理他们的瞬变。他们通过权力坡道放缓下来,这意味着他们必须记住时间和性能的芯片以预定速度做它的工作。

这些共同努力让数据中心电源低于预期水平。但它仍然很高,所以希望继续努力将有助于减轻数据中心能耗的增长。



留下一个回复


(注意:这个名字会显示公开)

Baidu