中文 英语

先进芯片设计中的功率和热量平衡

这两者都需要在设计流程的所有阶段进行处理。为什么现在这是每个人的问题。

受欢迎程度

电力和热量的使用是别人的问题。现在情况已经不同了,随着越来越多的设计迁移到更先进的工艺节点和不同类型的先进封装,问题正在蔓延。

这种转变有很多原因。首先,导线直径变小,介质变薄,衬底变薄。电线的结垢需要更多的能量来驱动信号,这反过来又增加了电阻,从而增加了热量。这反过来又会对芯片中的其他组件产生重大影响,因为在更薄的衬底上,绝缘性和散热能力更弱。

解决热的最常见方法之一是降低各个块的操作电压。但这种方法只能到此为止,因为低于一定的电压水平,内存就会开始丢失数据。此外,公差变得如此之紧,以至于各种类型的噪声变得更加成问题。所以热量需要以不同的方式来处理,现在这影响到设计过程的每一步。

“热效应比以前重要得多,但这些效应实际上都不是新的,”罗伯特·艾特肯(Rob Aitken)说Synopsys对此.“总有人在某个地方为他们中的一些人担心。现在不同的是,每个人都必须为所有人担心。”

其他人也同意。英特尔公司产品营销总监马克•斯温宁(Marc Swinnen)表示:“为了降低芯片功耗,压低电源供应已经有十年之久的趋势。有限元分析软件.“但这意味着现在我们有了接近超低电压和接近阈值的操作,所以以前的小问题现在都成了大问题。”

而且这些问题明显更难解决。在过去,功率和热问题可以通过在设计中添加裕度作为热缓冲来解决。但在高级节点,额外的电路会降低性能,增加信号需要传递的距离,这反过来会产生更多的热量,需要更多的能量。

“下一个级别的技术节点,以及先进的封装技术,在模具和封装中付出了更高的功率密度的代价,这需要从规范和设计阶段就开始考虑,”公司虚拟系统开发集团经理Christoph Sohrmann说夫琅和费IIS自适应系统工程部.“这意味着设计师将不得不设计出比以往任何时候都更接近临界温度角的设计。”

3 d-ics,各种用例的热图需要与楼层规划和不同材料的选择相结合。

该公司产品管理总监Melika Roshandell表示:“3d - ic有多个芯片堆叠在一起,因为你不能让你的手机更大节奏.“但你可以堆叠芯片,这会带来很多热问题。假设有多个骰子叠在一起。根据它们的放置方式,可能会出现不同的热问题。举个例子,如果一个IP放在一个死了,另一个IP是放置在其他死——假设死第一个CPU和GPU在第二个死——当有不同的标准,他们想要激活第一个死,或如果他们有GPU-intensive基准和他们想要激活第二个骰子,大部分时间你必须骰子芯片分成多个部分,将其导入软件,然后做了分析。但对于3D-IC,你不能这样做,因为热是一个全球性的问题。这意味着你必须有所有的组件——3D-IC加上它的封装,再加上它的PCB——来做热分析。现在很多设计师都面临着这样的挑战。”

当电压路线图停止缩放时
1974年,IBM工程师Robert Dennard演示了如何使用缩放关系来减小mosfet的尺寸。这在当时是一个重要的观察,当时最小的mosfet约为5微米,但它没有考虑到当阈值电压和泄漏电流发生显著变化时,纳米尺度上会发生什么。

艾特肯说:“Dennard没有考虑阈值电压,但它实际上在论文中是一个定义的术语。”“钥匙坏了Dennard扩展是电压停止缩放的时候。如果你遵循这个理论,当你把设备缩小时,你也会把所有东西缩小0.7,所以如果你遵循最初的数学,我们的设备应该在20毫伏左右工作。当电压停止缩放时,产生相等功率部分的良好抵消特性就会失效。”

为了应对这一挑战,电力行业研究了不同的方法来管理电力并使其处于控制之下。当SoC不使用时,关闭或关闭部分SoC就是这样一种方法,首先由Arm推广。智能手机显示屏是移动设备最耗电的部分之一,当手机检测到没有人在看它时,它仍被广泛用于为其断电。

“在芯片层面,黑硅是管理芯片功率的一种方式,”Rambus.摩尔定律继续提供更多的晶体管,但功率限制意味着你不能同时把它们都打开。因此,控制哪些部分是亮的,哪些部分是暗的,可以使芯片保持在可接受的功率预算内。动态电压和频率缩放是另一种处理增加的功率的方法,通过在不同的电压和频率运行电路根据应用程序的需要。将电压和频率降低到所需的水平,而不是尽可能地降低,这有助于降低功率,以便其他电路可以同时使用。”

最小化数据移动是另一种方法。Woo说:“数据移动也是电力的一大消耗者,我们已经看到针对AI等特定任务进行优化的特定领域架构,这些架构也优化了数据移动以节省电力。”“只有在必要时才移动数据,然后尽可能多地重用它们,这是降低整体功耗的一种策略。”

除了设计和架构之外,还有传统和先进的冷却方式来降低功耗。“还有更多使用液体冷却的系统的例子,通常是通过将液体输送到散热器上,使液体从芯片上流出,然后将热量辐射到其他地方。在未来,浸入式冷却,即将电路板浸入惰性液体中,可能会得到更广泛的应用。”

多核设计是管理电源和热量的另一种选择。这种方法的代价是需要管理软件分区,以及芯片上的竞争电源需求。

imec逻辑技术副总裁Julien Ryckaert表示:“当你将任务分配到不同的核心、不同的处理引擎时,你会意识到并非所有步骤都是相同的。“有些实际上需要非常快的操作。算法中的关键路径需要以最快的速度运行,但在其他核上运行的大多数其他任务都将运行并停止,因为它们必须等待第一个CPU完成它的任务。因此,工程团队已经开始使他们的处理引擎异构化。这就是为什么今天的手机有我们所说的大。小建筑。他们有高速核心,低功率核心,甚至高速核心的组合。如果你看看苹果手机,它有四个高速核心,其中一个是为在最高电源电压下工作而设计的。”

接近阈值电压
降低电压也是降低功率的有用工具。但就像许多技术一样,这也正在失去动力。

Ansys的Swinnen说:“你最终得到的超低电压仅为0.5伏左右。”“与此同时,晶体管的切换速度也在加快。当你把非常低的电压和非常高速的开关结合在一起时,如果晶体管要开关,你就不能损失任何东西。”

使依赖于降低电压的问题更加严重的是由越来越薄的金属层和电线引起的越来越大的电阻。突然之间,更多的电力必须通过更细的更长电线来压缩,因此电压降问题变得更加严重,这意味着任何电压降的空间都更小了。

Swinnen说:“传统的答案是:如果电压下降,我只需要增加更多的带子或使电线更宽。”“但现在,很多金属资源都用于配电,每次增加更多的带,就不能用于布线。”

更糟糕的是,电线本身的几何形状也达到了极限。“你只能把铜线做得这么细,否则就没有铜了,”该公司产品管理高级总监约瑟夫·戴维斯说西门子EDA.“铜线是包覆的,这可以防止它们扩散到二氧化硅中,把硅变成一片沙子,因为如果晶体管中有铜离子,它们就不能工作。但你只能把包层做得这么大,所以电线的尺寸非常有限,这就是为什么先进技术的RC时间常数只会上升,因为你受到后端的限制。”

EDA发展正在进行中
由于所有这些原因,人们越来越依赖EDA工具和多物理场模拟来承担复杂性。

Cadence公司的Roshandell解释说,传统的3d - ic解决方案面临的一个问题是容量。“我们需要能够读取和模拟3D-IC中所有组件的工具,而无需过于简化。因为它被简化了,所以会失去准确性。当你失去精度的时候你就会意识到在第二个模具中可能有一个热问题。但是你把它简化到骨头来做分析,所以你无法捕捉到热性能。当我们转向3D-IC时,这是EDA中最大的问题之一。这是每个人都需要解决的问题。”

EDA行业非常清楚这些需求,并积极开发解决方案,以满足设计师对3D-IC的需求,其中包括与铸造厂密切合作。在分析方面也有大量的发展。Roshandell说:“在封装芯片之前,你需要知道当你的设计进入特定环境时会发生什么。”

艾特肯说,所有这些都不是没有成本的,因为这些复杂性对设计时间来说是一种负担。“你可以在一定程度上隐藏它,但不能完全隐藏。这个工具现在要做详细的热分析以前不需要做,这需要一些时间。这意味着,要么你将不得不投入更多的计算,要么你将不得不花费更多的挂钟/日历时间来处理这个问题。或者你会有更少的迭代。必须放弃一些东西。工具正在努力跟上这一点,但你只能在一定程度上隐藏其中的一些东西。最终,人们会知道它的存在。你不可能永远把它藏起来。”

为了做到这一点并使设计符合规范,需要新的热工EDA工具。Fraunhofer的Sohrman表示:“就EDA工具而言,基于现场求解器的模拟器可能需要被更可扩展的模拟器所取代,例如基于蒙特卡罗算法的模拟器。”“这样的算法是可扩展的,易于并行运行。此外,热灵敏度分析可能会进入热模拟,为设计者提供关于模拟结果可靠性的反馈。未来需要的模型降阶(MOR)技术也是如此。”

不过,在硅光子学方面可能有一个潜在的解决方案。西门子的Davis说:“IBM已经做到了,他们已经有了在封装顶部放置镜像的芯片,他们做了一些非常奇妙的事情。”“但这是10年前3D堆叠的情况,这意味着即使是硅光子学也可能会遇到限制。”

光信号速度快、功耗低,曾被视为下一代计算技术。但是光子学也有自己的问题。西门子产品管理总监约翰•弗格森(John Ferguson)表示:“如果你试图用波导来传递光信号,它们也有尺寸限制。”“最重要的是,它们很大。你可以把电子元件和它们放在一起,或者堆叠在它们上面,但无论哪种方式,你都必须做功来转换信号,你必须担心一些影响,比如热量和压力。它们对光学行为的影响要比对电学行为的影响大得多。例如,只要在上面放一个骰子,你就可以改变你试图处理的整个信号。这很棘手。在这个领域,我们还有很多工作要做。”

结论
虽然芯片行业继续将逻辑扩展到埃范围,但与热和功率相关的问题继续增长。这就是为什么所有主要的代工厂都在开发一系列涉及新材料和新包装的新选项。

艾特肯说:“在新的节点上,如果你把一个现有的finFET晶体管放大,它的泄漏会太大。”“晶体管周围的栅极是更好,但它不是神奇地更好。它看起来确实会扩大一些。所有这些都陷入了一个循环,这个节点看起来一切正常,下一个节点看起来也合理,之后的节点还有工作要做。但这种情况已经持续了很长一段时间,而且仍在继续。”

如果没有,还有很多其他的选择。但无论接下来发生什么,热能和电力仍将是个问题。



1评论

Saikatm 说:

感谢Karen的这篇文章,非常棒

留下回复


(注:此名称将公开显示)

Baidu