中文 英语

解决复杂芯片中的热耦合问题

挑战越来越多,特别是在前沿节点开发的3d - ic和芯片方面。

受欢迎程度

芯片和封装复杂性的上升导致热耦合器的比例增加,这可能会降低性能,缩短芯片的寿命,并影响芯片和系统的整体可靠性。

热耦合本质上是两个设备之间的连接,如芯片和封装,或晶体管和衬底,其中热量从一个传递到另一个。如果处理不当,这些热量会导致各种问题,包括加速老化效应,如电迁移或介质的更快击穿。一般来说,电压越高,导线和衬底越薄,传递的热量就越多。虽然这些影响已经被很好地理解,但在前沿设计和3d - ic中,它们变得更加难以处理,因为在这些设计和3d - ic中,需要对热耦合进行建模、监控和管理。

“热效应正在成为一阶效应,就像时机一样。Synopsys对此.“如果你不考虑这一点,你的时间和你的传统PPA也会付出代价。这是非常关键的,现在,在签字阶段,我们将热效应包括在时间分析中。如果你不考虑这些因素,例如室温下的时间就不会给你你想要的结尾。”

这在可靠性至关重要的情况下尤其重要,例如在汽车、航空航天或协作系统中。对于这些应用,需要模型来考虑诸如模对板、模对模、设备到互连和设备到设备等热耦合。

“由于几何尺寸的巨大差异,每一层都需要配套的热模型,”法国皇家科学院虚拟系统开发工作组的罗恩·马丁说夫琅和费IIS自适应系统工程.“因此,热模型可能与设备到互连和设备到设备级别的热耦合有关。”

什么是热耦合?
当电流流过器件或互连时,就会产生热耦合。“这种热量通过传导在整个硅衬底中传递,”卡尔文·周(Calvin Chow)说有限元分析软件.“电子学的性能和可靠性涉及物理学的多个方面,如电磁学、结构和热力学。”


图1:模拟热电偶的散热。来源:有限元分析软件

电子产品所消耗的能量有很大一部分都转化为热能。随着温度的变化,材料的性质也会发生变化,这反过来又会影响物理性能。Ansys高级首席应用工程师Chris Ortiz表示:“因此,通过材料性能的温度依赖性,温度与可靠性和性能所涉及的各种物理因素相耦合。

图1:热耦合相互关系。来源:有限元分析软件
图2:热耦合相互关系。来源:有限元分析软件

简而言之,热耦合可以归结为通过对流、传导和辐射散热的多种方式西门子数字工业软件.他说:“在给定的情况下,问题就变成了这些效应是如何相互影响的,从而计算出总传热是多少。”“从方程式的角度来看,这并非微不足道。这不像你代入几个数字就搞定了。它要复杂得多。你真的必须通过模拟来做,因为它们是相互影响的,这正是它的挑战所在。其中一个会导致某些东西变热,然后在另一个转换机制上导致另一个地方的某些东西变冷。”

通常,晶体管的参数化热紧凑模型是在晶圆厂的工艺设计套件(PDK)中给出的,这些模型提供了热点温度的粗略估计,忽略了布局效应和晶体管之间的耦合。“在大多数工业设计流程中,整个芯片都假定温度最高的晶体管只有一个温度,这可能导致互连的过度设计,并可能导致不必要的性能损失,”弗劳恩霍夫的马丁说。

为了避免过度设计,引入了互连层的线性热耦合模型,即耦合因子与晶体管温度(T晶体管

Tx T晶体管

互连层的耦合因子依赖于技术,可以由代工厂提供,如图2所示。

图2:显示不同建模方法的ic堆栈。来源:Fraunhofer IIS EAS

图3:显示不同建模方法的ic堆栈。来源:Fraunhofer IIS EAS

马丁解释说:“不同互连层上的实际温度分布用蓝色表示,单一温度假设用橙色表示,耦合模型的温度用绿色表示。”“该图显示了使用单一温度假设如何导致对互连温度的严重高估,从而导致强烈的设计悲观主义。给定模具的耦合模型,设计人员可以避免在热点区域布线,或者根据当地温度修改互连尺寸。”

互连耦合模型仍然忽略了器件层上不同晶体管之间的耦合。这只能通过后期布局,全芯片热分析来建模,从而得出所有层的温度分布,理想情况下就像上图中的蓝色曲线。这通常是通过基于网格的求解器来完成的,例如有限元法(fem)或有限体积法(FVM)求解器。

“由于不断增加的布局复杂性和晶体管数量,网格大小已经达到了计算极限,即使在高性能计算系统上也是如此。因此,无论是模型降阶(MOR)技术必须应用于热求解器,还是基于网格的求解器必须被更可扩展的算法所取代,例如基于蒙特卡罗的算法。这些算法易于并行运行,因此非常适合现代gpu集群,”Martin补充道。

与单片等效器件相比,3D-IC方法中的热因素被放大,并且它们可以根据所使用的3D-IC类型而变化。“例如,在传统的3D芯片层之间有微型支柱,芯片层之间的隔热衬底的存在会导致热能的阻塞,”哈维DeLaCruz说,杰出的工程师和高级总监的系统集成手臂.“这将以加热方式阻塞下模具,这是通过封装顶部的能量到散热器,或通过PCB散热的加热方式。”

DeLaCruz解释说,在这些情况下,晶片往往更厚,在50微米范围内,因此相对于混合键合版本,更容易发生横向扩展。“然后,对于混合键合的3- IC器件,芯片往往会变得相当薄,这使得横向扩展变得复杂,并加剧了热路径差的区域的形成,从而产生更热的热点——特别是当它上面没有连续的硅时。这可能发生在一个较大的下晶片上的多个上晶片之间的间隙中。”

在这些情况下,热硅可以用来减少这种影响,但不能完全消除它。

DeLaCruz说:“混合键合的使用也可以改善堆叠的热路径,但因此增加了模具之间的热耦合,这将增加分区/地板规划过程的复杂性,直到模拟阶段和后续阶段。”

当然,目标是避免热效应带来的可靠性和性能问题,但实现这一目标的方法有很多,这使得问题变得复杂。

至少“何时”是清楚的,Ansys的Chow说。“这些热因素会影响设计的性能和可靠性。因此,在进行楼层规划和配电拓扑设计时,在设计周期的早期阶段进行这种分析非常重要。”

将电力分散到更大的区域有助于散热,但也会增加成本。

“增加额外的电网将更均匀地分布电流,并有助于提高可靠性,但现在信号路由将更加拥挤,可能需要更多时间来关闭定时,”Ansys的Ortiz说。此外,截止日期也会限制你完成芯片的时间。最终,过度设计芯片弊大于利。”

更好的方法是为特定的设计准确地模拟依赖于温度的物理,并解决突出显示的问题区域。

避免出现问题也意味着模拟必须给出准确的结果,但西门子的Ferguson指出,这需要大量的数据。“你需要知道每个模具的金属化细节,”他说。“你需要知道力量在哪里。潜在地,你需要知道晶体管的开关频率。您需要了解堆栈以及与之相关的所有内容。这部分需要大量的前期信息,当你掌握了所有这些信息后,如果你发现了一个错误,再回过头去进行修正就太晚了——尤其是如果你已经完全确定了你的死亡。”

然而,有些事情可以尽早完成,包括对骰子的威力做出简单的假设。弗格森说:“你可以把它看成骰子上的每个点都是均匀的。”“你可以把整个模具的金属化处理得很均匀。当你在做计划时,你可以开始把事情放在一起,看看明显的问题。这是一个很好的起点。你也可以做权衡分析,比如,‘如果我把A放在B上面,或者如果我把B放在A上面,会有区别吗?当你这样做的时候,事情成熟了,你就可以不断地添加信息,所以你开始得到更准确的功率分析。你可以把它插上,开始看到某些地区可能会有高功率,这表明它会更快地变热。你可以把金属化,如果你有的话,开始计算某些区域比其他区域密度大。某些区域有更多的氧化物和更少的金属化,这是更多的绝缘。 The heat is going to move less quickly through that, and you just keep on chugging it along.”

由于高温会影响压力,还会出现其他并发症。“压力会对你的设备行为和温度产生影响,这最终意味着你最初对功率的估计可能不是100%准确,”弗格森说。“所以你需要再次通过能量循环将所有信息拉回来。这是一种迭代的方法,这使得它目前很难得到解决。这是当今最大的挑战。”

同时,因为每个设计情况都是独一无二的,所以它会提示应该进行的分析类型。Synopsys的卡比尔说:“想想一个具有多种功能的芯片,比如手机。“当你打电话和看YouTube视频或做其他事情时,芯片的不同部分会被使用。手机或应用程序的工作功能不会一直是均匀的,这意味着整个芯片的某些部分会一次变热,而不是一直变热,有些部分可能同时变热。这就是为什么只做静态分析是不够的。你必须进行瞬态分析,并观察热量的时间分布,因为即使在某个时刻出现峰值,实际上也可能会烧焦芯片的某些部分。”

Synopsys高级营销总监Shekhar Kapoor指出,因此,必须考虑到活动在时间尺度上的整个传播。“从模拟到时序分析,所有的模拟都必须考虑在内。”

从这个角度来看,需要更多的创新来提高芯片设计的性能,这是EDA公司正在研究的。随着技术的成熟,关于热的答案预计将更多地来自软件方面,有更好的模拟,以及硬件方面,有更好的物理冷却技术。

“在设计的最初阶段,它将来自你的软件分析,在那里你不断模拟不同的场景,以想出如何最好地设计这个产品。节奏.“设计好之后,你不能改变任何东西,你必须依靠硬件。“我想在这里增加更多的液冷设备吗?”我想要一个更大的散热器吗?我们想到的散热器坏了。所有这些都是在设计完成之后。所以在设计的最初阶段,肯定是软件。但在设计完全完成后,它将交给客户,测量和硬件将给你答案。”

但这并不能向使用这些工具的设计师解释为什么事情仍然会出错,以及为什么芯片仍然会过热。

“当你进行模拟时,请记住你有很多假设,其中一些假设可能与你的想法截然不同,”Roshandell说。“例如,你认为这个IP会以某种方式运行,因为你依赖于代工提供泄漏数据。然后,你依赖于你的电源团队,必须准确地计算出这个电源的电压,而这些事情在99%的时间里都没有按计划进行。所有这些假设都可以在模拟中发挥作用,这就是为什么有时模拟不能准确预测现实世界中会发生什么。所以这不是工具的问题。这个工具和你给它的输入一样好。为了得到准确的模拟结果,所有的假设都非常重要。”

确定必要的准确性水平也是一个不小的壮举。弗格森说:“你将看到两个层面。“在一种情况下,你会受到限制,就像你在执行刚果民主共和国规则一样,如果你有一个地区有这样那样的温度,我希望它被标记出来。我不确定谁会给出这个值。今天,个人用户可能会得到代工厂的一些帮助。从长远来看,代工厂将在一定程度上这样做。但是对于结尾来说有很多限制。一般来说,他们会把它垫起来。所以你可能会想,‘我有10%,我要强迫你只有5%。这样你就不太可能有问题。’ Over time, if they find out that was wrong because they’re getting failures, they adjust.”

结论
Ansys的Chow表示,热分析将是功率分布的函数,其中包括热源位置和整个模具的热阻。设计决策将需要基于对零件/设计将如何执行的知识。

Ansys的Ortiz也认为,模拟需要精确的材料属性信息,其中一些信息将来自晶圆代工厂,因为材料属性可能是他们IP的产品,而不是通常可用的。“材料属性可以用来模拟物理,并显示物理系统将如何表现。然后,设计工具可以利用这些信息来改变布局或修改冷却系统。”

Synopsys的卡比尔表示,3d - ic的设计仍将具有挑战性,因为设计师仍在逐渐习惯新的三维结构,如凸点、tsv、模对模界面键合等。“其中许多还将用于携带热量。有时设计师也会放置假凸起来带走多余的热量。在设计流程的早期考虑所有这些因素是非常关键的。即使在进行架构、探索和平面规划的初级阶段,如果你不考虑这些影响,并且你认为,“每个IC所有者都将设计IC,我将把它们都组合在一起,并将3D IC堆栈组合在一起”,你会发现热挑战和问题。在这一点上,你不能ECO你的出路。现在已经太迟了。然后,3D堆栈将位于封装上,封装将位于PCB上。”

因此,从硅为中心的热分析变得势在必行。你打算用什么样的保温材料?你是要放入一个介电材料来确保热量出去吗?你要带什么样的散热器进来?Kabir说:“传统的方法是从PCB向内观察系统并进行热分析,这是在很久以后才完成的,可能与IC设计无关,这种范式已经不再适合3D-IC概念。”



留下回复


(注:此名称将公开显示)

Baidu