中文 英语
18l18luck新利
的意见

对异构集成包装热管理的影响

这个包是在冷却HPC系统发挥着越来越重要的作用。

受欢迎程度

硅半导体行业达到降低过程节点,设计师努力摩尔定律产生前几代的成果。增加模具大小的单片系统芯片(SoC)的设计不再是经济可行的。单片soc分解成专门的芯片,称为chiplets,呈现显著的好处在成本方面,产量和性能。Chiplets提供制造商的优势能够收缩过程节点只有特定的组件,同时保持其他更多经济规模。此外,一些权力相关因素发挥作用。异构集成提供了一个替代路径保持跟上摩尔定律而不是依靠传统节点萎缩发展。相比传统的整体结构,异构的包装提出了独特的挑战热管理由于其功率密度增加,物理尺寸和几何形状。

异构集成允许组件的包装不同的流程节点和功能到一个单独的模块。有许多方法,包括,但不限于,multi-chip模块(MCM) System-in-Package (SiP通过硅通过),2.5 d (TSV)硅插入器和高密度扇出(HDFO)。其中的一些技术已经存在了很长一段时间了,但是直到最近有分解大型单片SoC的流行死成更小的子组件,或chiplets,打包成单个模块。这种类型的异构包装使公司保持跟上摩尔定律扩展和经济学。异构包装的好处有很多。首先,设计师不再局限于单个节点技术。个体功能可以使用遗留节点大小,没有金融意义转移到最近的节点。其次,小模具尺寸允许更多的模具/晶圆,因此更少的浪费。产量也看到一个进步,因为失败的子组件不需要整个SoC被拒绝。虽然有很多的应用异构的包装,这篇文章将会特别关注高性能计算(HPC)。

功耗在半导体行业

互补金属氧化物半导体(CMOS)设备消散热量在三个主要方面:动态功率,短路损耗和泄漏。动态功耗发生由于电路中的开关活动当电容器充电将能量。从历史上看,这大道是最高的在CMOS器件的功耗来源,然而最近较低的节点,泄漏电流扮演了更重要的作用。功率泄漏已经包含50%的总功耗设备高技术节点,65 nm和下面。

功耗是最限制约束芯片设计。虽然越来越核心可以挤在一块硅,同时运行所有这些核心全性能是由于热的限制并不可行。相反,内核必须压制或停用减轻过热。不可用硅的现象,通常被称为“黑硅”地区硅必须停用由于热的问题,限制了设备的整体性能和效率,因为设备不能运行在其全部潜力。功耗消失的不是一个问题。作为硅power-per-computation效率持续改善,整体包功率密度增加。包增加功率密度需要仔细考虑优化热力性能设计和材料。


来源:英特尔

功率密度的趋势

在超大型数据中心的兴起和人工智能(AI)计算,3 - 5 kW功率密度每架被认为是常态。在这个层次上,芯片在架可以使用气冷式冷却散热器。风冷散热片将释放空气进入数据中心通道,最终将热制冷或制冷单元的提取。今天,AI和其他新HPC应用程序需要更多的权力每个芯片与一些达到超过500 W。给定一个标准机架尺寸,它不再是有效的,甚至可行的冷却架通过移动的空气。事实上,数据中心架功率密度预计将继续上升,预计将达到15到30千瓦每架在不久的将来。这种级别的功率密度要求替代形式的冷却。

今天许多先进的制冷解决方案正在开发。理想的冷却解决方案可以使用现有的基础设施中实现的,而不是从根本上改变数据中心环境。热管道和蒸汽室使用相变传热在一个封闭的循环实现有效热导率显著高于铜或铝。今天这些技术都已得到了广泛的应用,但仍然面临着同样的挑战,实现它们必须由移动的空气冷却散热器。接下来的进展在冷却液体冷却。这可以实现两种形式;通过间接冷却使用冷却板或直接冷却浸泡;后者更奇异的形式。液体冷却的冷却板可以实现更高的功率密度比空气冷却和通常可以允许更多的货架空间,因为他们可以很低调,不需要气流。


谷歌张量处理单元(TPUv3)人工智能机器学习与液体冷却板板。


克雷的沙士达山直接液体冷却系统用于第一批亿亿级。

在immersion-cooled系统,设备直接接触介质冷却剂。根据冷却液和配置,与液体浸系统可以单个或两个阶段。两阶段浸冷却提供恒温的优势在每个设备的冷却液浴,但这些类型的系统更具挑战性比单相系统来实现。浸没冷却需要一个截然不同的数据中心环境中,因为几乎整个机架必须密封包含冷却液。因为这是比今天惯例截然不同,重大障碍需要克服浸没冷却在经济上是可行的。无论如何,还有很多兴趣都直接和间接液体冷却。开放计算项目(OPC)两个项目专注于发展浸和冷板冷却标准化的解决方案。今天的主流气冷式解决方案广泛应用将无法支持HPC的未来需求和人工智能。


两阶段immersion-cooled系统。(来源:AnandTech - g)

对异构包装热的挑战

从热传导的角度来看,几乎没有区别的大多数形式的异构包装。在大功率包装,它是常见的堆栈死或组件上的大功率死所以只有2.5 d或MCM-style设计将被认为是在这个讨论。几乎所有这些配置涉及相同的基本热流路径通过的方案。开始结、热进行通过硅和热界面材料(TIM),然后到一个热撒布机之前消散到系统冷却解决方案。然而,许多异构集成封装选择每个人都有自己的独特的过程和物理特性,可以间接地影响热性能由于包的翘曲和它对热界面材料的影响。

散热器

对于大多数半导体包散热器提供热力性能的优点以及保护硅和翘曲的控制。然而,有些情况下直接公开的硅系统冷却解决方案提供了更好的热性能相比,热撒布机盖子。包接口时很低电阻蒂姆II(热界面材料和包之间的系统散热片)和一个高性能散热片,如直接液体冷却,热盖内的实际传播是非常小的。在这个场景中,主要是进行直接加热的硅,因此它可能有利于消除热撒布机的热电阻和蒂姆我沿着这热流路径。然而,暴露硅也有自己的挑战,主要损害的风险在系统组装以及硅选中的蒂姆II材料的可靠性和性能。

考虑另一种场景中以高电阻提姆二世和低性能的散热片,如一个简单的气冷式铝散热器、热分散机通常会提供一个热获益,因为热量分布在更大的区域在退出前包。热阻越高系统的冷却方案,包内的更多的热量扩散。自热阻面积的函数,是一个面积较大的传热到提姆二世和散热片有效地“降低”他们的抵抗。异构的包装,通常是高功率密度差异在包的总面积。因此,这对应于更多使用热撒布机的潜力。此外,整个包温度梯度越大,越大的潜在好处撒布机厚度增加热量。


包和综合热撒布机。

异构包装还涉及到不同的高度的挑战个人chiplets组件,由于制造业变化或简单的不同类型的组件(例如chiplet和高带宽内存(HBM)模块)。综合热撒布机,他们可以制造不同高度由不同空腔深度补偿。当考虑公差积累与堆死,最关键的是保持一个最低蒂姆)注册不同的死亡。因此,热撒布机蛀牙应该考虑在他们的设计。

热界面材料

高性能计算的大多数情况下,超过95%的设备总功率消散通过顶部的包和一个冷却系统级的解决方案。在一个包(不含3 d),唯一的组件沿着这条路径是硅,热界面材料,和铜(热辊材料),除了暴露死包只有硅。由于硅是所需的半导体,和铜已经最好的热导电材料,唯一的变量的选材是热界面材料。尽管热界面材料的厚度至少一个数量级小于硅的厚度和热辊,它通常会大于50%的热阻沿着这条路径。

提姆我高功率包的选择是至关重要的。不仅材料需要一个热阻低,它也需要能够承受的条件包组装和其运行寿命期间的经历。设备加热或冷却时,在回流或操作,蒂姆会经历相当大的压力由于热膨胀系数(CTE)不匹配的铜、硅和有机物在包中。能够在这些压力周期保持附着力和凝聚力是同样重要的散装导热系数。获得这些属性的平衡是具有挑战性的,目前只找到是最常见的材料在光谱相反的两端。凝胶和grease-type蒂姆斯组成的聚合物矩阵含有导电性粒子,如铝或银。这些材料是有益的低弹性模量,然而与金属相比,他们仍有较低的热导率。铟等金属焊料蒂姆,提供非常高的导热系数的模量很高,挑战商旅和易性和可靠性。

异构为蒂姆斯包装提供了一个独特的环境。不仅蒂姆界面多个组件,它也可能接口多种材料类型取决于包。此外,强调了蒂姆的经历可能不同而大铁板一块死。异构包对蒂姆斯的一个好处是,可以使用不同的蒂姆在不同的组件。例如,中央处理单元(CPU)死有高性能蒂姆虽然低HBM模块可以使用胶粘剂蒂姆减少翘曲的包。

蒂姆阻力是一个函数的厚度、体积热导率,接触电阻在其接口。天性,异构包通常是相当大的,这相当于一个大型蒂姆表面积。的总接触面积相比,蒂姆,其厚度是数量级较小。这意味着材料的体积电导率作用相对较小的总热阻的蒂姆。因此,尽管先进金属焊料商旅提供极高的热导率相对于聚合物材料,在一个大的表面积在异构包类型热的好处只是增量。此外,这些高模数金属蒂姆非常强调由于弯曲如此大的包。


详细视图的一个粒子拉登聚合物热界面材料。

组件和chiplet组织

热管理的第一道防线是硅本身。硅热导率相对较高,善于缓解热点。由于异构包装功能分解到各个组件,一大块硅的热传播优势。然而,通常情况下,这实际上热力性能好处因为热量生成组件分开,从而减少热串扰。

热意识到组件或chiplet放置热优化的包提供了一个巨大的机遇。芯片和包设计师应该仔细考虑组件位置的电气和热权衡,尤其是当涉及高功率。在可能的情况下,高功率组件应该分开更平均地分配在包的面积。然而,包的边缘和角落存在约束的热扩散,所以高功率密度不应位于周边太近。

系统集成

没有限制十字线大小、异构包可以包含更多的硅的区域。因此,他们的整体体型往往生长。今天,是很常见的MCM包超过70 mm x 70 mm。这个相对较大的包大小提出的挑战当集成在系统层次与提姆二世和散热片。保持足够的蒂姆•II界面热阻的压力是必要的。的表面积大MCM,需要相当大的力量来满足这种压力的要求。这不仅会产生压力的包还在系统主板。主板上的高力量可能需要额外的加强和/或散热片安装硬件,从而推动成本上升。如果足够的压力不能被应用到蒂姆II,设备会在热降解性能。这个问题提出了实现的另一个好处热分布在大型异构包:散热片的可变性和蒂姆第二应用程序可以与热补偿机实现更加一致的热力性能。

包级别的热性能增强

正如前面讨论的部分,随着冷却系统级解决方案的进步,包贡献更重要的部分是系统的总热阻。有很多选项可用于利用一个热增强包。在最基本的层面上,改进方案将相应的热阻降低结温的装置。普遍引用的半导体器件的经验法则是,每10°C结温度上升,经营生活是减少一半。因此,通过降低结温包访问热增强,理论可以显著提高设备的使用寿命。

另外,热增强包可以在更高的功率运行,从系统级冷却解决方案可以支持额外的热负荷,同时保持相同的结温。结温度通常限制芯片性能,这是一个明确的选择利用一个包与改进的热阻。

包的功能添加到提高其热性能仍然会消散与原设计相同的热量,但是结之间的温度增量和环境会减少。在系统层面,有很多好处,降低包的热阻。而不是降低结温,环境或环境温度的冷却解决方案可以增加,同时仍然保持相同的原始结温。气冷式数据中心而言,这可能是显著的成本节约。大约每增加1°C的环境温度转化为~ 2%冷却成本节约。第二个选项也可以减少散热片或气流的要求。通过降低结温,可以使用较小的散热片或降低气流同时仍然保持相同的三角洲结和环境之间的关系。



1评论

Tanj班纳特 说:

把传热表面的MCM芯片和循环冷却剂。更加灵活的组件包括被动者和不规则的组件分布在权力转换。实验室有能力吸引超过1千瓦/厘米^ 2的一个芯片变形铜和循环液体。

路由的热量通过刚性机械连接后面似乎“盒子”里。

留下一个回复


(注意:这个名字会显示公开)

Baidu