热完整性挑战在2.5D中增长

在基于中间体的设计中绘制热流图的工作正在进行中,但还有很多工作要做。

受欢迎程度

在2.5D和3D-IC中,热完整性变得越来越难以准确预测,这就产生了一系列问题,可能会影响从系统行为到现场可靠性的一切。

在过去的十年中,硅中间体技术已经从简单的互连发展成为异构集成的关键推手。现在的插入器可能包含数十个晶片或小芯片,有数百万个连接,并且性能、功率和面积需求不断增加。事实上,在面积超过2,000 mm²的中间插入器上看到异构集成设计并不罕见,为系统消耗600瓦的功率,并要求非常高的I/O带宽。有了这样的功率,热完整性现在是一个首要的问题,这使得很难有信心按时签署。

有许多工具可以理解和模拟异质硅中间体设计中的热效应,但大多数工具今天都没有连接。这里的工作正在进行中,但这不是一个简单的解决方案。人们并不总是清楚这些工具应该做什么,以及这些工具是如何组合在一起的。

“人们面临的普遍挑战始于这样一个想法,‘让我们假设这些东西都是很小的板。我们将永远应用我们在板级和包级上应用的相同技术,我们只需要缩小规模,它们就会起作用。Synopsys对此.“这是对的,但它有几个新的维度。首先,现在从事这项工作的人与过去从事这项工作的人是不同的。以前,封装和电路板工程师都这样做。现在,芯片人员也在为此努力。”

还有其他重大转变。公司Calibre接口和EM/IR产品管理高级总监Joseph Davis表示:“当我们使用这些3D组件时,重要的是要记住,我们正在跨越过去的领域西门子数字工业软件.“以前有做芯片的人会把芯片放在一个包装里。然后我们有了系统包和MCM选项。很多界限已经模糊了。那么谁拥有什么呢?有做包装和系统模拟的人。对他们来说,整个模具都有一个温度,所以分辨率是厘米大小的,用于观察板上或外壳内的散热。然后是集成电路团队,他们现在不只是一个集成电路,而是一个集成电路组装在一起。这个IC团队研究的是微米级的分辨率。他们需要知道整体的分布,等等。 The resolution there is a challenge. But really, the physics and technical problems are the easiest part to solve here. The real problem is that whenever you cross organizational boundaries, you have a real problem. We are now putting multiple die together sometimes from different technologies, sometimes from different foundries. Even within a single foundry, every die stack is unique. There’s not a process for getting all of that information into the tool.”


图1:使用中间体、凸点、微凸点和过硅孔的高级封装。来源:西门子

要做到这一点,必须在所有各方之间进行沟通——设计芯片的公司、EDA工具提供商、铸造厂和封装厂。

戴维斯说:“即使是一家代工厂,我们都必须弄清楚所有需要进来的东西,把所有的东西都准备好来完成工作。”“然后是包装和系统的人都在考虑毫米。所以有两种截然不同的用户群,每个人都有不同的分辨率。”

有不同的音高和相互联系。Synopsys公司的艾特肯说:“尤其是硅介体,你要处理的是一种不同的材料。“木板或有机衬底在材料上是相似的,所以人们过去在木板上保持一切平衡,并建造一个测试飞行器来测试这个系统的极限。如果这些都能起作用,那就太好了,但没人确切知道能起多大作用。物理就是物理,但它会变化。如果你不小心,原来的二阶效应就会变成一阶效应。即使你谈论的是数学模型,理解它是如何工作的以及在哪里工作也是很重要的。”

改变起点
逐步构建了一个典型的异构集成系统。

“从一个系统的封装基板开始,我们实际上将插入体安装在它的顶部,并使用数十万个凸起进行连接,”该公司首席产品经理郎林说有限元分析软件.根据设计集成方案,设计师会直接在中间体上添加几个模具或小片。一些模具通过微凸点或铜对铜连接连接,其他一些模具可以进一步以3D方式堆叠。由于这种集成,插入器的作用是可靠地连接数百万个这样的微凸点或铜-铜连接,使整个系统能够在现场生存。”

这通常被称为芯片封装系统。中间体是一个桥,它包含了所有这些组件的电力输送网络。“它还为所有芯片和芯片提供电源,并承载整个芯片和芯片,”林说。“但现在安装在顶部的芯片会消耗大量的电力,这可能会导致电源完整性问题。在现场工作时,这些也会产生大量的热量,所以现在有可能由于热完整性问题,一个IC可能会烧毁邻近的IC。”

简单地说,异构集成会导致电力和热完整性问题——甚至更多。

他说:“如果你有高带宽内存的3D堆叠芯片,电源和热量问题也可能导致严重的信号完整性问题。”“这意味着所有这些问题都聚集在异构集成系统中。设计师在确保电力成功输送、热量成功散热以及信号完整性不受影响方面发挥着重要作用。”

对基于中介体的异构设计建模会引发关于模型完整性的问题,因为其中涉及到太多变量。“你做一个假设,在某些条件下,比如,‘一种材料对另一种材料的偏转是线性的。’然后你会说,‘嗯,实际上,在其他一些条件下,它是二次的。但二次模型要复杂得多。使用哪一个是正确的?人们仍在试图弄清楚答案是什么,以及你需要关心多少东西。”

这在很大程度上是抽象层的功能。戴维斯指出,所有这些热量方面都可以通过非常粗略的建模和平均来解决。“随着更新的技术和这些技术的混合,我们在系统中有了很多非常好的绝缘体,”他说。“当我们进入finfet时,情况变得更糟。人们开始说,‘供暖问题更严重了。“为什么?”“这是因为在平面晶体管中,所有的热量都是在硅中产生的。大块硅是一种相当不错的热导体。它的热导率在150左右。用鳍片,你把晶体管放在上面,它被二氧化硅隔离,二氧化硅是一种非常好的绝缘体。这里,热导率是1.4,所以是100倍。 But wait a minute. I just wrapped my hot transistor in a glass pillow? What am I going to do with all that heat? I’ve got to have a way to get it out. That is done with TSVs and the like. Further, we can model this stuff. We model far more complex things than just the thermal every day with simulations and EM/IR. We have the capacity, yes. But getting all the data together is a real problem. The resolution in the system and the system being not the electronics, but the industry, is the biggest problem.”

艾特肯说,这有两个方面。“这是一个方面,‘我有一个系统,我有一堆方程,我将用于建模系统,我有工具来实现这些方程。然后我得到输出。输入部分也很重要,因为所有的骰子都不一样。所有的材料都可能略有不同。此外,工作负载是不同的,有时是未知的,所以你再次处理我们一直在考虑的封装热问题,以及我们一直在考虑的芯片热问题,但现在它们都合并在一起,不能被视为独立的。这导致当你把这些东西放在一起时,你需要做尽可能多的分析,但也需要在你构建它时监控发生了什么,以确保你的假设继续成立。所以你会看到,‘哦,我们在加热。这很糟糕。让我们慢下来。’”

了解热流至关重要。热量从物体较热的一端转移到较冷的一端,但并不总是一致的。“热传导的概念相当容易理解,”Ansys的Lin说。“如果你知道工程学101中的欧姆定律,你就知道你可以用系统热传导路径的等效热阻来模拟物体。并且给定一个特定的功率耗散值作为该系统的散热片,就可以很容易地求解传导路径两端的温差。傅里叶热传导定律描述了一个系统如何散热,以及散热器如何影响整个系统的温差。”

通过硅介体映射傅里叶定律更为复杂。“假设在一个晶片中有两个热源,”林说。“芯片为这个硅系统消耗能量,中间插入器安装在封装的顶部。系统中总共可能有四个不同的组件或对象。我们可以模拟四种组分的热阻。考虑到有两种芯片在加热一个系统,我们就有了两种Q(热流)源,将热量注入热传导路径。”

解决这个问题可以帮助设计人员了解系统各部件之间的温差,进而更好地了解温度分布。但是Lin说这个模型还不够准确,因为每个组件只有一个等效的热阻。“热阻实际上高度依赖于整个物体的材料特性。有限元分析方法可以用数学方法来表示具有其自身材料特性的物理部件或系统,也可以用于所有表面的边界条件。网格技术用于将该IC布局几何或对象转换为可识别的元素。可以使用两种不同的网格方法来建模整个IC布局,通过所有网格元素,我们可以以3D方式解决系统所有元素之间的传热规律。”

这也有助于解决温度分布问题,这是一个更准确的热模型的现实问题。

考虑到这种网格划分如何影响求解热传导的精度,Lin说网格划分技术需要不断改进,这是一个挑战,因为从旧的SoC技术到最新的2.5D或3D-IC技术,系统已经变得更大了。在这些复杂的系统中有成千上万的热源。因此,网格分辨率必须从厘米提高到微米,甚至可能是纳米。“我们需要一个更细粒度的解决方案,直到集成芯片的子块级别,这样我们就可以准确地模拟热传导路径。这非常具有挑战性,但对于解决此类系统的热节流问题,并确保不存在可靠性或热完整性问题,这是必须的。”

这使得整个分而治之的方法更加困难。西门子数字工业软件公司的产品管理总监John Ferguson指出,以往的热工是用网格方法完成的。“你把事情分成小块,然后你能做多少取决于你有多少硬件,你有多少内存,以及你愿意等待多长时间来得到答案。这些都是你需要努力解决的问题。但这种电网还有另一个挑战,因为热量本身就是一个问题。重要的是,你要检查一下,看看你是否有除了重新设计之外任何其他方法都无法解决的热问题。”

热对机械应力和电迁移/红外降也有影响。“现在的情况是,你必须确保你使用的网格可以在这些不同的东西上以某种方式对齐,”弗格森说。“如果你想把它们加起来,你可以让一个窗口与另一个窗口有一半重叠。你是怎么搞清楚这些的?这是令人困惑的。这仍然是一个巨大的挑战。这个行业正在努力摆脱网格窗口的方法,做一些更全面的事情,这意味着更多地从方程的方法来看待它,更多地从真正的物理角度来思考问题。例如,温度在哪里下降?正是由于这些原因,整个电网状况对该行业来说是一个挑战。我如何知道选择正确的分辨率? Is it going to be accurate enough? Is it going to integrate with everything else I need it to? Getting away from that approach is an important step.”

进化
在这一领域最终会出现什么样的解决方案还有待观察。艾特肯指出,目前有广泛的实验,并相信在某个时候,这个行业将开始联合。Ferguson说:“即使是看软件包选项,过去也只有相当少的软件包,这些都是由软件包供应商决定的。”“所以你知道如果你把你的设计放在那里会发生什么。但是现在有很多不同的封装设计,即使你只局限于硅中间体。人们用它们做了很多事情,也有很多方法把它们组合在一起。至于哪一种更好,人们并没有达成共识。这意味着如果你是一个制造商,现在你必须有效地支持一个定制的东西,不仅为每个客户,而且可能为每个设计。这是在寻找,‘让我们尽可能地重新设计,这样我们就认为我们是安全的。但与此同时,一定要小心。’”

随着其他材料的引入,新的问题也会随之增加。“你可以加入一些设计这些东西的人没有很长历史的新材料,”他说。“根据你去的地方,你可以在它们的导热性和抗拉强度的文献中找到一些细节。但是到底是谁在测量这些数据呢?他们的变化。你得到了大量的氧化物,而下一批则有一些不同。至少在热学方面,我们可以进行无网格分析。但我们仍然有一个问题,需要将其覆盖在网格上,用于我将试图传递数据的其他事情,它需要在上游,下游,各种方式消耗。最终,所有这些,我们的行业一直以来的工作方式是我们保护它。我们会说,‘他们说这个项目有10%的收益。 Let’s give a 20% window to keep ourselves safe. But that means you’re always leaving something on the table, too.”

此外,在早期做决定也是个挑战。

“我们对建筑提出了一些问题,比如什么可以组合在一起,”西门子的Davis说。“我的包裹够大吗?”我有一个足够大的散热器吗?我们行业处理这个问题的方式一直是预算和近似模型,所以当你在设计系统中走得更高或更早时,你就有了模型。有时候,一个模型只是一个近似值,‘我认为这个芯片会产生这个温度,因此它会像这样导电。但现在我们看到客户在问,‘这个部件是我做的。我把它放在这个包裹里。新版本会有一些额外的车手,我希望能产生很多热量。我的包裹够吗?影响可靠性前散热是否足够?这个问题必须在其他问题之前得到解决。电迁移是温度的函数,所以如果温度(这是一个指数函数)比你预期的高10度,它可能会使你的寿命缩短5年。 Engineering teams want to do that earlier, but they don’t have the information about the technology they will use, other than to say, ‘We’re thinking about this.’”

结论
可以肯定的是,如果设计师意识到所有这些挑战,他们现在可以使用一些技术。但是在复杂的异质设计中有很多元素,这对设计团队来说是一个更大的挑战。

“他们可以从设备层面应用几个不同的解决方案,”林说。“他们可以降低功率,平衡功率的密度,并可能以热传导路径很好地平衡的方式巧妙地划分芯片和小芯片,而不会引起任何高温。在系统层面,我们看到很多冷却解决方案说,‘如果温度太高,让我们控制系统,让它停止工作,让它休眠。“我们还可以做一些像热管理、电液体冷却和强迫对流之类的事情。我们已经在系统的生产中看到了这一切。”



留下回复


(注:此名称将公开显示)

Baidu