中文 英语

芯片老化加速

随着先进节点芯片被添加到汽车中,数据中心内部的使用模式发生了变化,关于可靠性的新问题浮出水面。

受欢迎程度

随着新芯片在汽车、云计算和工业物联网等新市场的推出,可靠性正成为新芯片越来越重要的证明点,但实际上,随着时间的推移,证明芯片将按预期运行正变得越来越困难。

在过去,可靠性通常被认为是铸造问题。为电脑和手机开发的芯片被设计成在正常使用的情况下以平均2到4年的最高性能运行。在那之后,功能开始退化,用户会升级到新一代产品,新产品拥有更多功能,更好的性能,电池充电间隔时间更长。但随着芯片被开发用于新的市场,或者过去电子产品不那么复杂的市场——汽车、机器学习、物联网和工业物联网、虚拟现实和增强现实、家庭自动化、云计算、加密货币挖掘——这不再是一个简单的清单项目。

每个终端市场都有独特的需求和特点,这影响了芯片的使用方式和使用条件。反过来,这对老化、安全性和其他因素有很大的影响。考虑以下几点:

  • 可靠性不再仅仅用年限来衡量。使用模式正在发生巨大变化。今天的汽车可能有90%到95%的时间处于闲置状态,而自动驾驶汽车可能只有5%到10%的时间处于闲置状态。这影响了电子产品的架构,以及开发技术的底层商业模式。
  • 随着边缘电子产品变得越来越复杂,功能性或“足够好”的定义正在发生变化。在过去,如果无人机或机器人上的摄像头破裂或脏了,通常会更换。但随着在边缘设备中添加更复杂的电子设备的推动,镜片破裂可以得到补偿,而且仍能保持足够的功能。另一方面,在不太复杂的系统中可能可以接受的部分现在可能被认为是不可接受的,因为系统公差更严格。
  • 与过去相比,退化和质量的建模受到更多因素的影响,其中一些甚至在这些芯片开发时都不明显。例如,一个已知的良好芯片如果与其他芯片或设备封装在一起,其表现可能与放在PCB上不同。

在整个电子产品领域,使用案例正在发生变化。这种情况甚至发生在数据中心内部,在采用新技术和方法方面,数据中心历来非常保守。

“老化是时钟速度和功率的函数,但在过去,当有工作要做的时候,服务器偶尔会启动,大多数时间它们都是闲置的,”的首席执行官西蒙西格斯说手臂.“当你迁移到云端时,设计标准需要有所不同,因为这是基于它使用的时间。这就提出了很多关于如何设计寿命的问题。”

在千禧年之初,服务器的平均利用率约为5%至15%,这一趋势在整个20世纪90年代一直持续,因为IT经理不愿意在一台商品服务器上运行一个或两个以上的应用程序,以防设备故障。发生了两件事改变了这种情况。首先,能源成本开始上升。其次,可能更重要的是,公司进行了重组,使IT部门负责自己的能源成本,而不是公司设施部门。这两个因素导致虚拟化软件销售激增,以提高服务器利用率,这意味着需要供电和冷却的服务器机架更少。

云计算将这种运营效率提升到了更高的水平。云操作的目标是通过在整个数据中心平衡计算作业来最大化利用。这可以显著提高数据中心中所有服务器(而不仅仅是单个机架中的服务器)的利用率,或者在不需要它们时快速关闭它们。这种方法是节能的,但它对电子电路的退化和老化有很大的影响。

公司营销副总裁Magdy Abadir说:“我们看到芯片老化的速度在加快。Helic.“他们可能丢失了时钟,或者有额外的抖动。或者电介质击穿。任何时候有东西坏了,就会有大量的新东西需要你去担心。许多老旧的车型都是在电子产品偶尔被使用的时代发展起来的。现在芯片一直在运行。在芯片内部,块正在升温,因此老化速度加快。从中你可以得到各种奇怪的现象。许多公司也没有修改老化的模型。他们认为这些设备可以使用三到四年,但它们可能很快就会失效。 And given that design margins from the beginning can be flimsy, aging can throw them off.”

汽车内部的使用趋势也在发生变化,这种趋势将持续下去,直到全自动驾驶汽车取代人类驾驶员。无人驾驶汽车正在处理越来越多的数据,其中一些数据来自雷达、激光雷达和摄像头等传感器。所有这些数据都需要在比过去更短的时间内处理,并具有高度的准确性,这给电子设备带来了巨大的压力。

“ADAS的可靠性至少为15年,这与过去2到5年的模块有很大的不同,”该公司首席技术专家Norman Chang说有限元分析软件.“衰老不仅仅是时间的问题。这也是NBTI(负偏置温度不稳定性),电迁移这可以是热相关的,ESD(静电放电),和热耦合。”


图1:芯片和封装的热建模。来源:有限元分析软件

虽然许多汽车一级供应商习惯于制造能够承受极端温度、机械振动和各种类型噪声的芯片,但这些类型的应力从未长时间应用于高级节点CMOS。许多业内消息人士证实,汽车制造商正在开发10/7nm芯片来管理所有这些数据,在前沿节点上工作,以避免他们的设计过时,这些设计通常适用于几代汽车。问题是,很少有真实的数据来显示这些设备在任何环境条件下的可靠性。

西格斯说:“你必须做出不同的设计。“有一种观点认为,你将需要更少的汽车,因为它们不会一直闲置。但也有另一种观点认为,自动驾驶汽车将运行得更多,磨损得更快。一切终将耗尽。挑战在于确保电子部件的磨损速度不会比机械部件快,这就要求你进行不同的设计。这包括更认真地对待噪音,最小化当前的峰值。”

更薄的绝缘,更薄的衬底
提高可靠性的一个讽刺之处在于,它与半导体50年来的进步相矛盾,后者的目标是每隔几年缩小功能,以降低成本。这通常意味着更薄的介质,更细的电线,动态功率的增加。越来越多地,它还涉及到更薄的衬底。在最先进的节点上,这导致了更高的泄漏电流、更大的噪声、更多的电迁移和其他电效应。

“从电路的角度来看,你知道你必须处理工艺变化,”André Lange说,质量和可靠性的集团经理弗劳恩霍夫东亚峰会.“但从设计功能的角度来看,这是关于如何应对系统中的已知缺陷。如果你看看自动驾驶汽车,有一个中央处理单元,它必须决定从哪个传感器使用哪些信息。其中一个可能很脏或者坏了。”

这使得退化建模更加复杂,因为它需要在系统上下文中完成。Lange说:“大多数因素都会导致电路退化,无论是NBTI还是每个给定区域的更多缺陷,还是更多的工艺变化。”他指出,一个巨大的挑战是确定导致缺陷的原因,而不是筛选所有可用的数据,这可能是巨大的。


图2:可能出现的问题。来源:弗劳恩霍夫

不同的方法
流程变化在每个新节点上增加。在过去的十年里,是智能手机推动了规模化路线图(iPhone于2007年推出)。如今,先进节点技术的最大用户是用于数据挖掘、机器学习、人工智能和云计算的服务器。

工艺变化和可靠性之间的联系是有据可稽的,但是变化使得精确模拟老化效应变得更加困难。这产生了许多不同的方法来解决这个问题,从复杂的统计建模和仿真到将传感器放置在芯片上或封装内部。

“有了热源,你就必须使用‘随机游走’方法来跟踪本地和全球的温度,”该公司5nm萃取的首席研发工程师Ralph Iverson说Synopsys对此.“在随机游走中,电压是周围电压的平均值,所以delta为零。”

艾弗森说,这有助于建模,但在5nm及以上的电阻率并不总是干净的。存在表面效应,数据并不一定代表铜的连通性,这需要更多本地化的数据。这就是混合类型的方法开始出现的地方,因为这种程度的不确定性很难抽象。

“汽车世界对BCD(双极CMOS DMOS)的需求已经很好了,但我们现在看到了对高级CMOS的需求和要求,”AMS产品营销总监Mick Tegethoff说Mentor是西门子旗下的企业.“我们看到晶圆代工厂的兴趣越来越大,EDA公司正在模拟压力导致的老化。这足够了吗?任何类型的建模都是对现实世界的近似。所以你做电路模拟,尽你所能来制造一个耐用的芯片,但随后你需要回到物理测试,做一些事情,比如把它放在烤箱里,以产生物理压力。现在,我们看到越来越多的电子产品都在进行这种测试。”

模拟与数字
到目前为止,大多数老化/退化建模都集中在数字电路上。模拟为衰老提供了一个完全不同的视角。

公司首席技术官Oliver King表示:“由于发动机舱周围采用了领先的芯片,公司很清楚老化和工艺变化,所以他们不会盲目前进Moortec.而模拟游戏的效果则更加多变。数字芯片就会停止工作。但是对于模拟,它可能稍微不太好,或者电路没有那么准确,所以你必须为此进行调整。模拟开发人员传统上没有像数字方面那样努力推动几何图形。电迁移和电流密度仍然是一个问题。但衰老的影响并没有那么明显。不过,芯片需要更加主动地了解修复状态,以及是否需要采取行动。”

公司产品管理高级总监Frank Ferro说Rambus他也有类似的观点。“对于PHY来说,最大的挑战是环境温度,”他说,“随着温度的驱动,性能会漂移,所以你需要重新校准。在消费者方面,有一种叫做“圣诞节测试”的方法。“在寒冷的天气里,你把Playstation或其他电子设备存放在车库里,然后在圣诞节早上把它打开,电路需要能够立即从寒冷恢复工作。”对于汽车或基站中的存储系统也是一样的。衰老对这些系统有影响,你必须重新校准系统以消除这些影响。”

Ferro表示,物理器件与数字元件一样,都要经过类似的测试,包括老化、电压和温度变化测试。但是物理物理层的设计会随着这些变化而变化,这很难设计到数字电路中,特别是在高级节点,那里的边际影响会对功率和性能产生影响。

模拟电路通常是根据所谓的“任务配置文件”设计的。因此,自动驾驶汽车中的特定功能将代表为自动驾驶汽车设计的IP的任务概要。

该公司高级营销经理Art Schaldenbrand表示:“我们看到的一个大问题是,根据它们的运作方式,并不只有一个用例。节奏公司的IC和PCB集团。“设备出现故障的方式有很多种。所以我们通过不同的压力来判断事情是如何失败的。BTI(偏置温度不稳定性)可能只在10%的设备上失效,但这是最坏的情况。所以我们需要更好的方式来表达退化。finFET的应力与平面器件不同,所以模拟的现象也不同。”

包装和其他未知数
作为摩尔定律越来越多的公司开始转向先进的包装,以提高性能,并在设计上提供更大的灵活性。到目前为止,还不完全清楚如何模拟高级包装来确定应力和老化。这在一定程度上是因为有太多的包装选择,没有人能确定哪一种会胜出。这在一定程度上也是由于许多这些包都相对较新,并且需要随着时间的推移来描述里面发生的事情。

Helic公司的Abadir说:“包装层可能与其他组件过于接近,或者来自另一侧的压力过大。“这需要效仿。即使在它老化之前,它也必须将老化作为模型,因为影响的数量正在增加。所以位置变得很重要。如果你移动物体,你就会改变共振的频率。没有简单的规则可以遵循。你必须分析设计,如果你发现了问题,你可能就需要进行调整。”

在复杂的设计中还有其他异常情况,随着时间的推移会影响可靠性。例如,一些使用的模型可能会比其他模型更频繁地打开和关闭电路,这给电路增加了压力。

Cadence高级软件架构师谢jushan Xie表示:“如果某个电路闲置太久,它将经历与其他电路不同的老化。”“设备越小,老化效应越强。压力会更大,衰老会更快。”

所有这些问题将如何解决尚不完全清楚。至少其中一部分将涉及新材料和新技术。

Mentor电子产品行业营销经理John Parry表示:“对于电力电子产品来说,这推动了硅基器件向SiC和GaN的转变,这些器件可以在更高的开关频率下工作,具有更高的效率,并能承受更高的温度。”“在某些应用中,这可以使电力电子设备更接近电机驱动器,从而进入更高的温度环境。在其他情况下,半导体能够承受更高的温度意味着需要更少的冷却。然而,半导体必须封装,并且封装还必须承受这些更高的温度。在新技术方面有巨大的投资,例如将烧结银用作模具连接材料,以及用夹子代替传统的电线键合,因此igbt等功率器件的包装在材料、加工技术和设计方面正在经历巨大的变化。”

结论
正在发生变化的是,人们意识到,随着设计转移到高级节点,或在安全是一个因素的新市场中使用较长时间,老化、压力和其他影响正变得越来越成问题。

弗劳恩霍夫的兰格说:“目前的基本情况是,客户正在提出问题。”“他们的出发点不同,这取决于你和谁交谈,但他们的提问频率更高。大多数人才刚刚开始。他们看到了更高的电压或更高的温度,并且正在进行一些实验来推断过度压力。但是理解退化是如何影响整个电路的就比较困难了。在复杂芯片方面还有很多工作要做。”

但随着意识的提高,解决这些问题的投资也在增加。退化建模和老化才刚刚开始出现在芯片设计师的雷达上。就像十年前的权力一样,这一切即将改变。

有关的故事
在10/7nm及以下,晶体管老化加剧
器件退化成为IC扩展的限制因素,也是先进soc的重大挑战。
自热会阻止finfet吗
中心鳍片的温度可能比其他鳍片高50%,导致阈值行为不一致和可靠性问题。
finfet有多可靠?
随着尖端芯片被整合到工业和汽车应用中,芯片制造商正在努力解决EOS、ESD和其他与电源相关的问题。
质量问题扩大
日益增长的复杂性、不同的市场需求和上市时间压力正迫使公司重新思考如何处理缺陷。



1评论

大卫·J·利里 说:

Ed,感谢你写了一篇写得好且发人深省的文章。热图让我眼前一亮……温度是电路性能和可靠性机制的重要驱动因素。我猜芯片上的温度传感器显示的模具是在一个凉爽的地方。这种热梯度必须由热管理解决方案考虑和解决。如果没有,这样的设计将有很大的风险,早期磨损我想。

留下回复


(注:此名称将公开显示)

Baidu