中文 英语

可靠性成本越来越难以追踪

测试、计量和检验成本随着选项的增加而变得模糊,芯片是为特定应用开发的。

受欢迎程度

确保芯片的可靠性正变得越来越复杂,成本也越来越高,从左到右进入了设计周期。但这些成本也变得越来越难以定义和跟踪,根据工艺节点、封装技术、市场细分以及使用的晶圆厂或OSAT,不同设计的成本差异很大。

随着芯片设计和组装方式的选择越来越多,将可靠性注入设计-制造流程和制造后监控的方式也越来越多。在效率和成本方面,所有这些都需要权衡,并且可能远远超出传统的可靠性指标,扩展到安全等领域。

在过去,许多这些功能被划分为定义良好的竖井,其中成本相对容易理解。例如,从20世纪90年代末开始引进finFETs,测试成本是总体设计和制造预算的2%。但随着谷歌、Facebook和苹果等系统供应商开发自己的定制芯片和系统,经济公式已经发生了变化。对于汽车制造商来说也是如此,他们正在努力在10年或更长时间内实现零缺陷,以避免代价高昂的召回。对于这些公司和许多其他公司来说,新芯片的价格可能是一个大得多的系统的一个小得多的百分比,可靠性的成本将在故障发生时的责任背景下进行分析。

利用芯片内部的数据或者在其预计的使用寿命内,这只会增加定价的混乱。用于监测热量、电活动和各种类型噪声的芯片内、封装内和系统内传感器依赖于数据比较,在某些情况下是多设备级的。这也为其他类型的数据打开了大门,以识别和跟踪电路的老化,潜在缺陷的影响,甚至可能表明网络攻击的可疑活动。

该公司技术和战略副总裁Keith Schaub表示:“这一切都因行业和应用而异美国效果显著.“一些行业不想腾出空间,也不想增加成本。但你必须权衡解决问题的成本,因为很多市场的设备架构变化太快了。”

更小,更慢,更贵
这种定价的不确定性至少部分源于这样一个事实,即在每个新的流程节点上测试、检查和测量设备变得越来越困难。例如,特征越小,密度越高,就越难让测试探针保持一致的接触。这反过来又需要更昂贵的设备来构建、处理和提取所有数据,并在数据不存在的地方进行高概率猜测。

与此同时,该设备需要在其他节省的情况下摊销。如果旧的,完全折旧的设备可以做这项工作,测试成本通常被认为是较低的。但是,如果新的方法可以取代旧设备所完成的一些步骤,或者更快地将芯片在晶圆厂中移动,那么这些都需要考虑到总成本中。如果新设备可以随着时间的推移而升级,摊销公式也需要反映这一点。

该公司副总裁兼总经理Jens Klattenhoff说:“成本通常是(测试)系统本身,所以我们必须确保该系统是面向未来的。形状因子的系统事业部。“系统的平均寿命是15年,但在15年内,测量要求会发生很大变化。你必须确保你可以修改这些系统来满足未来五年的需求。这需要一个坚实的平台,这样我们就可以专注于应用程序层。它还需要自动化,我们目前正在自动化方面投入大量精力,首先是自动温度控制和重新调整。”

检查也是如此。现在工厂里真正的主力是光学检验.但是,随着每个新工艺节点的特征变得越来越小,密度越来越大,使用现有的检测技术变得越来越困难,这既是由于有限的分辨率,也是由于吞吐量。有技术可以进行更精细的检查,但需要更多的时间。例如,电子束检验具有比光学检测更好的分辨率。它的灵敏度低至1nm,但比光学慢得多。

更复杂的是,一旦建立了足够的数量和可接受的缺陷率,就可能需要更少的检查。在一些市场中,晶圆只检查部分,而在其他情况下,整个晶圆可能被随机抽样。

在其他市场,如汽车或医疗,对可靠性的强调可能需要更密集的检查和更多的采样。为此,芯片制造商可以使用光学或电子束检测。它还可能需要更严格的规格来降低利润,从而以不同的方式降低成本,这就是原因所在计量符合这幅图。在测试和检查中普遍存在的相同趋势在计量学中也在发挥作用,例如原子力显微镜(AFM)和CD-SAX等未来技术,使用x射线源测量音调变化。

以AFM为例。AFM在包装中起着关键作用。“我们正在做的关键测量之一是垫片周围的所有斜坡,以及当地的地形,所有这些都会影响粘接能力,”该公司的高级应用科学家肖恩·汉德说力量.“使用AFM,我们在整个晶圆上检查不同芯片和芯片上大约50微米的区域。其中一个关键应用是观察顶线粗糙度——能够将这些打印中的换行和缺陷与后续缺陷联系起来。”

AFM也用于晶圆厂晶圆上的精确图样问题。“使用AFM,我们在整个晶圆的不同芯片和芯片上检查大约50微米的区域。其中一个关键应用是观察顶线粗糙度——能够将这些打印中的换行和缺陷与后续缺陷联系起来。”

但随着成本上升,设备也被扩展到其他领域,以提高投资回报率。

Bruker的技术营销人员Ingo Schmitz说:“传统上,我们一直在开发深度和粗糙度的AFM,现在我们扩展到CD。“我们一直在追求越来越小的线沟槽几何形状。现在我们正转向测量更特定于紫外线的东西,比如由于离轴照明而产生的顶线粗糙度。”

所有这些都需要在一个更大的上下文中进行观察,这增加了粒度,并能够根据需要从各种不同的选项中进行选择。与过去不同的是,一种规格不再适合所有应用程序。

的首席执行官苏博德·库尔卡尼表示:“流程的碎片化在这里发挥了作用CyberOptics.“如果有某种标准化,那么设计我们的传感器来适应这一点就会容易得多。而是因为每一个fab每一个OSAT似乎遵循着自己的过程,这导致了过多的排列和组合,使我们更加困难。距离越来越小,层数越来越多——所有这些都在起作用。这是已知的。但正是不同技术之间相互作用的碎片化导致了我们这个领域的困惑和混乱。”

这些技术的下一步发展还不完全清楚。仅在计量学方面,就出现了多种可能性。

“人们开始关注x射线技术,特别是用于混合键合,因为一旦键合——无论是芯片到晶圆还是晶圆到晶圆——如果凹凸衬垫内有任何空隙或有机残留物,就会造成问题,因为电阻将会增加,”晶圆检测产品管理总监Damon Tsai表示上的创新.“我曾与一家混合粘接客户讨论过这个问题,他们认为x射线、IR和超声波技术都很重要,但他们担心x射线会损坏材料,而且与传统检测技术相比,x射线检测速度较慢。”

可供选择的方法是红外检测和超声波检测,前者无法从顶部穿透金属,后者则存在波的反射和散射问题。

“使用红外成像技术,你必须翻转晶圆,从背面检查它,”Tsai说。“但如果你想看到背面,你必须看到鳍,这将降低灵敏度。因此,我们必须与客户合作,使用合适的鳍型。吞吐量仍然非常缓慢。通常我们只做IR的角检。这将大大提高吞吐量。这还不是整个威化饼。至于超声波,我仍然不认为有任何方法可以真正改进这项技术。”

长寿命
芯片制造商面临的最棘手的问题之一是芯片和封装的寿命更长,在汽车或工业等安全关键应用中,这些芯片还必须在有时极端的环境中工作。

“为了能够预测可靠性的变化,特别是性能的变化,你需要对电子和半导体有基本的了解,并具有推断的能力,以及用新数据更新这些推断的能力,”史蒂夫·帕特拉斯(Steve Pateras)说Synopsys对此.“你需要有健壮的解决方案来进行性能优化、安全优化,并确保可靠性。但这不仅仅是保持可靠性的问题。你希望能够预测事物。如果一辆车马上就要出故障了,你就会想要离开公路。”

Pateras指出,从最初的架构一直延伸到现场。“你需要冗余,你需要双锁步处理器,你需要监控所有这些活动。这将是一个要求。20年前,人们说他们没有空间DFT或者他们在做生意。现在没人谈论它,每个人都把它放进芯片里。在某些情况下,它甚至可以占到芯片面积的10%到20%。”

片上监控是测试、检验和计量的延伸。对于那些具有长寿命的芯片或衍生芯片,它还提供了一个潜在的循环到设计和制造中,以避免未来出现问题。这在汽车等市场中尤其重要,但由于许多设备都是异构的,涉及模拟和数字芯片,因此也变得更加复杂。

“测试本身是复杂的,制造过程是如此复杂,以至于它会产生测试甚至无法识别的缺陷,”Uzi Baruch说proteanTecs该系统通过将“代理”插入芯片的不同区域,并通过遥测技术实时输出数据。“他们中的一些人对工艺本身的变化很敏感,所以他们知道如何衡量特定芯片的预期性能。他们中的一些人正在关注芯片的整体性能和随着时间的推移的退化。他们中的一些人正在研究互连,特别是芯片对芯片先进的包装.他们中的一些人正在研究是什么导致芯片退化,或电压下降,或与温度有关的事情。”

这在封装中变得更加复杂,其中选项的数量激增,以及不同芯片之间相互作用的可能性。这里的挑战是确保封装中的芯片在组装过程之前和之后都能正常工作。

“这一过程的复杂性正被推到下游,”英国皇家银行业务发展经理戴夫•亨特利(Dave Huntley)表示PDF的解决方案以及单一设备跟踪任务小组组长。“将所有这些连接在一起的组装部分正在成为整体性能的重要贡献者。但如果你不能保证设备内部部件的可靠性,那么谈论设备的性能或可靠性就没有意义了。”

这就是数据分析的作用所在,围绕这种方法,行业中出现了一些新的联盟。Advantest最近与PDF Solutions的交易就是一个很好的例子。

“PDF解决方案有一堆数据交换(DEX)网络,所有的数据都已经通过这些DEX网络流动,”Advantest的Schaub说。“现在,我们正在我们的整个产品链中添加边缘计算能力,你可以将这两者结合在一起。它们实际上是互补的。我们在边缘领域做得很好,而PDF解决方案在云方面做得很好。两者都需要。你需要能够在边缘和云端运行模型,如果你能将它们连接起来,那么你就可以让它们相互提供信息,并改进模型。”

其他费用和选择
在特定的市场中,对于特定的芯片设计,所有的部件如何组合在一起可能会有很大的差异,与测试、计量和检验相关的成本也会有很大的差异。例如,OSAT的成本包括设备、人员、实验室操作(建筑、电力)和一些数据收集。半导体公司的成本是与OSAT合作设计测试、数据分析和人员来分析数据、移动数据和产品的成本、OSAT服务的使用以及测试所需的时间。如果芯片没有通过测试,成本就会上升,如果芯片通过测试,但在现场测试失败,成本甚至会更高。

在过去,这些步骤中的许多都是明确定义的。现在情况已经不同了。除了已经存在多年的芯片种类之外,新的设计正在增加测试要求。其中包括:

  • 3D设备测试,包括四个测试流程步骤
  • Chiplets
  • soc
  • 混合信号装置,包括毫米波装置
  • 先进的包装
  • 大型AI芯片,通常达到或超过网格的极限。

特别是人工智能芯片是另一个测试挑战。“等级森严,”Synopsys公司硅生命周期管理(Silicon Lifecycle Management)营销总监兰迪·菲什(Randy Fish)说。“有趣的是,很多芯片都是阵列结构。你可以用这种方式解决测试问题,所以这是你可以利用的东西。”

此外,规模问题继续增加。缺陷会随着高级节点的增加而增加,而不是一次只增加一个。同时出现多个缺陷是正常的。有时,看似单一的缺陷实际上掩盖了多个缺陷。微软高级软件工程经理Sameer Chillarige说,这反过来又会导致错误掩盖和强化节奏在ETS2021的演讲中。使用故障模拟在所有可能的错误组合上花费太多时间。

还有一些降低成本的新策略。在测试方面,并行测试已经成为提高吞吐量的一种方式。但是测试也可以更有效,如果芯片出现故障,可以通过分析数据更快更准确地诊断,并且可以改进测试技术的设计,例如压缩电缆长度和改善扫描访问。

诊断吞吐量——在给定时间内在计算硬件上诊断出的故障设备的数量——特别重要,因为必须诊断数千个故障芯片,并对这些数据进行处理,以找出导致故障的系统问题。

Chillarige说:“这种方法被称为体积诊断方法。“为了实现批量诊断方法的高吞吐量,我们的客户已经在分布式农场运行诊断工作很多年了。然而,随着设计尺寸的增加,先进故障模型的引入,压缩比的增加,诊断运行时间和内存消耗都显著增加。为了保持吞吐量,要么诊断工具必须变得智能,要么客户必须增加大量的计算资源来满足需求,但这并不总是可行的。”

结论
可靠性成本不再像过去那样被分割。提高可靠性的努力从架构设计流程的前端开始,并在该设计的测试蓝图设计中开始,并在芯片、封装或系统的整个生命周期中继续进行。

不同市场、不同设计、不同芯片或芯片封装的整体预算,各部分的组合方式都有很大差异。作为芯片开发总成本的一个百分比,在安全和关键任务应用中,确保可靠性的成本总是更高。但作为整个系统成本的一个百分比,这些数字可能相差很大。

Chillarige表示:“我们的想法是消除设备上的固定成本,并在所有设备上摊销可变成本。但这对不同的公司和应用程序有多重要,取决于他们想要实现的目标。

有关的故事
重新计算考试成本
为什么对众所周知的过程给出一个数字变得如此困难。

考试成本飙升
在安全和关键任务市场中使用更复杂的芯片正在改变制造业的定价公式。



留下回复


(注:此名称将公开显示)

Baidu