什么数据中心从汽车芯片制造商可以学习

更高的质量、更低的成本和更快的上市时间都要求增加复杂性在数据中心的车辆与defectivity重叠的问题。

受欢迎程度

汽车oem要求半导体供应商实现几乎不可测的目标10每十亿(DPPB)有缺陷的零件。是否这是现实还有待观察,但系统公司正在效仿,为他们的数据中心soc水平的质量。

建筑质量水平是更昂贵的,尽管最终可以节省成本和必须解决的问题。但也更加test-intensive和慢屏幕上每个产品的每个方面,这两种推高成本。现在的问题是,是否可以做这种级别的筛选速度不够快,不够熟练,对于所有这些芯片。

今天,接受消费者和数据中心ICs逃脱率在300年到500年有缺陷的ppm (DPPM)。但即使是实现这些目标仍是极具挑战性的课题。从元)和谷歌(Google)最近的报告表明逃跑率高达1000 DPPM多核soc的运算器。

在筛选IC产品的瑕疵,芯片制造商对汽车和超大型数据中心继续推动和拖轮yield-quality-cost三角形从不同的方向。

汽车制造商降低了缺陷十亿分之几的最大数量从10000年到10。但芯片用于车辆也变得更加复杂,其中包括一些5 nm soc中央计算车辆。仍然达到质量目标,制造这些设备,特别是在低asp汽车oem厂商要求,将会很困难。

相比之下,超大型soc制造商在销售价格有更多的缓冲,但它们在极端压力下更快地生产出他们的设备。筛查缺陷数以十亿计的晶体管和联系人,和十几公里的互连,在任何情况下都是一个巨大的挑战,更不用说一个供不应求的市场窗口。和这些芯片的功率/性能目标要求继续扩展,这在每个新节点正明显变得更加困难。三阶效应现在一阶效应和设计的利润率非常紧,缺陷会导致数学误判和其他计算执行错误。

“数据中心的复杂性cpu、gpu和人工智能处理器通常远高于标准的处理器的晶体管数量和排列软件电路的操作。一个测试孔,由于缺少排列的测试向量,通常怀疑作为一个沉默的主要原因数据出现错误,”副总裁Keith他说技术和策略美国效果显著。“简单地说,运动是不可能与所有可能的排列测试设备,操作模式,和外部信号,可能影响操作(例如,通过引起中断),以及噪声,可以夸大某些内部状态。”

收敛问题
汽车集成电路供应商有几十年的实践检测的失败中发现客户的回报。这是由交付零缺陷的心态。与顽强的毅力,工程师跟踪失败和识别额外的筛选技术,他们取得了过去使用的设计周期较长,主要是在成熟的节点。2021年的一篇论文由NXP汽车工程师[1]详细说明了这样的侦探工作的性质。16 nm finFET单片机,工程师需要一个新的故障模型5 DPPB发生一次故障检测。

汽车制造商的担忧也推动更多的检查、测试内容、测试条件、DFT,现在在系统检测失败。

“汽车芯片供应商,明确财务失败的代价,与产品和终端用户的影响。它推动高水平的严格对功能安全测试需求。一个很好的例子,这是汽车中使用的任务配置文件用于流从OEM需求一直到每个SoC,”马克Hutner说,产品营销高级总监,proteanTecs。”这些概念被扩展到数据中心,确保硬件,软件,和环境,性能和可靠性的信封。这些需求将进一步推动采用增强的DFT、可见性和诊断硬件在系统使用。”

其他人也同意。“总的来说,汽车使用的更详尽的测试流IC供应商与多个插入在高和低的温度,以及老化,更大的可靠性一直是传统的路径,”肯•尼尔说,战略业务发展总监Teradyne。“汽车设备依赖的另一件事是多参数测试,如IDDQ。这些都是适用于数据中心的设备,除了寒冷的插入。数据中心设备可能不需要插入一个冷。”

在制造业,筛查通常可以归结为有缺陷的零件检查,电气测试和分析。是有效的检验需要生产的100%。明智地使用测试条件和更复杂的生成时间协助检测边缘的行为。最后,应用孤立点检测算法的分析,以确定适当的限制可以帮助工程师管理yield-quality-cost三角形。

图1:制造筛查的机会。来源:Semie新利体育下载注册ngineering /。Meixner

图1:制造筛查的机会。来源:Semie新利体育下载注册ngineering.com/A。Meixner

100%检验
在晶圆和装配工厂,检验后使用所选样品的晶圆制造步骤/模具/单位。这些结果可以指导工艺/设备改进和确定总misprocessing发生。与日益增长的需要检测的缺陷,工程团队可以执行检查生产晶片和部分制造业的100%。这需要更快的物理检查可以准确区分好坏的图像。

汽车供应商已经成熟的半导体过程主要使用光学晶片检查的方式来识别可疑死亡。NXP和onsemi工程团队提出的结果在2019年的汽车电子委员会可靠性研讨会[2,3]。检验数据和电气试验数据相结合可以提高区分相关的缺陷和良性的,正如2020年欧洲测试研讨会论文onsemi [4]。

但对于先进CMOS工艺节点,光学是不够的。需要检测的缺陷是不可见的。与汽车制造商开始使用finFET技术人工智能/毫升,现在需要两个行业添加技术来获得更高的产品质量。

“如果你看看ADAS芯片、光学技术不会工作得很好,”Andrzej Strojwas说,首席技术官PDF的解决方案。“你不敏感。如果你减少像素大小,你看到的所有讨厌的缺陷。从边缘节点,之前你看到最终的可靠性故障,你会看到泄漏源漏门之间的联系。”

需要检测泄漏的设备水平促使电子束计量检测技术的使用目的[5]。这种方法可以测量泄漏通过电压的对比。最先进的soc是特别感兴趣的缺陷检查10 +十亿的联系人。这需要分析物理设计布局模式容易DFM可变性,创建电子束可测量的测试放在实际的电路结构,并进行快速测量——在两个小时内,使在线检查。

需要100%的检验与晶片不结束。检查现在包括个人死后基板和凹凸应用,死亡和包底物之间的债券,package-to-board债券。汽车集成电路供应商导致数据中心供应商转向这些更高水平的检查。

“我听到汽车客户,他们已经把他们的供应商,如果它不是,”弗兰克Chen说应用程序和产品管理主管力量。“那是数据中心可以采用。他们肯定可以看到很多商业利益——尤其是在AI——更多的投资有更高的质量,采用100%检验汽车已经推动几年。”

作为一个行之有效的工具组装房屋,光学是快速和相对便宜但只检查表面缺陷。通过层x射线成像提供了能力,这有利于检查包底物撞互连。

“力量的x射线成像产品线(原名SVXR)快到足以支持内联检查,”陈先生说。”但更昂贵的比光学方法,所以工厂需要考虑总体拥有成本的角度来看。设备的复杂性和成本上有一定的阈值的缺陷为100%检验商业意义。”

asp,在先进的数据中心产品包装属于这一类。然而,与x射线技术仍有一些担忧。

“很高兴有一个高速工具现在,但一些公司的一个障碍是关注剂量影响周围的高带宽内存模处理器死,”陈。与x射线成像”,还在调查中,还有能源过滤等技术来减轻这种风险,减少曝光时间。与此同时,它仍然是有价值的设置过程在热压键合(TCB)工具使用一个虚拟或牺牲内存死去。一个先进的包装工厂可能有成百上千的TCB资格日常工具,所以需要有一个解决方案不够快扫描样品由每个TCB工具。”

测试10 DPPB
在测试过程中,汽车供应商ICs使用先进的测试生成工具,多个环境测试条件,老化插入和孤立点检测算法。长期以来,这些技术使他们能够争取10 ppm缺陷。不是所有这些都是使用先进的soc开往数据中心oem制造商。

首先,添加测试内容,更精确的目标小延迟有好处。但由于其费用,它需要有选择地应用。

“Slack-based过渡延迟生成旨在使过渡的用最少的松弛,”亚当说Cron,杰出的建筑师Synopsys对此。“这是技术不是一个路径延迟测试,但这是试图成为一个为每个节点的信号通路。所以这意味着较小的缺陷,检测到缺陷的机会越大。添加cell-aware逻辑门故障模型让你两个缺陷类型故障模型比传统的过渡。这multi-gate逻辑细胞尤其重要,而再次出现在finFET技术。”

图2:的好处slack-based cell-aware生成时间。来源:Synopsys对此

图2:的好处slack-based cell-aware生成时间。来源:Synopsys对此

与汽车测试过程,工程师应用在多种环境条件测试内容——电压、温度、频率——因为他们要么改变缺陷的行为或减少设计余量。

“一些点缺陷导致行为的变化相对较小,将附近的一个芯片失败,但不是真正的失败,”罗伯•艾特肯表示杰出的建筑师Synopsys对此。“这些边缘部分可以与边缘测试电压或温度的变化,不同的缺陷机制是或多或少容易受到极端高和低。现有的或目标模式应用于多个测试条件可以帮助识别那些。”

赶出早期生活失败,工程师使用老化(高温度和电压应力)或晶片电压应力。

“另一个技术汽车供应商用来改善电压质量是压力测试。用这项技术,所有设备别针都达到或接近他们的过程电压限制,其次是中泄漏测量。中泄漏测量相比,相同测量预应力,”托马斯·克勒说,汽车产品营销经理Teradyne。“目前,大型数字设备通常只做Vdd压力测试。在I / O压力测试汽车已经越来越有价值的技术设备,目前尚不清楚这是否会成为有价值的数据中心集成电路测试由于工艺的差异。”

一些缺陷失效模式加剧了温度,和汽车供应商被要求测试在冷和热的温度。

“汽车供应商测试在广泛的温度范围内,“PDF的Strojwas说。“更广泛的温度范围可能不是必要的数据中心。但实际上我们发现有一个很好的相关性失效机制和最终测试热的或冷的条件下,这些实际上可能会影响早期的婴儿死亡率。”

孤立点检测算法
在1990年代早期汽车电子委员会(AEC)传递部分指出,在车辆电气测试失败统计离群值。这种动机的异常检测方法的使用屏幕可能有缺陷的零件。

“关键要记住的是,汽车制造商不只是需要找到哪些设备是坏的现在,”Teradyne的拉尼尔说。“他们还必须找到设备在未来可能会失败。这就是老化和异常值检测。再次,直流参数数据起着关键作用,因为它提供了统计的洞察力,一个功能测试不通过/失败。专注于泄漏电流的测量在压力下或不可接受的行为是关键。”

用于几乎所有CMOS缺陷测试程序,泄漏测试很好地统计离群值分析。“动态部分平均测试(D-PAT)和泄漏提供了一个很好的例子。如果你有一个意想不到的漏电路径应该显示为局外人泄漏分布,”马克说Laird,高级职员在Synopsys对此应用工程师。“死短会失败你的泄漏试验,但是软缺陷导致高架泄漏——这绝对是你想要过滤掉一部分。”

而数据中心供应商尚未应用孤立点检测算法,大量消费者IC供应商这么做的。

“这些汽车算法已经应用于消费产品,“Dieter Rathei说,首席执行官博士产量。“例如,大手机制造商像苹果需要类似的质量检查。人们不接受如果他们的智能手机坏了。大企业都意识到了这一点,这就是为什么他们要求他们的供应商使用部分平均测试(PAT)算法。我们有苹果供应商在我们的客户。他们使用YieldWatchDog正是出于这个目的。”

有许多异常检测技术,包括好死在坏邻居集群,集群检测、集群边界,D-PAT, z轴帕特(Z-PAT),和最近邻残留。“所有的这些技术都是同样适合任何需要更高质量的细分市场,“Laird说。“有趣的是权衡时应用这些异常数据中心集成电路的技术,因为它总是平衡的。产量是多少你愿意放弃打包和可靠性?数据中心的经济非常不同于汽车。”

在寻找平衡产量损失和检测测试逃的发展正在进行更复杂的算法。

在过去的10年里,我们已经收到很多请求我们的质量模块添加特定功能。这是一个非常复杂的工具和配置选项的经典算法,然后对一些算法,改进了。例如,经典的原子能委员会算法要求正常的分布式数据和电气试验数据很少是正态分布,“Rathei说。“这就是为什么我们不需要一个高斯分布的变异测试数据。还有像Z-PAT算法,聚类分析,价值转变。价值转变分析你可以看看低温和高温测量,或pre-burn-in与post-burn-in测量。如果有一个预期范围之外的价值转变,我们国旗这些设备。”

结论
汽车制造商长期以来一直要求更高的质量和可靠性比桌面组件和数据中心电脑制造商。但现在这两个世界处理许多相同的问题。超大型数据中心运营商,如元和谷歌,报道微妙的错误行为,渗透通过吃流和系统级测试。

现在的大问题是他们是否能适用于汽车供应商执行的相同级别的审查和汽车制造商是否能提供这样的质量保证为其最先进的芯片在一个可接受的价格点。与数据中心的计算的复杂性抵达汽车,两个屏幕供应商需要增加他们的努力尽可能多的潜在的有缺陷的零件(时刻0和潜在的),他们需要做快速有效,同时控制成本。

引用
[1]j·科索,拉梅什,k . Abishek l . t . Tan和c Hooi卢,“Multi-Transition故障模型(MTFM)生成模式实现0 DPPB在汽车设计,“2021年IEEE国际测试会议(ITC), 2021年,页278 - 283

https://ieeexplore.ieee.org/document/9611352

[2]Anilturk, o . et al .,“内联部分平均测试(眼睛)减少逃离空白测试和潜在可靠性缺陷:继续在NXP可行性研究的结果,“Anilturk,第二个欧洲汽车电子委员会可靠性研讨会,2019年10月15日。

[3]Bruneel, g . et al .,“玛莉的实现使用高速缺陷筛查,”第二个欧洲汽车电子委员会可靠性研讨会,2019年10月15日。

所有报告从2019年汽车电子委员会可靠性研讨会可以找到这个链接:http://www.aecouncil.com/AECWorkshop.html

[4]a . Coyette w . Dobbelaere r . Vanhooren n . Xama j·戈麦斯和g . Gielen“潜在缺陷筛查Visually-Enhanced动态部分平均测试,”2020年IEEE欧洲测试研讨会(ETS), 2020年,页1 - 6,

https://ieeexplore.ieee.org/document/9131593

[5]Marcin Strojwas, et al。”先进的高通量电子束直接扫描,检查“NANOTS 2021年会议

https://www.pdf.com/resources/nanots - 2021 -高级-高吞吐量- e -梁-检验- directscan/

有关的故事

汽车芯片制造商挖到10磅
能够驾驶10有缺陷的质量都是关于发现,预测在ICs微妙的行为。

比赛在汽车ICs零缺陷
100%检查,更多的数据,和可追溯性将降低装配缺陷困扰汽车客户的回报。

为什么沉默数据错误那么难找
微妙的IC缺陷数据中心cpu导致计算错误。

筛查沉默的数据错误
可以找到更多的sd使用有针对性的电气测试和100%的检验,但不是全部。



1评论

TX-RX 说:

低得多的汽车量晶片可以执行许多额外的质量控制措施。
试图这样做在一个高容量的SoC磨生产停顿或需要大规模投资工具和几乎肯定新洁净室的施工空间。

留下一个回复


(注意:这个名字会显示公开)

Baidu