减少异构设计中代价高昂的缺陷

为什么发现和修复人工智能和汽车芯片中的错误如此困难?

受欢迎程度

随着芯片制造商开始在一个芯片中添加多个芯片,或者在同一个芯片上添加多个处理器核心和内存,缺陷的成本正在上升。简单地说,一根坏线就会破坏整个系统。

为了减少缺陷的数量,需要解决两个主要问题。首先是识别实际缺陷,随着芯片变得越来越大、越来越复杂,以及每当芯片与其他芯片封装在一起时,这就变得越来越困难。第二个问题是找出缺陷的根本原因,以及如何防止它再次发生。

这两个问题都需要放在新的设备架构、先进的封装、越来越小的功能中来考虑噪音以及潜在的信号干扰,以及技术在不同市场的新应用。例如,关于其中一些芯片随着时间的推移将如何表现的历史数据很少,特别是在汽车、工业和航空航天应用中,这些芯片可能需要运行几十年。并不是所有的缺陷都严重到足以在一开始杀死一个芯片,但一个可能不会在智能手机上造成问题的潜在缺陷,可能会在汽车或AI芯片上滥用10年或更长时间后导致整个系统故障,因为有些电路一直在工作。

“测试中有两大因素,”技术实现总监Ron Press说Mentor是西门子旗下的企业.“首先是寿命。其次是规模。其中一些芯片有数千个不同的区块。今天的挑战是识别一个坏掉的块,在某些情况下如何使用其他块作为备用。处理器公司多年来一直在多核设计上这么做,他们决定了芯片的性能规格。可能有四个核心,但其中一个不能运行。但现在你有成千上万个核,而且公司没有标准的方式来重新配置它们。”

也没有标准的方法来追溯缺陷的原因到晶圆片上的单个模具。虽然这在消费者应用程序中可能无关紧要,但在安全关键型应用程序中却会产生重大影响。更糟糕的是,问题可能会在其生命周期的不同阶段出现,这取决于特定设备的使用方式和位置。

“除非你在这些芯片上有某种ECID(电子芯片识别),否则它们无法追溯到晶圆,”戴夫·亨特利(Dave Huntley)说PDF的解决方案并担任单一设备追踪任务小组的组长.“在过去,你可能会看到一款带有ECID的先进芯片,但这并没有考虑到它周围的所有其他设备。当你加入工艺步骤和装配时,它变得更加复杂。所以如果你用线连接一个部件,这个连接可能是电性好的,但是一根线可能有稍微不同的轮廓。如果你得到任何故障的迹象,你需要追踪到设备,并跟踪它在晶圆和组装过程中的位置。但我们缺少的是通过组装来跟踪单个设备。”

如何解决这个问题并不总是很清楚,因为在制造过程的一个步骤中,晶圆上的一些模具可能只会出现缺陷。随着步数的增加包装随着这些步骤的容忍度不断收紧,精确定位变得越来越困难。

由内而外,由外而外
根据测试数据检查侧面是确保质量的关键,但它越来越多地只是解决方案的一部分。另一部分涉及观察芯片或封装内部或各种制造过程中发生的事情。在电路中和进程内的数据收集方面有很大的推动作用,让所有的部分都排列起来并不是一件容易的事情。

这种方法的一个迭代涉及到嵌入传感器集成到芯片、封装或系统中,以监控生产过程中的行为以及整个生命周期。

测试和数据分析副总裁Alex Burlak表示:“有两种方法可以降低失败包的风险——首先更好地测试每个芯片,并为每个封装选择能够良好工作的芯片。proteanTecs.“通过监控每个IC、芯片和系统中数百万条路径的频率余量,供应商可以获得性能覆盖可见性、早期良率波动检测、与硅前模型的相关性、余量和热点检测、芯片上的变化等,最终可以实现10X DPPM(百万分率缺陷件)的改进。”

然后通过机器学习来推断这些数据数据分析提高产量和性能。

“从每个模具中提取和推断出大量的参数数据,”Burlak说。“芯片分类,包括从功率/性能角度对每个芯片的期望,是在非常早期的阶段进行的-晶圆分类,甚至在封装之前。有了这些数据,您就可以开始优化每个包或系统中芯片的选择和交互。例如,供应商可以为高性能存储器选择较快的模具,为低功耗存储器选择较慢的模具。这样他们就可以避免让最薄弱的环节决定组装包的功率和性能。当然,他们也可以混合高性能模具和低性能模具,以平衡它们之间的相互作用,这样就可以提高产量。”

大多数这些解决方案的基础是测试和数据分析的混合方法。数据越来越被视为各种流程和设计步骤之间的共同线索,而机器学习则是解释和利用这些数据的最佳方式。

公司副总裁兼总经理Doug Elder说:“每个人都在努力尽早找到工作。OptimalPlus.“客户希望我们做的是在进入晶圆厂的过程中尽早收集数据。如果您有来自汽车客户的回报,处理一个汽车应用程序可能需要花费5万到10万美元。如果你在它出门前买到它,它可能只需要3万美元。所以你的整体产量和效率会提高,而你的成本会下降。关键是一个开放的架构,允许你从任何来源获取数据,并在过程的任何时候对其进行分析。”

这种方法是必不可少的,因为有了新技术,比如5克在整个设计和制造流程的每个步骤中,并非所有东西都是可访问的。

埃尔德说:“5G的挑战在于,一些测试必须在系统层面上完成,而不是回到功能测试或在过程的早期。”“如果你收集了这些数据,那么你就可以观察它,得出一些结论,并将其中一些反馈到你的过程中。”

结构的抽象
其中一个主要考虑因素是如何重新构造各种流,以便能够从流的所有部分收集和利用数据。这需要打破为划分和优化各种流程和操作而创建的一些筒仓。问题是,随着新市场的出现,设计方法、架构和设计优先级的转变,许多筒仓很快就过时了。

解决方案营销副总裁George Zafiropoulos说:“从谁感到疼痛开始。国家仪器.“实验室里的那些人是流动的第一个下游部分。所以是硅前EDA,硅后验证,实验室培养,验证,表征和生产测试。典型的方法是,所有东西都生活在一个筒仓中,之后你就不知道外面还有什么。我们曾见过一些案例,有些人因为没有时间去理解结果或了解所有的陷阱而停止使用模拟器。”

即使在不同竖井之间存在明显联系的地方,差距仍然存在。

“你需要做的是建立一个基础层,这基本上是使用机器学习的基础设施,”Zafiropoulos说。“一旦你有了数据平台,你就可以从不同的来源获取数据,清理并分发。然后你可以使用机器学习,在测试世界中,机器学习适用于修改测试序列。AI还允许你做的是弄清楚你是否需要在每个电压和温度下测试所有排列,或者你是否只需要测试一个子集。您不希望做了100个测试却发现最后一个测试失败。以汽车行业为例,它可以让你在整个流程中关联结果。”

这就是一些根本性的变化正在发生的地方。

“在过去,汽车已经做了P-PAT(参数部件平均测试)筛选,他们使用参数部件平均测试,不仅根据设备的规格和电气性能筛选出来,而且还根据任何看起来不在正态分布范围内的设备进行筛选,即使这些设备符合规格,”切特·勒诺克斯(Chet Lenox)说,他负责新技术和研发过程控制解决方案心理契约.“这往往会减少使用纯电气测试格式的潜在可靠性故障。您基本上已经拥有了所有这些测试数据,但是您应用了更严格的需求。这并不一定是更严格的规格。这是统计部分平均测试。所以你损失了一些产量——你扔掉了1%、2%或5%的骰子——但你得到了更可靠的骰子。”

这就是重点正在转变的地方,尤其是在汽车等市场,以及那些预计只能零星使用几年以上的设备。

“现在令人兴奋的是用I-PAT对内联缺陷数据做同样的事情,这是内联部件平均测试。你从模具上取下所有的数据,通常使用快速光学检测工具,然后你根据缺陷数据在线筛选出模具的百分之几。即使它通过了排序,您也不想发布它,因为它以后可能有潜在的缺陷可靠性数据,或者测试程序的覆盖率可能不够好,无法捕捉到那个特定的缺陷。我们在这一领域看到了很多新技术,我们正在开发分析技术和工具来筛查这些缺陷。”

人类有时也会参与进来
这与正在进行的一些广泛的变化相吻合人工智能在这个世界上,人们对机器学习和深度学习可能是非常有用的工具,但它们并不总是独立存在。因此,人工智能不是作为一个独立的系统运行,这需要大量的编程和重新编程,当与人类专业知识和深厚的领域知识结合在一起时,它是最有效的。

机器学习是这一切的关键组成部分,因为它可以用来识别数据中的联系和模式,这些数据远远超出了人类可以追踪的细节水平。但是仅仅将机器学习应用于一个问题并不一定会产生好的结果。它需要在头脑中有目的地使用,并且需要与深厚的领域知识相结合。

“理想的方法是机器学习和领域专业知识的结合,”凯文·罗宾逊(Kevin Robinson)说yieldHUB.“机器学习可以以不同的方式筛选不同的维度。但事情没那么简单。如果您将这些数据作为输出显示,它通常没有那么有启发性,而且很容易丢失。在开始机器学习之前,你需要考虑你要做什么,以及你想从这些数据中得到什么。如果你做得对,你会得到能帮助你优先行动的结果。这样更直接。”

重点是将机器学习作为一种工具,而不是可以用来解决任何问题的黑盒技术。

PDF solutions公司人工智能解决方案副总裁Jeff David表示:“行业正在转向主动学习,你可以使用机器学习来增强你已经在做的流程。”“因此,如果你使用机器学习来预测晶圆的产量,人类可以检查结果。机器学习将完成80%的工作,而人类将完成最后20%的工作。所以基本上我们是在用机器学习让分析变得更好。这种方法还有助于消除机器学习的不透明性,并将控制权交还给客户。”

这也需要一种不同的思考机器学习的方式。新的方法不是将其视为工具,而是将其视为工具箱中的工具集合。

“如果你考虑深度学习,如果你把它应用到正确的环境中是很好的,”大卫说。“但如果你把它应用到一个浅数据集上,效果就不好了。所以你需要很好地理解机器学习市场,你用机器学习做什么,你还需要明白这不是黑魔法。”

展望未来
接下来是向预测分析和最终自我纠正的发展。

“你所做的SPC(统计过程控制)分析是寻找模式和趋势,”Tim Skunes说,该公司技术和业务发展副总裁CyberOptics.“第一个决定是是否允许。也许它不符合规格,或者构建不好,或者包被扭曲了。接下来,您需要在数据中寻找模式,以确定是否存在一致性。例如,您可以通过反馈循环筛选打印机,并根据大量数据进行调整。在此基础上,你可以使用深度学习技术来识别变化的来源、模式和趋势。一块板上可能有50种不同的锡膏。你需要找出是哪一个导致了问题。这对于高可靠性部件尤其重要,比如在汽车市场。”

测试将捕获这些缺陷中的一些,但不是全部。

yieldHUB的罗宾逊说:“我们正在为一家公司做一个项目,他们的最终客户正在寻找测试中没有显示出来的硅缺陷。”“他们还没有生成足够的数据,但一旦他们做到了,他们将能够使用机器学习来查看竖井数据之间的关系。这可能是成千上万的潜在关系。关键是能够分离出问题,深入研究并隔离它们。”

最终目标是自我纠正在现场发现的问题,并将它们反馈到生产环境中,以防止未来出现问题。但对于大多数电子产品来说,这种能力仍处于早期研究阶段。打破数据孤岛,找到数据中的关系是重要的第一步,但这只是向更有效地使用这种数据分析的广泛转变的开始。



留下回复


(注:此名称将公开显示)

Baidu