中文 英语

提高芯片可靠性的不同方法

实现零缺陷需要在新的地方进行更多不同种类的测试。

受欢迎程度

在安全和关键任务应用中提高可靠性的推动正在推动半导体设计、制造和芯片行为的生产后分析方面的一些创新方法。

虽然在汽车行业,随着时间的推移,质量受到了严格的审查,德国汽车制造商要求芯片使用18年无缺陷,但德国并不是唯一一个要求延长可靠性的市场。智能手机制造商现在要求芯片至少工作四年,而不是以前的两年。在某些情况下工业而且物联网在应用领域,更换传感器很困难,一些芯片需要使用20年或更长时间。

新颖之处在于,其中一些芯片是在前沿节点上开发的,有时带有异构计算元素。例如,汽车逻辑正在采用7nm工艺设计,尽管在高温、低温和几乎连续振动的高应力条件下使用高级节点芯片的历史还没有出现过。在高性能芯片中,至少有一些电路一直处于工作状态,现在的模拟必须包括各种工作模式的影响,以显示电路如何老化,系统如何随着时间的推移而运行,传感器将有多精确,以及需要多久重新校准一次。

这就产生了许多不同的方法来提高可靠性,远远超出了典型的测试和检查。其中包括:

•IP内置测试。
•在线/片上监控。
•机器学习发现数据中的模式。
•在不同的地方进行更多的测试。

IP变更
商业IP供应商正在向其产品中添加测试功能,以满足汽车、工业和医疗应用对提高可靠性的需求。

集成的知识产权一直是一个问题,这通常是通过更好的描述和强调证明这个IP已经在硅中得到验证来解决的。但随着IP被添加到用于安全关键应用的设备中,能够在芯片或系统的整个生命周期中测试它变得越来越重要。

“客户希望在他们的IP中内置测试功能,”该公司高级总监Suk Lee表示台积电的设计及基建管理科。“即使是高速模拟也会出现这种情况。自检有回环模式。知识产权行业越来越多地参与其中,我们也开始更加关注它。”

关键的驱动因素之一是汽车的可靠性,故障——尤其是召回——在美元和品牌声誉方面都是昂贵的。艾睿铂(AlixPartners) 2018年的一份报告指出,通用汽车(General Motors)的一个故障点火开关让该公司损失了41亿美元,而更换有缺陷的安全气囊让高田公司损失了10亿美元(汽车oem的成本更高)。自那以后,成本一直在上升,随着汽车的安全功能越来越多,汽车制造商及其供应链面临的风险也在上升。

“有几个关键的趋势,”技术实现总监Ron Press说Mentor是西门子旗下的企业.“一种是即插即用,将测试技术嵌入到不同的系统中。可以是小的IP块,也可以是处理器IP。不管测试做了什么,你把它插入到系统中。所以你可以将测试控件嵌入其中。IJTAG标准说,“这是如何与一个系统连接,这是如何告诉它要做什么。“随着一切变得越来越复杂,就会有更多的测试嵌入其中。因此,对于IJTAG (IEEE 1687)接口,内部有片上时钟控制器。有一个高级重置是独立于控制的,所以如果你发现了模式,它们就独立了,现在内置的自检可以检查结果。”

第二个趋势是人工智能.Press说:“随着设计变得越来越复杂,基于瓷砖的设计也越来越多。”“但对于每个块,顶部不一定有逻辑,这些块与其他块相邻,所以你没有能力添加更多DFT逻辑。所以现在你必须自我测试决定什么时候运行它,什么时候中断它。在汽车行业,你可以应用特定的模式,并在模块之间进行测试,一旦连接好,你就可以测试任何模式。基本上,你改变了抽象的层次,你为用户提高了一个层次,但也降低了一个层次,以测试更微妙的缺陷。”

软件/芯片上的监控
要找到这些更微妙的缺陷,就需要了解芯片中的各个组件是如何工作的彼此之间的互动以及他们应该如何表现。实际上,它需要一个被认为是正常行为的基线,以及超出该基线的芯片功能的可接受分布。

英特尔公司产品副总裁Noam Brousard表示:“业内较大的公司都希望自己的芯片能获得公众的关注。proteanTecs.“当然,这是关于他们如何在现场退化,但不仅仅是这样。确保具有片上监控附带的数据粒度,可以确保参数覆盖率。这将提高一个数量级的质量,消除假阳性/假阴性异常值、系统问题、潜在缺陷等等。如果真的发生了什么,现在他们可以追溯到问题的根源和本质。你可以测试所有的东西,但当出现问题时,你希望能够打电话给某人。现在有很多人在相互指责。对于嵌入agent的芯片,它们都说同一种语言,你可以追溯问题的源头,无论是芯片的设计、芯片的生产还是电路板的生产。”

最终目标是自我纠正在该领域发现的问题,但这种能力仍处于早期研究阶段。

第一部分是对设计使用的分析机器学习算法和嵌入代理,不断在芯片的分析、健康和性能上创建新数据,”Brousard说。“然后,来自设计分析和Agent读数的数据被上传到分析平台并进行推断。你可以在芯片的生命周期中添加或删除不同的场景,并自己将这些点连接起来,或者使用更结构化的方法来调查问题,使用机器学习数据分析来学习以前不可见的东西,但我们现在有了数据。数据分析被用于揭示芯片、系统和产品整个生命周期中最晦涩的部分。”

识别模式
如果在芯片设计和制造过程中发现不规范的情况,需要将这些数据循环回设计中,这样才能修复下一代芯片。但这不仅仅是对数据分布的理解。它还需要了解哪些数据对于特定市场或应用程序是最重要的。

“模式需要机器学习和领域专业知识的结合,”公司客户成功总监凯文·罗宾逊(Kevin Robinson)说yieldHUB.“所有这些数据很容易让人迷失方向。在开始机器学习之前,你首先需要考虑为什么要使用它。你想从这些数据中得到什么?这样,一旦你得到了结果,就可以优先考虑行动。这样更直接。”

直截了当,没错,但并不容易。“在更复杂的系统公司,他们需要一个特定产品线的关键数据的愿景,”罗宾逊说。“所以他们需要学习数据之间的不同关系。这与他们过去处理数据的方式不同。其中一个问题是,随着公司规模的扩大,公司很难保持活力。有些大公司可以做到这一点,但这需要强大的部门。你可以在一些大公司中看到这种情况,尽管它们是同一家母公司,但它们几乎有独立的部门,生产相互竞争的产品。”

在不同的地方进行更多的测试
关键之一是进行更多的测试,但这也需要一个标准模型来运行测试。这就是数字双胞胎背后的整个想法,但随着机器学习系统开始针对不同的环境和用例进行优化,它的定义变得不那么明确了。

福特汽车营销主管杰夫•菲利普斯(Jeff Phillips)表示:“现在你在一个系统中分离不同的组件。国家仪器.“让我们以一个自主平台为例。在一种场景中,您将尝试只隔离硬件,并且至少验证传感器和输入是否捕获了正确的数据。您可以将软件与之隔离,并进行物理测量、电子测试和验证。但是,当你插入软件时,我们发现大多数公司都依赖于一组预先配置好的场景进行测试,然后使用模拟将其扩展到整个场景集。”

这在一定程度上是可行的,但它并不一定会涉及所有的极端情况,结果更接近而不是明确的。

“挑战变成了确定性测试和概率测试之间的区别,”Phillips说。“在确定性测试中,你知道答案。你可以验证它是正确的。在概率中,你要验证这可能是正确答案。在汽车中运行自动驾驶平台的算法通常是通过机器学习实现的。它们不是人类编写的,对于软件团队来说,它们不容易被分解或读懂,从而进行代码检查。因此,您可以从实验室中的场景中得到正确的输出,但所有这些变量中一个微小的变化,您在实验室中设置的静态变量,可能会在现实世界中造成麻烦。这是事故发生的地方,我们不能在汽车将生活的环境中进行测试,因为这很危险。”

他并不是唯一一个看到这一点的人。“在汽车行业,最大的问题是可靠性,”约翰·霍夫曼说,CyberOptics.“你要确保没有人逃脱。我们有一个客户生产了2500万块电路板,发现了5个缺陷。这在算法方面是个大问题。”

CyberOptics和其他公司遇到的主要问题之一涉及焊料球。霍夫曼说:“焊锡球种类繁多。“表面的可变性是巨大的,所以你必须处理非均匀性。在晶圆厂,这个过程是固定的,所以变异性要小得多。与OSATs这是一个更难解决的问题。”

然而,重要的是要了解问题在哪里出现,而良好的数据加上机器学习可以帮助解决这一问题。

公司汽车解决方案副总裁Sam Jonaidi表示:“假设我们分析了图像,现在我们已经提取了一大堆参数数据最优+.“例如,让我们说划痕是不确定的。你不知道哪里会出现划痕。这可能发生在面板的任何地方。如果我能找到划痕的位置,划痕的特征,它有多厚?它有多宽?它有多长?它是什么形状?我可以把它输入到我的机器学习算法中。现在我可以在前面的步骤上操作,我可以返回并说,'好吧,什么是导致这种情况的主要因素?’所以,我们再次使用机器学习来完成这个过程,因为参数太大了,不能用其他方法来完成。”

高级节点设计
车辆中最关键的逻辑是在最先进的流程节点上开发的,这也无济于事。

公司执行副总裁兼首席营销官Oreste Donzella表示:“超过50%的0公里故障来自电子产品,包括电路板、模块和半导体。心理契约.“由于对可靠性的担忧,汽车行业一直在缓慢采用先进技术。从历史上看,汽车制造商希望落后智能手机或服务器行业两三个节点。但现在别无选择。如果汽车行业想要在自动驾驶和互联互通方面取得进展,就需要采用越来越先进的节点。我们已经看到在汽车上引入7纳米半导体技术的计划,这可能会增加可靠性故障的风险。”

KLA主张在制造过程中收集所有数据,并在将数据与电气测试相关联时使用机器学习来寻找模式。

Donzella说:“今天大量的数据是在晶圆厂和装配线产生的。“这条信息用于过程控制和生产线监测,而不是用于筛选。当通过机器学习方法与其他电气和参数测试结果相结合时,在线数据可以使晶片厂检查策略更加智能和相关。KLA将这种方法称为I-PAT,即在线零件平均测试。目前,我们在几家半导体晶圆厂处于早期验证阶段,初步结果很有希望。”

这些数据最终有多少会与汽车制造商和芯片制造商共享还有待观察。传统上,晶圆厂对数据的拥有权非常大,这对可靠性有真正的影响。“然而,可靠性问题在汽车行业非常关键,我相信在严格的协议下,参与者将更加合作地共享信息,”他说。“到目前为止,I-PAT受到了整个汽车生态系统的好评,包括原始设备制造商和一级供应商。”

结论
新的方法确保了足够的覆盖范围,越来越多地超越了在制造过程中进行一次测试并将不符合规格的部件打包的旧方法。在各种市场中,可靠性越来越多地是连续测试、更多数据分析和领域专业知识的结合,以优先考虑最重要的数据。

半导体行业别无选择,只能提高其设计和制造产品的可靠性,因为责任现在正在整个供应链中分摊,尤其是在安全关键市场和最先进的节点上。电子产品中没有什么是完美的,但我们的目标是让设计和制造尽可能接近完美,这就是在设计和制造流程的每一步都产生一些创新方法。

-Susan Rambo对本文也有贡献。



1评论

杰瑞·科恩 说:

这就是为什么许多公司增加了低α焊料凸点的使用,以消除其集成电路中α粒子发射引起的软错误。
杰瑞·科恩

留下回复


(注:此名称将公开显示)

Baidu