确保AI /毫升在测试系统工作

AI将承诺改善可靠性,但它并不完美。

受欢迎程度

人工智能和机器学习是利用越来越发现模式和异常数据在芯片制造和测试,提高总收率和终端设备的可靠性。但有太多的变量和未知数可靠地预测芯片如何表现仅使用人工智能领域。

今天,每一个人工智能用例——无论是无人驾驶汽车或工业分类机,解决了一个特定的问题,这使得它独一无二的。同样,基于ai系统半导体制造和测试是为了解决特定的问题在工厂或包装。问题是保持毫升算法是人工智能系统的核心——随着时间的推移,随着情况的变化。ML算法和模型需要适应其他的改变设备和设备制造和包装。

“我们很可能需要建立一个持续的培训和监控的过程,”基斯说肖布,副总统的技术和策略美国效果显著。“过程漂移,这意味着数据漂移,这意味着你需要持续监测数据和触发培训过程的雪堆。我们知道如何做到这一点。面临的挑战是知道火车多长时间重新培训。漂移触发之前培训多少钱?”

整个过程变得更加复杂,当AI /毫升系统用于创建AI /毫升芯片,并将成为更复杂的机器是用来训练其他机器。测量报告在人工智能在概率分布,而不是固定的数字,和内在变化的流程步骤,包括包装,可以增量和添加剂。

测试ML算法和模型中使用的晶圆厂
检查ML算法和人工智能系统的基本技术确实存在,和有许多方法来验证有效性的ML算法制造和测试流程。But甚至与技术,建立一个成功的人工智能的实现必须考虑随着时间的推移,发生了什么变化等工厂或组装的房子。

“当你在工厂测试你的模型,你想做一个真实的生产模拟认识的时间,”杰夫大卫说,人工智能解决方案的副总裁PDF的解决方案。“有很多方法,我们在工厂测试。例如,你有盲目的坚持数据集。基本上这意味着你有一个完全独立的验证数据集的数据用于火车或选择模型。数据集不是暴露在训练阶段。有许多不同的方法可以验证。最著名的一个方法叫做k-fold交叉验证,k代表任意数量的整数。”

所以可能有8倍或10倍交叉验证。10倍交叉验证意味着数据集分解成十块。

”假设你分手完全随机或分层的数据集以某种方式你想选择跨许多边界,”大卫说。“你不想从相同的训练和测试数据很多。这将是作弊,因为在现实世界中,你永远不会有一个情况,你可以这样做。所以我们的想法是你数据集分解成块的10%。块是10%的数据,可以随机选择,当然,跨许多边界分层。然后有10%的整个数据集。十倍交叉验证意味着你将旋转10块,所有的培训90%的数据,然后测试步骤。完成剩下的10%。然后你旋转到下一块,第二块,和下一个块。你这样做10次。你训练和测试10次。 Then you’re getting a good feel for that data set or how robust your model is across all that different data.”

最大的问题是工厂的条件都在运动,身体上的和暂时的。传感器漂移在工具和设备不断的再鉴定。此外,许多更新算法本身,而不是所有的设备在工厂或组装的房子是一样的。模拟需要覆盖在这些模型将所有这些变化,这并不是微不足道的建立这样的模型精度。

“会有漂移和转移出来的数据的工具,”大卫说。随着时间的推移,该工具设置可能会改变。操作员可以更改测试人员影响从传感器收集的数据。处理时间组件的一种方法添加到测试时间分解成块的算法是使用现有的数据——例如一年的数据,模拟训练时间,然后把它比作地面真理。“你基本上都经过了时间你经常训练和测试您的模型,如果你在一个真实的生产模拟。然后你看看它成立,因为在这种情况下,你有地面真理,”大卫说。

在过去,这些问题可以通过添加处理保证金进入生产流程。但特别是在高级节点,在异构包一些芯片开发的尖端节点,公差要求越来越严格和精确。会增加太多的利润,和可靠性。添加过少,产量可以受到影响。虽然AI /毫升可以帮助确定这些问题,由这些系统必须处理的数据上下文中的很多部分移动。现在,而不是花时间点测量,这些测量需要将模拟在不同的时间。

在某种程度上,所有这些就都可以分解成可管理的部分。“行业使用训练数据和验证数据集”效果显著的他说。“验证数据集被用来检查毫升是正常工作的。”

图1:一个基本fab-based AI系统。“机器学习算法,学习从部署的数据创建一个模型,可以预测,该模型后训练。系统建立在它的AI系统,”大卫说PDF的解决方案“杰夫。来源:Semie新利体育下载注册ngineering.com。

图1:一个基本fab-based AI系统。机器学习是一种学习算法从数据创建一个模型。一旦训练和部署,该模型可以预测。人工智能系统是围绕着它。来源:PDF /半导体工程解决方案

在另一个层面上,在这一过程中现在有很多未知数,所以它不会伤害的备份策略评估所有这些变化。增加灵敏度,制造和测试设备在这方面可以帮助极大。事实上,越不敏感的工具,为毫升模型成功的机会越少,渔洞,高级营销主任说上的创新

“首先,在计量中,有一件事是,你需要有敏感性,”郝说。“你的工具必须有敏感的尺寸变化正在发生。没有任何敏感,机器学习或任何其他技术将帮助你。其次,由于低灵敏度和我们测量设备的复杂性,使用经典的基于物理建模技术不再是足够的。这就是机器学习。另一方面,机器学习本身可能不是唯一的解决方案。物理还重要。”

人工智能芯片与人工智能设备
AI / ML,事情变得混乱很快因为AI /毫升技术越来越多的被用于制造人工智能/毫升的芯片。

“测试芯片工厂,检验和计量过程用于缺陷检测,”Tim Skunes说,研发副总裁CyberOptics。“人工智能芯片可以以相似的方式检查其他芯片制造过程中”。

但这些芯片也可以从其他芯片外观和行为完全不同。“在某些方面,人工智能芯片还只是一个很复杂的SoC,”兰迪·鱼,说营销主管硅生命周期管理Synopsys对此。“然而,架构或微架构从根本上有别于我们用于soc,历史上。”

首先,人工智能是由训练和推理分支。”这两个环境的约束是非常不同的。但就如何测试,它来自工厂和你从工厂得到一些信息,一些测试信息,一些晶片测试的东西。然后你进入wafer-level测试,所以你在OSAT阿拉伯学者,他们在做逻辑或内存阿拉伯学者,或者你的DFT,”鱼说。“我们工作的人工智能芯片。对我们来说,在很多情况下这是另一个测试的挑战。它非常分层。一个有趣的一面是,很多芯片排列结构。所以有很多方法,你可以攻击的测试问题。”

在一个人工智能芯片,用于创建网络的排列结构。而是生成汇编代码或映射到一个二进制,这发生在一个标准的处理器,一个人工智能芯片映射到网络。

“你经过培训阶段,它创建了一个网络哪里有重量,”他解释道。“那么这些映射到芯片,没有个性,直到你提供这个网络。这是第一种编程。然后你在网络流数据,它所做的推论。这是推测。我们不测试在这一水平,但如果我们处理类似应用程序处理器的手机,我们没有测试这些功能。结构测试和系统级测试是整个区域本身。”

人工智能芯片可以花更多的时间在测试人员和维修是一个图片的一部分。“我们参与一些很大,reticle-limited设计,特别是在培训方面更重要的是,“鱼说。“测试时间是敏感的,因为他们会对测试人员一段时间。还有维修。在这些大的数组结构,你不仅做记忆修复。你可以修复处理器,如你可以留下一个处理元素在测试。处理单元可以单独测试,如果一个人是不好的,它只是被映射出来。所以有更多的宏观层面的测试和维修。”

进行这样的变更可能会需要回顾和检查软件的编译器。“这种冗余,或离开一个处理器和重新映射,编译器当然需要了解,“约翰内斯·斯塔尔说,产品营销高级总监Synopsys对此仿真和原型。“因此,需要通过硅再次测试这个编译器能力。”

投入的角度看,芯片正在改变,测试设备的算法和芯片上的变化,并利用人工智能的制造和包装设备传感器漂移。除了看所有这些在全球范围内,不同部分必须单独处理。

“一个AI-enabled芯片是建立在一个CPU或GPU,”他说。“因此,在晶体管级测试仍然基本未变。挑战变得一旦嵌入式智能算法,在该算法可能是一个“黑盒”。我们需要想出一个可靠的方法,以确保黑盒是正确执行。”

需要评估这些测试的准确性,和机器学习应用。“不是所有的机器学习系统是相等的,”说CyberOptics Skunes。“你想让你的机器学习算法是有效的。你想要得到良好的性能真的很快。例如,AI2等机器学习算法,在你教通过展示良好的/没有缺陷图像,或图像的缺陷,可以改善过程和产量。运营商可以快速教,然后监控,学习结果,改进和调整通过更新训练集如果需要。我们设计我们的机器学习算法有偏见的目标没有逃,所以没有产品出厂坏。”

披头士乐队的最后一步是确保人工智能芯片或系统功能如预期的那样,这是系统级测试的工作。“从工厂到晶片包装(英尺),测试仍将在晶体管级,所以没有多少变化。它将在系统级测试,软件加载与人工智能算法,这事情变得有趣,”他说。“只要AI /毫升是静态的,也就是,这个不应该太多的问题在短期内。事情会变得有趣的一旦我们开始部署自学习系统。与自学习系统,我们可能会看到特定AI校准和诊断并行部署,持续监测和检查AI本身。”

PDF的大卫同意。“你应该不断地验证你的系统——不断。你可以相信,在一些历史数据。但展望未来,我真的有足够的信心我将释放我生产这个东西和信任,系统会工作吗?“答案是通常从未完全100%信任。

人工智能测试之前工厂——仿真
尽管这需要理解工厂,它还需要反馈到设计过程中,它可以模拟和测试计划纳入设计。在这方面需要做很多工作。人工智能软件还没有准备模拟早期人工智能系统的设计阶段。

“在过去的5到10年,我们的规范架构CPU和gpu,记忆和外围设备,“说Synopsys对此斯塔尔。“整个设计社区知道如何做到这一点,他们有软件运行在这些芯片已经可用,如Android和iOS,或者任何需要运行在这些硅芯片上。实际上问题主要是打开软件硬件和尝试做这pre-silicon领域确保以后没有惊喜——或者稍后在启动、刚刚生产,没有惊喜。在过去十年的行业理解。我们在过去5年迅速模拟技术允许这种硅前软件启动过程。这是所有做正常的CPU或处理器的芯片。”

人工智能是不同的,和人工智能的编译器软件可以是一个问题。“人工智能这个问题增加了整体水平,这是为什么,”斯塔尔说。“在AI,软件不存在作为一个标准的软件。都是特定于应用程序的。和软件不仅不存在每一个人工智能架构,这些公司必须开发一个新的软件栈——一个编译器,将任何人工智能应用程序可以编译他们运行在目标体系结构。因为所有这些编译器都是新的,他们可以车和效率低下。所有这些AI公司创建一个硅的软件模型,然后基于堆栈的软件开发编译器的软件模型,但是最终这是不够的。所以当我们从事与第一个AI公司几年前,我们的目标是什么?他们需要运行所有这些不同版本的编译器在实际的硬件和软件算出它是如何工作的。然后,几代人的客户,我们有一个客户,实际上与仿真。 Over the course of one year they optimized their software stack so that the performance of the chip was 30 times higher than when they started. You can see the potential of what they need to do for success in the market, but they need to all come up with the best performance for these chips so they can function in real life. That’s what we have done over the last several years.”

结论
它仍然是早期人工智能/毫升在半导体制造和测试。所以当AI /毫升为察觉潜在的角落带来了病例和发现潜在的缺陷,它不能被信任的100%。

PDF的David建议保持严格控制AI /毫升,而不是层算法用于监视其他算法。“如果你创建机器学习算法进行预测来解决其他机器学习算法,计算非常昂贵,”大卫说。

和总有安全模式。如果客户信心AI系统的预测低,工厂或OSAT总是可以回到他们做事情的方式没有人工智能系统,在提高ML算法和模型。

“物理模型和机器学习模型都预测模型,“说到的内科医师。“我们发现,通过结合物理和机器学习在一起,我们可以获得最佳性能。机器学习是物理学的补充。它可以帮助物理学,但它不会取代物理。”

有关的故事

太多的工厂和测试数据,利用率较低

毫升是怎么被用于集成电路制造吗

在晶圆厂使用机器学习

发现缺陷与机器学习芯片



留下一个回复


(注意:这个名字会显示公开)

Baidu