中文 英语

改进并行芯片设计、制造和测试流程

实现数字双胞胎的好处比在不同工具之间转换数据要复杂得多。

受欢迎程度

随着芯片行业寻求用更少的工程师优化设计,半导体设计、制造和测试正变得更加紧密地结合在一起,这为提高效率和降低芯片成本奠定了基础,而不仅仅依赖于规模经济。

这些不同流程之间的粘合剂是数据,而芯片行业正在努力通过在更多的地方利用这些数据,将这些流程中的各个步骤编织在一起。目标包括在异构设计中进行权衡时更好的可见性,更快的上市时间,以及提高现场的可靠性。这将通过芯片和系统内监控功能,以及在设计到制造流程中双向共享和利用数据来实现。

“全球有近2.3万个电气工程师职位空缺,”ibm解决方案研究员杜安•洛温斯坦(Duane Lowenstein)表示Keysight.“我们没有培养足够的电气工程师。我们会在未来5年或10年内填补这个空白吗?可能不会。部分原因是所谓的“灰色海啸”,即35%的人口是65岁或65岁以上,并且以每天1万人的速度增长。我们不会每天生产1万名新人来填补这些工作岗位。即使在大流行之前,在美国,平均每人只在一家公司工作4.1年。这对我们公司来说意味着什么?我们得到了一个伟大的工程师,我们很兴奋,我们需要一年到两年的时间来培训他们,让他们了解我们的流程。然后他们为我们工作一两年,然后他们就走了。这是个大问题。”

这也是增加使用的主要驱动力之一数字的双胞胎并以相关方法表示。洛温斯坦说:“数字双胞胎减少了系统的工作量,今天我们需要用更少的工程师来完成工作。”“我们没有足够的人手,但即使我们有足够的人手,我们也必须改变流程,以缩短上市时间,并能够在任何地方实现可重复性。”

除了劳动力短缺,芯片和材料的可用性以及供应链的稳健性也令人担忧。

“我不能只去一家供应商那里,如果那家供应商遭遇地震、海啸、火灾或流行病,我就会突然关门。’这正是芯片制造商正在发生的事情。”“除此之外,还有产能限制,但更大的生产定制。这意味着我必须能够更快地设计。我必须更准确地设计,因为这会影响产量和可预测性。如果我不能立即构建一些东西,并缓慢地扩展,那么扩展的时间就是一个问题,因为这是一个能力限制。如果我能在一周内完成,而不是6个月,因为我的数字双胞胎正是我想象中的样子,那就有帮助了。”

打破藩篱
在过去,设计和测试是分开的领域。“你从功能的角度来设计你的产品,你甚至没有真正关心产品的物理实现是什么样的,”Rob Knoth说,他是Digital & Signoff集团的产品管理部门主管节奏.“即使这是分开的。随着设计技术的发展,产品的功能设计和产品的物理设计开始融合。这样做有很大的动机,因为它缩短了上市时间,并有助于降低利润率。在过去的5到10年里,考试已经开始成为同样对话的一部分。”

由于某些关键原因,测试不能再被设计师忽视,这一点已被广泛接受。

克诺斯说:“在安全关键、高可靠性的产品中,你要确保零缺陷、预期寿命长,并且以正确的方式处理安全问题。”由于这些原因,测试越来越多地开始渗透到设计计划中。这与高级节点相结合,并确保您正在测试这些高级节点上的所有新缺陷,并在它们在现场时密切关注它们。突然之间,所有的三方都有了非常平等的声音。并不是说设计师必须为测试做准备,而是产品设计将测试作为三个重要品质之一。你得到了产品的最终功能。你有了产品的实体实现。还有测试方面。这些都是并行的活动,而不是随之而来的事情。”

这意味着设计团队需要牢记测试的物理现实——它将消耗一些区域并需要路由。使用先进的数字设计,了解测试的功率、性能、面积和拥塞影响也是必不可少的。与此同时,在不同部分的相交方式上仍然存在空白,因此需要在填补空白时调整流量。

“有些技术在一些公司被广泛采用,但在RTL插入测试等方面仍然落后。我们看到这方面的进展,但肯定还有一些地方没有。”

因此,仅仅添加DFT,在测试器中运行测试结构,并获得通过/失败已经不够了。Tessent Embedded Analytics公司的产品经理理查德•奥克斯兰表示:“我们要复杂得多西门子数字工业软件.“我们已经到了3nm的水平,所以事情变得更加困难。我们该怎么处理呢?我们得想尽办法解决这个问题。但是我们也不能大量增加在测试器中进行测试的成本,以及我们得到的任何后续成本。这意味着我们也需要变得更聪明。”

特别是对于安全关键系统的功能验证,在RTL中而不是在门级中提供测试内容是至关重要的。Knoth指出:“RTL驱动了许多功能验证模拟工作,这些工作在物理设计之前完成,并且是并行的,以确保您已经得到了一个工作产品。”“因此,测试对设计的功能越重要,测试IP就必须出现在用于功能验证的文件中。这些内容已经从gate级别迁移到RTL,以便功能验证能够看到。”

不同地使用数据
这就是数字双胞胎变得尤为重要的地方。数字双胞胎是物理事物的数字表示,它是通过某种传感和监控实现的。“如果你没有传感和监控能力,你就不可能有一个数字双胞胎,”奥克斯兰说。“你需要有一些定期报告重要指标的东西。这有助于提升业务价值。”

Oxland指出,两种不同类型的数字孪生应用程序可用于驱动业务价值。“一种是闭环应用程序,在这种应用程序中,您可以通过设计流程收集数据,并在设计阶段、模拟阶段和制造阶段将数据输入数据库。然后,在硅中,你也可以输入数据,当你沿着流向下移动时,你可以把这些数据之间的对应程度联系起来。”

这种闭环数字孪生体的明显应用是提高性能,但它也可能对产量和可靠性产生重大影响。“这意味着你可以开始说,‘我做出了这些设计决定,我在仿真中测试了它们,但在硅芯片中,结果并不像我预期的那样。“但你拥有所有的数据,能够关闭环路,并发现设计决策是错误的,因为,例如,你应该加入5nm的偏移量。这种方法就像是Shift Left的扩展。”

还有一些工作流风格的应用程序包含真实硅的数字孪生体,可以为其设置警报。因此,如果互连延迟大于500毫秒,例如,它可以触发警报,表明软件堆栈中的某个地方存在需要修复的问题。

在芯片上监控的内容可以进行物理或结构分类,例如PVT,然后使用片上代理从proteanTecs.该公司利用其所谓的基于芯片遥测的“深度数据分析”,使用在测试和任务模式下运行的多维代理。因此,这些代理可以实时监控性能,并就由于老化和制造过程中未发现的潜在缺陷而导致的性能下降发送警报。此外,该技术还可用于操作、环境和应用程序监控,测量硬件上的工作量和软件压力,并用于监控高级包中的互连。

“在这个级别上,您可能需要检测总线延迟,”Oxland说。“如果你在不同的层面上监控这些东西,你可以将它们用于不同的目的。ProteanTecs有一个关于老化参数传感器的很棒的故事,它发挥了可靠性的作用,然后允许您在预测性维护中创造商业价值。因此,你可以说,‘我现在就派一名工程师出去,因为看起来这个芯片两周后就会失效。’这可能会让你避免违反sla或引发另一种紧急情况。”

嵌入式分析对于检查特定版本的软件和设计之间的交互尤为重要。“我们有能力在更细粒度的层面上看到正在发生的事情,以及硬件和软件之间的交互是什么,”他指出。“也许你对软件进行的所有测试看起来都不错。你把它放到野外,一些终端用户做了一些非常古怪的事情,导致了一个问题,但它每1000亿个周期才会发生一次。你要怎么发现呢?如果你有一种自动发送警报的方式,当你在芯片上检测到很长时间的延迟时,你可以修复它。你可以把它发给软件人员,然后说,‘嘿,去看看吧。“在我们的IP中,有循环缓冲区和交叉触发机制,允许你说,‘这很奇怪。下次我看到这个的时候,我想要捕捉最后100个循环,包括这一部分和这一部分。’这样你就有了法医数据。”

进入测试领域,有一些异常用例会导致问题。

“Meta最近发表了一篇文章无声数据损坏奥克斯兰说。“没有人知道它们为什么在那里,也不知道如何找到它们。但是,如果您在DUT上有测试结构,您可以根据奇怪的事件触发这些结构。也许你在一天中的某个时候,芯片没有那么多地使用,你可以把它取下来,运行测试,收集数据,在芯片上分析,或者把它发送到云端并在那里分析。你在芯片上能做的越多越好。如果你有监控器,你可以发现问题,如果有结构性问题,你可以通过测试来找出问题的根源,所有这些都可以自动化。”

少了什么
测试的各个方面的物理意识越强,它就越能与设计过程相吻合。

Cadence的Knoth表示:“这方面总是有改进的空间。“将测试内容移动到RTL空间有时会使这项工作更加困难。当你在实现过程中插入一些东西时,这是非常自然和容易理解的,‘这是测试,我可以用不同于功能电路的方式操作它。“但当你在RTL级别插入东西时,可能会有点棘手。因此,在实施流程、验证、流程等方面总是有改进的空间。”

此外,芯片还需要配备正确的传感器,以指示何时需要进行更多测试,或者是否需要重新测试。例如,可能是芯片某个部分的温度过高,或者交易花费的时间过长。

“我们仍在摸索这些触发因素究竟会是什么,”奥克斯兰说。“我们需要一些方法来理解所有这些复杂性,以及最终如何更好地指导测试。我们有时会说,‘为更多测试而设计,为更多测试而设计。’你必须两者兼顾,以某种方式——更智能、更全面、更便宜的测试——但也要用其他类型的数据来增强测试,比如PVT、参数和函数。”

在一些被认为可靠性至关重要的市场,这种做法已经持续多年。公司首席执行官西蒙•大卫曼表示:“我们想确切地知道我们在提供什么治之.“如果有什么缺失,我们需要知道。如果有一些不是我们期望的质量,我们需要知道。这种方法使我们能够选择何时准备好交付产品。”

Imperas设计了一种测试驱动的设计策略,在该策略中,测试与正在实现的工作同时实现。大卫曼解释说:“当我们提出一个项目并撰写一份规范时,我们会花大量时间来计划测试,这样我们就可以知道何时完成,这就像硬件设计一样。”“我们在改进(处理器)模型时编写了一个测试计划。编写测试计划的人往往与实现模型的人是不同的人,因此有两个人在阅读规范。一个是在模型中的模拟器中实现,另一个是在一系列测试中实现。有时在较小的项目中,可能只有一个人,但通常是两个人。在一些项目中,我们使用三个,由一些负责覆盖的人来确定我们需要覆盖的内容。团队的所有成员都从规范中获取它。一个人实现它。编写测试。一个人决定如何衡量它,因为它不仅仅是代码覆盖率,它是功能覆盖率。 We use this test-driven methodology so that as we’re evolving the product. We know where we are with it in terms of its quality, and we work at a very detailed level and do white box point tests for every capability and feature.”

要将这些概念变为现实,需要建模,然后将其与现实世界中发生的情况进行对比。公司产品营销总监罗伯特•鲁伊斯表示:“你想要现实生活中的数据,并将其反映到数字双胞胎身上。Synopsys对此

鲁伊斯指出,生成时间工具通常通过生成一些刺激来处理设计元素的抽象。“‘让我检查一下输出是什么,并将其应用到测试器的硅上。他说,在过去几年里,这种做法还可以,但改进模型需要更深入地研究。就实际使用而言,我们在生产中看到的新技术是,“让我们看看spice级别的网表、晶体管,让我们注入缺陷,这更接近数字双胞胎的概念。”让我们打开电线,让我们在某些情况下引入短裤。那么,让我们不要运行ATPG。让我们运行一些更接近真实世界的东西,更像SPICE模拟,看看它如何响应。’然后我们再把它反射回去。”

在其他情况下,高速测试是获得高质量测试的主要方法之一,大多数先进的设计都是这样做的。如果设计应该以3 GHz运行,理想情况下,您希望设计内部以3 GHz运行。传统的ATPG方法是假设它将以3 GHz的频率运行,然后创建某种类型的测试。然而,由于缺乏建模或与数字孪生体的连接,ATPG工具并不真正知道如何做到这一点。

“近年来,我们从静态计时工具中获取信息,并将其注入,现在ATPG工具会说,‘根据这些信息,我知道路径a是一条较长的路径。所以我要让测试沿着这条路径进行而不是一条更短的路径。通过这样做,我更有可能捕获一种类型的缺陷,因为较长的路径是3 GHz,较短的路径是2 GHz。时序模型可以通过观察硅来改进,路径裕度监控器可以从实际硅测量路径的时序。这些数据可以返回到计时模型,然后这些信息反馈给这个模型,循环就完成了。”

虽然目前有许多方法可用,但它们可能无法与其他可以组合起来创建数字双类型仿真模型的部分连接起来。

大卫曼指出:“随着时间的推移,很多情况都会发生变化。“我们为我们的产品开发了一套方法论。我们不称它为数字双胞胎,但我们使用模拟,我们在我们所做的之外建立其他模型。例如,如果我们正在做一些非常复杂的事情,比如密码学或dsp,我们会找到一些加密算法,比如用C语言,把它作为参考,然后用我们正在处理的语言实现它。然后,我们得到了一个黄金参考,这实际上是一个模拟数字双胞胎类型的上下文,但非常微观的层面。这与数字双胞胎的概念完全相同,因为当我们在RISC-V世界中与客户打交道时,他们在做什么?他们把我们当做他们的数字双胞胎。他们有RTL,他们想知道RTL是否做正确的事情。这是一个完整的验证策略。我们的RISC-V验证产品就像他们产品后面的一个插头。 When they’ve got a whole simulation in their RTL, they can plug our technology behind it, which has its fingers around it and watches what’s going on. It’s a twin of the complete functionality of a core, configured to be exactly what they’ve got. It sits there monitoring every event, and if it finds things it doesn’t like, it reports it.”

Synopsys的鲁伊斯预计,随着监控器的发展,它们将获取数据并改进模型,不仅适用于ATPG,还适用于设计本身。“当然,更好的时机模型不仅仅有利于ATPG,”他说。“他们提高了推出满足性能要求的设计的能力,以及EDA流程的其他改进。”

结论
当这些不同的方法与系统部署结合在一起时,可以看到最大的好处,在系统部署中收集、分析数据并将其投入工作。这个谜题有许多移动的碎片,进化是复杂的。

Keysight的洛温斯坦说:“数字双胞胎更多的是一种哲学上的解决方案。“我怎么把它们组合在一起?”我要如何改变我的哲学,接受它,因为它将会发生?”

他预测,在10年内,这将成为芯片和系统开发和测试的主要方式。他说:“如果一家公司能想出一种非常简单的方法,并拥有所有的联系,它就会成功。它将非常类似于SAP或Oracle的实现。当这些系统的想法最初出现时,每个人都说它太复杂了,没有人会接受它。现在,每个人都有MRP系统。类似数字双胞胎的系统也会如此。”



留下回复


(注:此名称将公开显示)

Baidu