EDA的角色发展预防和识别失败

找到问题根本原因的变化,受更好的数据和改进工具。

受欢迎程度

设计越来越紧密集成的前端与后端生产,由于成本上升和影响高级芯片和关键应用程序的失败。

具有讽刺意味的是,这种转变的起点失效分析(FA),这通常发生在一个设备不能屈服,或者更糟的是,当它回来的时候由于一些问题。在生产中,导致麻烦的一个昂贵的和破坏性的离线检查晶片或个人死亡。在返回的设备,它导致一个耗时搜索确定的失败是一个孤立的实例,或者第一次出现系统性问题。

“失效分析通常会发生一段时间后,设计已经录音,并能延迟设计工作了几个月,有时几年,“Jayant D’索萨说,主要产品经理西门子EDA。”部分可以在生产制造测试失败,失败部分分析和根源立即采取行动来提高产量。RMA部分最终失败的字段也经过英足总过程来确定故障点和机制。”

可能的原因是多方面的,并且越来越多。可能某个环节出了问题在生产过程中,无论它是一个纳米包装不同沉积或死亡转变。或者它可能是设计从一开始就错了,不考虑所有潜在的相互作用为特定应用程序或用例。

“一般假设在危机的情况是,每个人都是有罪推定,”罗伯•艾特肯指出,杰出的建筑师Synopsys对此。“你说,‘这的本质是什么?重复吗?多久出现吗?它出现在相同的地方吗?它总是出现在完全相同的细胞?它总是出现在角落完全相同的时间?这是基本的搜索是一个设计问题和制造的问题。常常有一个灰色的区域边界的变化过程。”

耐心和毅力是必不可少的,给的尺寸的挑战。“足总设计师做的第一件事是隔离未能系统的特定部分,”阿什拉夫Takla说,公司的首席执行官Mixel。”是集成电路设置在适当的操作模式,让所有正确的输入吗?如果是这样,我可以锻炼什么阿拉伯学者模式隔离问题到一个特定的块吗?你只要沿着层次结构来隔离问题。它可能不是一个特定的块,但也许是之间的缓冲。一旦你得到这一点,您可以使用模拟试图复制问题。这个问题只发生在一个特定的角落PVT ?收益率的影响是什么,因为这个特定的失败?如何重复的失败吗?所有这些问题帮助诊断和零相关问题的根源。 Using the5个为什么分析技术可以是有益的。你不能相信失败的解决方案不能够模拟故障和修复。”

设计已经在失效分析中扮演着重要的角色。大部分足协甚至无法完成测试设计(DFT)技术,包括从什么测试,测试的时候,什么是最好的和最有效的方式来达到足够的覆盖率。但强调避免潜在问题开始初步设计一直在增加,所以有专注于捕捉潜在的问题从最初的布局在制造业——一个问题变得越来越困难,有更多的为每一个铸造过程,在不同的铸造厂和扩大差异相似的过程。

“设计是非常重要的在使失效分析和产量提高,“马特·诺尔斯说,产品管理总监Synopsys对此“EDAG硬件分析和测试产品。“DFT必须放入芯片的设计为了扫描测试和诊断。你把它放在门口的设计可以在RTL或水平。我们看到的是人们想把它尽可能上游,以便他们可以在RTL级优化,避免一些迭代周期。”

图1:产量优化流经故障分析。来源:Synopsys对此

图1:产量优化流经故障分析。来源:Synopsys对此

失败可以减少的数量,和设计冗余和弹性为芯片/包/系统可以减少返回芯片的数量和增加产量。

“问题的根源往往是用于提高可靠性,“西门子D’索萨说。“体积扫描诊断和基于机器学习的根源反褶积(RCD)高效FA从设计的观点。原因是这种技术使用设计担保为FA本地化的缺陷。使用这种方法可以降低一个数量级的时间来执行FA(按周在某些情况下)。有几个scan-based诊断包括链诊断进展显著提高诊断结果的分辨率特别是没有扫描链。此外,体积扫描诊断与恢复可以用来建立一个能够准确地估计的根源帕累托的根源FA人口众多。给用户最好的好处是当体积扫描诊断和恢复结果生成的所有失败的部分在整个生命周期的生产。这给用户趋势缺陷帕累托图的能力随着时间的推移,使早期的航向修正的晶片远足。”

失败仍会发生,然而,在一个正在进行的复杂设备的故障分析,根本原因可能在许多方向展开调查。

“在这种情况下,有工具可以帮助,艾特肯说。”可以有效地测量硅模具处理上SPICE模型,个人会死去,饲料,回静态时间,并计算出这个特殊的芯片,“这里可能失败路径,而不是,“这是你的总签字。”实际上,在进程空间这是芯片和这有什么意义吗?”

工具也越来越好。DFT一直在发展一段时间,它正变得越来越可定制的和静态的。有论文回去至少十年看着诊断的概念设计,现在大部分已经纳入DFT的过程。改变的是有更多的数据从工厂流入EDA防止这些问题,使芯片制造商开发计划何时何地去测试,和频率。在某些情况下,这包括芯片和于显示器、数据回吃草的芯片制造商,可用于预防未来的问题。

“在过去,没有很多的交流,特别是在专业铸造模型,如何提高设计上游下游,这样你得到更好的诊断,”诺尔斯说。“如果你真的可怜的诊断数据非常吵闹,这是为什么呢?没有人知道,你可以没有行动。所以,有一个概念叫做“测试点”设计为测试,更可测试的。人们思考如何做是为了使它更可诊断。”

类型的失败
确定的来源问题是设计本身一样复杂。

“大多数时候,除非这个过程并不成熟,你从设计开始,然后试着找出如果失败过程相关,“Mixel的Takla说。“仿真结果之间的相关性和测量结果高度依赖SPICE模型的准确性。作为一个例子,有时候你遇到建模不准确的泄漏电流在角落的高温情况下。”

好消息是有很多程序可以模拟和捕获问题之前,让它从设计到生产。坏消息是仍有逃跑了。但并不是所有的失败都是平等的。

“其实两种失败”,指出马克Swinnen半导体产品营销主管部门有限元分析软件。“硬故障的芯片不工作——电线短,它燃烧起来,或以其他方式。什么是更常见的是软故障。软故障更设计师的责任。软故障意味着芯片的工作原理,但它不会在你想要的速度,或带通滤波器不认识你要的频率,或延迟太长。这并不是说它不工作。它只是不工作或在你设计的参数”。

例如,芯片可能回来马克斯较小的频率比的要求规范由于未预料到的电压降。”有一定的切换事件的组合,如果你有足够的邻居交换在一定细胞受害者,受害者细胞将其本地电压显著下降,慢得多,”同化。“你期望路径执行速度最高,但事实上它不能因为每次它试图,有相邻的细胞开关在同一时间。拖累了其电压和慢下来。”

一个芯片仍将使用软故障。它只是不工作你想要的速度。随着数以亿计的可能的交互,设计师们正转向multi-physics模拟来预测问题。

这些相互作用可以提高亨特从单个芯片系统级,尤其是尖端设计分解函数在一个SoC芯片或chiplets高级包。

”的一个关键平台系统设计与分析、和模拟系统,“说学历Devgan,总裁兼首席执行官节奏在最近的一次演讲。“这整个分析电力和热能将成为超临界。无论是3 d-ics,数据中心或电动汽车仿真加上半导体和系统需要分析的合并在一起。”

这就是为什么所有主要的EDA玩家大力投资强化学习。今天的最大挑战之一是更多的功能加上更多的定制,以及所有需要架构,floor-planned路由和验证与设计团队,没有得到任何更大。唯一的方法来完成,如果没有创建大量的新的机器学习失败。

“强化学习接下来的模型重用,“Devgan在接受采访时表示。“所有的数据是在一个公司。这允许你和我自己的数据。这是一个不同的方式看问题。数据科学是由外而内。物理是由内向外看。”

新方法是利用已知去工作,以确保它工作在一个系统中使用它,并提供足够的覆盖任何新的和不同的。这将有助于减少失败,可以昂贵的——尤其是在汽车等市场。

即使失败了在制造业付出了高昂的代价。失去在铸造生产队列会导致错过了最后期限,可以破坏客户关系,进一步导致供应链问题。

铸造厂防止硬故障和广泛的设计规则,描述了参数对于一个成功的设计。这些规则包括细节基本导线之间应该有多少空间。但规则甲板铸造厂增长在每个新流程节点,和不同的高级包装选项。担心有更多的问题,更多的选项来创建新的。同时,利润更少使用比过去,因为那保证金可以降低性能和增加力量。

所以当铸造厂还利用设计规则检查(DRC),可能坚持布局和示意图(lv),以确保每一个网表在最初的示意图表示在最后的设计,也有推流中的可靠性问题进一步——以及大部分的责任,以防芯片或系统不工作。

在过去,同化指出,“一旦铸造很满意,他们会接受设计,如果事情错了这是他们的错,因为他们已经同意可制造的。“这是不再如此。“在某种程度上,铸造的态度是,“这是你的问题。“如果你把一个额外的线,他们会高兴地打印出来。这是你的责任没有这样做。但铸造厂有兴趣确保客户成功,所以他们还包括lv签字。”

而失败是不好的,太不失败也可以是坏的。军事需要测试每一个芯片,但是许多商业生产运行统计平均水平感到满意。“如果你想要安全,你保持很好地在边缘的统计范围,这样不管统计涨落,你会得到一个安全可靠的工作。但它留下了大量性能在桌上,”同化解释道。“你放弃的边缘,你真的找不到更高的速度,和你的竞争对手可能会获得更高的速度和更高的性能可以得到如果你只是按一点。”

这是一个很好的平衡,这通常是解决装箱,测试的行业惯例和分离芯片根据他们的表现。但过于保守的风险太多的低端,低估混合芯片。

一个协作的作用
模拟一直是至关重要的组件在预防,或者至少分析失败。改变的是那些模拟正在变得更大、更复杂、更多功能。看在一个设计的能力,然后向下深入它,现在是一个要求。

“有一些很常见的过程签名,像是under-etched或over-etched,”诺尔斯说。“你可以看到,签名在3 d视图的设备。现在设计的方法之一是参与一路到根本原因分析是通过3 d CAD可视化的特定设备的特定位置。他们有缺陷图像与模拟,他们绝对可以说,“这是一个优势,没去,”并提供反馈的铸造。”

最终,希望通过自动化工具和方法是使更快,顺畅的沟通和节省时间。

“有一块硅经历FA和寻找一些需要很长时间。你想要避免这样做尽可能多的,”艾特肯说。“举个例子,如果你去通过整个流入扫描电子显微镜和说,“我发现一个问题在这个门”当您运行标准ATPG-type故障诊断方法,并提出了10个芯片有问题,具体门其他地方的设计,你可以看到它可能是一样的,复选框,并转移到一个不同的问题。能力这些复杂、昂贵的物理失效分析,并使用结果过程在其他地方的更短的周转时间,节省你的时间和精力是一个关键的一部分,使整个坡道周期有效。”

- - - - - -埃德·斯珀林对此报道亦有贡献。



留下一个回复


(注意:这个名字会显示公开)

Baidu