中文 英语

设计可靠性

芯片应该多长时间函数提出了设计团队需要考虑的问题,包括他们信任多少老化模型。

受欢迎程度

电路老化正成为一个强制性的设计关注周围终端市场,尤其是在市场advanced-node芯片预计将持续几年以上。一些芯片制造商认为这是一个竞争的机会,但其他人不确定我们完全理解这些设备将如何年龄。

老化是最新的一长串问题被进一步的设计流程。在过去,工厂把这些问题从设计团队。但是随着利润率收缩在每一个新节点,责任已经转移到设计侧流中的早解决问题,就是明证后端实现软件的广泛应用和签字的工具。和电力和热力问题已经成为制约,进一步被排挤的开发流程,在架构级别开始。

可靠性是最新关注表面,但它可能不是那么突出,它是不重要的。置之不理,设备可能无法生存它们,一个问题令情况更加糟糕的是,许多这些设备预计今天比过去更持久。声誉受到威胁整个供应链。最重要的是,攷虑替代品是昂贵的。增殖,传统的方法来提高可靠性,使得这些产品没有竞争力的高级节点。

“老龄化一直认为设计师在高可靠性的设计领域,”斯蒂芬•Crosher说主任SLM战略项目Synopsys对此。“也许他们设计为特定的应用程序,如汽车、或极端的压力环境。但这并不是一个主流考虑设计师。现在是过渡到正常的实践,和标准的设计师需要意识到它。”

有几个因素发生变化。”在更高级的节点和以增加的速度要求,它已成为更重要的设计考虑,”阿什拉夫Takla说,总裁兼首席执行官Mixel。“老化的影响需要评估和时间预算占在设计的早期阶段,需要做和验证,以确保最终的预算满足老化的预算。”

解决老龄化的重要性不仅仅是传播安全性至关重要的和关键任务的应用程序。“我们几个IP提供商,特别是在较低的工艺节点,是询问老化模型和老化的EDA仿真能力,”格雷格•柯蒂斯说产品经理模拟FastSPICE西门子EDA。“这不仅仅是汽车了。我们看到在移动通信,我们看到在物联网。成为良好的实践,公司开始老化的IP。”

对于许多公司来说,这是不可避免的。”最大的一生是温度变化因素影响,”布莱恩Philofsky说主要技术销售工程师赛灵思公司。“操作电子在减少温度通常有一个可衡量的影响寿命和老化的电路。中的另一个因素一个工程师控制设备是当前消费的金额。更高的电流消耗可以显著减少由于一生电迁移和其他不良影响。不幸的是,现代电路设计是把争执与每个节点计算密度增加收缩。同时,降低电压的影响增加电流画在同一个信封。在过去的几年里,这一趋势是更高的操作电流在更高的操作温度,使可靠性更有挑战性。”

几何形状的影响
而导致衰老的潜在机制没有改变,其重要性已成为更重要的在每一个新的流程节点。“可靠性相关设备尺寸,特别是通道长度、“Jushan谢说,高级软件架构师节奏。“随着通道长度变短,效果更加明显。通道内的电场可以变得强大。设备在45 nm制程和低于必须考虑可靠性。”

这并不意味着设计可以安全地忽略老节点的影响。“虽然更先进技术的主要节点,如28 nm和下面,我们看到它在40 nm制程设备,”艾哈迈德说斋月,AMS铸造关系经理西门子EDA。“最近,专业铸造厂提供技术在130 nm和180 nm节点开始考虑为他们的客户提供老化模型。这是由于压力来自客户。这是一个需要他们看到工作的设计和应用程序的类型。”

新设备技术使它一个更大的问题。”在28 nm,人们已经意识到的一些机制over-stressing设备,”奥利弗说王的工程总监Synopsys对此。”盖茨非常薄。他们容易被压力过大。随着继续缩小尺寸,设计转向finFETs,引入新的机制如翅片结构,而这只会让它更突出。”

的一个重大问题是,并不是所有尺度同样在新的几何图形。“你是扩展的长度和宽度的尺寸晶体管,“说西门子的斋月。“但你不能规模栅氧化层在同一步伐。这将添加额外的压力在设备上。你不可以扩展电压相同的速度,因为扩展上面的电压不会留下足够的空间的阈值电压设备。这增加的设备将面临压力。”

门扩展没有电压是一个巨大的问题。“如果晶体管平均摄入相同数量的电流随着年长的晶体管大节点,然后通过伸缩装置密度你增加了功率密度,“说Synopsys对此Crosher。“与热量,热量可以这个方程的罪魁祸首。自热在finFETs也导致。从平面到finFET的转变就是我们真正开始看到那些压力问题申请消费产品和扩大对可靠性的担忧。他们将自己暴露的压力条件下,需要减轻,试图从这些设备中获得任何合理的一生。”

这变得更复杂,更死是包括在相同的包中。在过去,流程相关问题可以得到解决,有足够的数量和时间。但是许多高级包实现是独特的,以及其中的芯片可能年龄不同的利率。

“最大的问题,我们看到的是大量的实现选择,”Andy Heinig说,组长为先进的系统集成和部门主管有效的电子产品弗劳恩霍夫IIS的自适应系统的工程部门。“目前还不清楚如何比较这些不同的选项。芯片设计更容易如果你有之前的芯片代,是相似的。但是现在我们有一个广泛的选择,两个包和软件。”

事情可能出错数量的增加在一个包中,。“机械应力,弯曲,和潜在的热失配,”马克Swinnen产品营销主管有限元分析软件。“你还必须把权力从芯片到芯片b .即使撞失败,你仍然需要得到通过。但是如果你有一个目前由于这个,其他的疙瘩就会失败。”

理解各个部分是如何在一起需要更多深入分析整个设计过程。

老化模型
分析始于合适的模型和模型会很难现象可能并不完全了解。“有一个元素,我们实际上并不知道模型不够准确,“说Synopsys对此王。“最终的模型预测某一给定电路老化。真的,只有时间会告诉我们是否正确的预测。这是一个复杂的问题。不仅仅是老化的机制,我们已经知道。它也是自动加热效果,过程变化、蒙特卡罗和其他影响,你需要考虑分析给定电路的一部分。模型是正确的,也许他们并不是。”

很容易忽视的产业,但它必须工作。“我们还没有看到任何迹象表明模型是不够的,”Mixel的Takla说。“铸造厂,与工具提供商的合作,不断调整他们的衰老模型基于硅提高精确度测量。”

虽然老化技术已经成功的为传统设备,现在还不知道他们如何适用于这些新的影响。“你不能等待十年。你必须找到方法来得到你需要的结果更快,”谢说节奏。“你将使用一些理论或加速度方程和你想要得到一些相当于十年的衰老在很短的时间内。校准是很重要的,还有理论如何加速衰老。”

该行业正试图达成共识。“我已经处理紧凑的模型联合(CMC) 20多年来,“说斋月。“这可能是7年前当我们第一次开始讨论一个标准的老化模型。在那个时候,我们没有能够收敛在一个标准的热载流子注入(HCI)或负偏压温度不稳定性(NBTI)这将满足所有铸造厂和设计社区。他们觉得他们必须定制和修改以适应过程。”

但是可以把设备公司拿着球。“我们保证商业设备为10年的操作时保持在其操作规范,“Xilinx的Philofsky说。”有两种情况,可能需要进一步考虑或分析——一个设计需要一个操作寿命超过10年,或设计可能超过操作条件和愿望理解影响一生。在这些情况下,仿真模型,可以使用数据分析工具,和可靠性,为特定的设备应用于特定的操作条件。这可以微调一生规范,有时允许更有效的操作范围。我们做过几十年和演化模型的有高度的信心。但我们不断改善他们基于最新的理论和实证数据收集。”

在中央军委工作仍在继续。说,“仍然没有斋月。“每一个铸造和设计房子是创建自己的模型。他们中的一些人最初是基于物理模型。但有很多经验公式,也发生在为了能够符合他们当前流程和目标应用程序。我们在这些模型有多自信?我们应该有足够的信心让他们给一个很好的估计的降解量会发生在设备上。”

即使准确的模型,还有其他错误的来源。“模拟老化的本质本身利用很多近似,“斋月笔记。“你认为运行模拟老化在很短的时间,然后做一个推断目标段。这个推断有很多近似。但到目前为止,我们没有听到任何抱怨客户,客户提供的模型的老化是遥远。这些东西需要几年来验证。如果你今天实际运行老化分析,也许你需要五年,以确保在现实生活中发生了什么是正确的。”

老化不能自行考虑。“变化也起到了很大的作用,”Crosher说。“它与门密度增加,生产过程和更大的可变性。我们还没有看到他们成熟的领域15年实际上知道老化的影响和效果。这就是为什么有一种依赖,一个关键需求,在先进的设备你需要某种形式的嵌入式传感和管理这些问题。如果你能实时测量芯片的条件,看看设备退化和老化,然后他们能够采取一些缓解措施和管理。”

他不是一个人在确定这是一个问题。弗劳恩霍夫Heinig指出系统的变化作为一个巨大的挑战,随着越来越多的设备集成到系统和打包,以及这些设备预计将持续更长时间。“今天没有工具来解决这个问题,”他说。“很难验证,因为软件更新的产品也会随着时间而改变。”


图1:添加老化传感器设计,与生命周期分析。来源:Synopsys对此

集中在什么地方
数字和模拟会影响不同,设备受频繁的变化,在某些情况下,不改变。“任何地方有很多活动会更敏感设备老化,“艺术Schaldenbrand说,高级产品经理在节奏。“设备,你可以看看时钟树,看看发生了什么。数字设计对延迟敏感的变化。其他地方,这变成了一种挑战是在模拟设计。例如在一个偏见树。与偏见晶体管移动和老化,它可以加速偏见网络中其他设备的老化。总是有一些不同元素的设计,你必须看看他们有点不同能够分析可靠性。”

设计采用动态电压和频率扩展可能需要非常小心。“经常出现问题,当你正试图优化设备,可能减少供应,”国王说。“可能是与自适应电压方案,它是一个多低的问题你可以在供应,用你的逻辑仍然会议时间。可能有设计,推动供应他们发现他们需要的时候出现。如果性能下降不能纠正,那么至少有一个优雅的退出可能是一个重要的设计考虑。”

敏感性分析是一种方法的问题。“假设有一定设计参数他们担心,如放大器的增益、“斋月说。“他们想要看到每个晶体管的敏感程度,有助于改变增益。然后他们可以考虑阈值电压的变化由于老化或id。与敏感性分析,他们能理解衰老的影响有多大特定设备在设计上与其他设备相比,然后开始做一些保护的。”

但你必须小心考虑的所有重要领域。“有一种现象叫做绝缘压力,”节奏的Schaldenbrand说。“考虑看狗或显示器等设备。闲置,可能多年来,和你想要春天采取行动如果有某种情况发生。即使是那些电路,你认为你只是坐在那里什么都不做,被强调。他们年龄和可能会失败,由于老化,出现在他们闲置。”

如何解决这个问题
有几种方法可以考虑的问题在设计、实现和签字的发展阶段。Schaldenbrand列出了三个层次的分析,可以执行:

  1. 监控设备条件下运行。这是有效地监控诸如电场通过观察设备的大小和其他因素。这些支票被称为设备断言。它可能表明设备看到了许多电压,这是一个很敏感的地方,和一个潜在的问题。
  2. 运行分析。你可以进行帐龄分析和表示一个设备将操作在一定条件下对于一个给定的时间,生命的最后会有一定的特点。如果你做角分析,或蒙特卡罗分析,同时你也可以做帐龄分析。
  3. 逐渐老化。这使得分段近似为一个操作。通常,设计师相对比较有经验,知道哪块对这些现象更敏感。你不需要到处运行这些测试,因为他们往往是相对昂贵的。

进程迁移变得昂贵。说,“为每个进程迁移从16 nm, 7、5海里,一直到3海里,每个流程节点根据客户需要模拟三倍,因为他们需要额外的PVT角落来看,“西门子柯蒂斯说。“它肩负重担自己模拟需要确保硅首次成功。”

但即使是这种程度的分析并不提供确定性。“可靠性统计,”谢说。“你需要看看它作为蒙特卡罗的问题。你有100的设备,他们是相同的,当第一个捏造。即使你应用相同的压力在10年,这些设备和测量设备退化,它将一个分布。这种分布相对老化并不被认为是大多数公司。”

没有人想设计为最糟糕的情况。“当你嵌入传感器,你不需要预测老龄化,”国王说。“你可以测量它。你可以看到什么是衰老和做出调整电路,或突出显示芯片是接近失败,决定进入一个安全的状态。能给你将失败的电脑从一个数据中心,或者确保你的无人驾驶汽车的安全运行。”

内置的分析可以被改变随着时间的推移。“赛灵思公司提供了一个系统监控电路允许用户监控温度和电压,确保安全运行,“Philofsky说。“有编程的设备将使我们进一步扩展这个测量和允许一个更全面的观点在许多固定功能设备的可靠性。”

至少,这意味着可以挤压利润率。实际上“趋势行业,之前关注具有良好老化模型和实现仿真流程,老龄化是插入很多保证金,“说斋月。“他们离开桌子上很多,他们负担不起任何更多的。通过做一些老化的模拟,他们能够加强市场竞争的利润没有承担太多的风险。他们将离开一些,但不像以前那样多。”

中央军委内仍有希望。”早在2018年,中央军委发布了一个支持老龄化的标准通过开放的建模仿真流接口(OMI),”他说。“有更多的发展,包括额外的流量模型。它从不同的设计采用了很多的房子,最重要的是来自不同的铸造厂。这个接口模拟器无关,这意味着铸造厂不需要创建一个不同的接口不同的模拟器。我们已经看到很大的压力从设计房屋和铸造厂提供老龄化接口。目前越来越多的铸造厂开始采用标准和OMI接口。”

结论
而导致衰老的机制是理解,该行业继续挣扎在创建模型,提供足够的精度。这个问题的部分原因是没有足够的时间来收集数据,可用于评估这些模型和微调。这一过程还在继续。直到完全理解这些模型的准确性,设计团队要么留一些保证金,或他们必须在他们的设备中加入自适应方案能够减轻老化时出现问题。

相关的
芯片设计问题在长寿命
几十年来保持系统运行会导致问题从兼容性和完整性更新到意想不到的安全漏洞。
性能和权力在7/5nm权衡
专家在餐桌上:安全性、可靠性、和利润率都在玩在先进前沿的节点和包。
芯片制造他们的预期寿命
为不同的市场生命周期可以有很大区别,应用程序在这些市场。



1评论

查理Slayman 说:

嗨布莱恩-伟大的文章!我想给你一个互补邀请irp 2021 (irps.org),这些主题是“前面和中心”。

问候,
查理Slayman
2021年IEEE irp有限公司主席

留下一个回复


(注意:这个名字会显示公开)

Baidu