低于10 nm芯片监测非常必要

复杂的交互和权力相关要求了解芯片的行为环境影响现实世界的用例。

受欢迎程度

增加系统的复杂性和更多潜在的相互作用在异构的设计,使其更加难以确保芯片,甚至一块芯片,将正常运作而不实际监测,实时行为。

连续和零星的监测已爬到设计在过去的几十年。但它并不总是清楚有效的这些方法,他们将花费多少资源,以及遥远的一块芯片或这些技术应该延长。特别是安全关键任务系统,在设计需要功能齐全的长时间,在系统的系统,环境远远超出单个芯片设计。

在每个新的流程节点,这将变得更加困难。例如,在40/28nm,当设计师第一次开始认为热是一个一阶问题,软件开发人员开始研究部署传感器来监测用电。但在这些节点监控仍被认为是可选的。16/14nm,某种形式的监控和自测成为必不可少的。的引入finFETs创建了一个动态功率密度上升,以及芯片上的热点鳍之间的热量造成的困。

在10/7/5nm问题越来越严重,所以需要更加一致的监控。热原因问题的数量正在不断的增加节点,并且经常由应用程序。薄铜导线和栅极氧化物,新的架构,强调吞吐量和不间断的电路,和各种类型的开关和电源噪声加起来需要更好地了解正在发生的事情在一个芯片上。在过去,这在很大程度上是通过添加处理,但那不再是可能的在这些节点。所以现在的关键是如何确定问题发生时,特别是在他们影响信号的完整性。这是为什么/芯片上的传感和更广泛的模拟,得到更多的关注。

“有更多的芯片上的传感器来跟踪过程中,电压,和温度在死去,”David Stratman说校长高级产品经理节奏。“这是越来越重要的用于高市场,如汽车、电池驱动市场移动和TCO / ROI-driven网络和高性能计算市场,包括不断增长的AI加速器和培训行业,“

主要的问题是不断增加的复杂性和光谱可能的交互。

说:“整个行业的系统性Gadge Panesar,首席技术官UltraSoC。“即使是所谓的简单系统有一个四核或者更多,外设,内存,和事情没有工作。有硬件加速,异构架构,以及资源共享的不同任务。但它不是核心。它的系统。整个系统工作。你可以有一个手臂,RISC-V核心,MIPS,或自己的本土的东西。他们不是有用的,除非你使整个系统工作。情况就是这样,今天,验证在一个一点是不够的。”

例如,考虑一个服务器。谷歌搜索将触摸约1000 cpu,但验证块孤立的不再是足以保证功能。

“你需要尝试和验证整个soc,紧随其后的是整个系统。为了优化和理解的行为,你需要能见度的系统来理解你的表现是什么,”Panesar说。“如果你做一个搜索和1毫秒内完成,99%和1%的搜索需要超过1毫秒,你会得到一个第三的尾巴是一个100年。如果你在10000年有一个搜索,你仍然得到20%,将超过1毫秒。相当于性能损失,金钱,权力。这是成本,在搜索”。

例子:据报道,谷歌发现了一个bug的舰队服务器已经有好几年了。顾问花了几个月的分析系统,得出的结论是长尾。解决办法支付他的薪水在接下来的10年。

这就是为什么芯片监控变得至关重要。它提供了洞察系统的实际操作中是如何被使用的。需要芯片监控温度被用来提供实时信息,延迟,和动态电压降,所有这些会影响操作正确性,可靠性和老化的芯片/ 3 d-ic诺曼Chang说,首席技术专家半导体业务单元有限元分析软件

特别是,Chang说,复杂的热梯度3 d-ics可能会受许多用例涉及多个芯片的组合不同的流程节点。芯片之间的接口材料将从热脆弱过热除了单个芯片的高度活跃的区域。

系统分析可以帮助极大。而不仅仅是调试的核心,核心可以查看整个SoC的上下文中运行时分析。

UltraSoC Panesar说这种IP需要高度可参数化的工程团队可以决定如何分配资源基于成本、死区和权力。通过添加在可配置性在运行时,可以使用相同的硬件提供不同的数据在不同的场景。

从可选的基本
在先进芯片监控节点,PVT监视IP现在应该考虑基金会IP,奥利弗·王说,首席技术官Moortec。“这是作为一个先进的基础节点SoC I / O细胞,锁相环和标准电池。芯片监控开始作为一个保险政策几年前,但现在非常SoC架构的一部分,它使大量的电能节约。也就是说,现在一个新的水平的重视的IP功能的观点。IP的可靠性是一个关键需求。”

片上监测可以划分为两个部分,高级营销主管史蒂夫•插座测试自动化Synopsys对此。“监测可以在不同时间点进行开发和测试的生命周期。你当然可以做生产测试期间监视或测量,或在系统级测试,你使用整个系统,但你仍然想要运行不同的测试系统中了解其操作。一般情况下,片上监测用于可靠性的目的,通常在功能操作期间,在该领域部分的生命周期。这意味着你没有连接到一些东西。你没有连接到一个测试人员或从长椅上。芯片在系统,该系统。如何获得这些信息?这就是遥测进来。”

方法收集数据和交流需要在两个方向上,他解释说。有一些技术,软件运行在系统和直接链接到不同的芯片上的功能。“这可能是诸如逻辑阿拉伯学者和记忆BiST-various形式的内建自测你运行这个作为接通或切断操作,甚至定期在这种情况下,必须发送遥测某处,不仅芯片外,系统时。然后,有不同层次的沟通。首先,必须有一个芯片连接到系统。”

在这里,许多工具提供商正在研究解决方案这个时候从董事会层面的芯片级总线,总线系统,或者一个集中的处理器芯片外,是否它是一个服务处理器或安全处理器。那安全处理器需要连接到外部世界。更开放的问题没有标准化。由图,系统制造商”接线盒说。

特斯拉已经传达到汽车的操作系统,他说,这意味着遥测已经发生。“当你驾驶你的特斯拉和将数据发送到特斯拉不断的云,他们有一个LTE网络的汽车总是连接,发送遥测特斯拉。在他们的情况下,它的定位和其他操作参数得到送回特斯拉,显然,他们可以将数据发送回的汽车。他们可以广播数据。他们做定期的软件更新,基础设施已经存在。然后问题就是额外的遥测我们可以发送吗?”

目前,许多工程集团希望更详细的测试,诊断和预测数据,这可以通过电波发送。“目前,有些东西是测试的影响例如等传统测试BiST能够测试逻辑,记忆,I / Os,“接线盒说。“阿拉伯学者往往是更多的一种周期性的测试,它发生在某些瞬间,在上电,或越来越以不同的时间间隔。但它不是连续监测。这样做需要一个潜在的分手BiST测试,运行每隔几毫秒为了监控底层电源和时钟网络。”

所有的各种数据然后使用数据分析需要分析和机器学习是否有数据的趋势,他指出。“你不一定看失败,”他说。“你看性能数据是否只是对某种趋势在未来的失败。你希望能够预测,所以很多分析涉及到一起,包括芯片的IP数据。”

安全

可靠性之外,另一个领域取得进展是安全芯片监控。

“你希望能够监视任何形式的攻击,更重要的我们依靠在汽车自动驾驶和自动功能,“接线盒说。“我们必须确保没有黑客出现,所以它需要被监控。活动进入芯片必须监控防止尝试在芯片外部访问特定的公共汽车。芯片还需要监控避免某些行为,或至少国旗活动未经批准的活动。这方面远不如在可靠性方面,但它是我们需要关注的东西,“接线盒强调。

从可靠性和安全性的角度来看,数据中心几乎是看完全相同的功能安全要求,鉴于他们必须启动并运行24/7,如果有的话,在数据中心的安全更重要,他补充说。

Panesar同意了。“如果我们在目标系统观察发生了什么,我们可以寻找应该发生但还没有发生的事情,还是发生了不该发生的事情。提供一层安全。这并不取代安全已经存在,但它提供了一个监测non-determined行为。,警报可以提出,经目标系统的反应取决于他们想做什么。”

结论
鉴于高级节点的复杂性,异构系统的挑战,和系统复杂性,可见性系统可靠性和安全性是绝对必须今天soc。虽然目前还不清楚哪些方法收集数据和监控系统将长期逗留,很可能客户可能采用多个为了获得最好的洞察他们的设计。

可能有一个点球支付在PPA,然而。失败不是一种选择,所以芯片监控技术来承担由于半导体的竞争自然生态系统继续生产。



留下一个回复


(注意:这个名字会显示公开)

Baidu