确保从里面芯片的可靠性

芯片监测技术发展汽车、工业、和数据中心的应用程序。

受欢迎程度

监测活动和交通正成为一个重要的成分复杂、异构的芯片应用于汽车、工业、和数据中心的应用程序。

尤其是在对安全性要求苛刻的应用,如汽车,在很大程度上取决于系统的操作完全正确。自治和辅助驾驶,一个机制,以确保系统正常运行实时需要。今天,这通常被称为芯片监控、运行监控、系统监控、甚至建自测。

芯片监控的优点和限制取决于几个因素,如预期的失败机制,这是这两种应用程序,以及选择监测方法,Jens Warmuth说,工程师弗劳恩霍夫东亚峰会先进的物理验证工作小组。“一种方法是直接检测损伤但足够早,没有发生故障。另一个是测量环境或操作参数导致损伤的形成和生长,从而预见失败之前就发生了。”

监控的贡献参数,认为在高压力的环境中使用的芯片和大的温度变化或过度振动。

“这可以体验高水平的机械应力,“Warmuth说。“对于大多数电路这不是重要的问题,只有包和其他外围国家正处于危险之中。然而,对于一些电路,特点可能会改变。确定准确的芯片级的机械应力值,直接测量现场。远离芯片上的失败机制,这些包装水平,这也往往成为必要的监控电路芯片和进入一个设备在其外围。”

随着在汽车电子系统复杂性的增加,要求监控芯片的情况下,是否在发动机舱内部,作为雷达/激光雷达系统的一部分,或作为娱乐基础设施的一部分。

“能源效率的要求,在大批量生产的汽车动力性能和可靠性也引起车内监控和传感器系统在数量和复杂性增加,允许动态物理条件对生产管理和优化每个引擎产生变化,”Stephen Crosher说的首席执行官Moortec。“在半导体、芯片监控允许自测,自我诊断,提供方案,提高设备的可靠性坐落在严厉的汽车环境中。”

这适用于网络活动,但监测需要做一定程度的感知的影响监测本身。“我们发现,在当前数据速率主动监测信号的干扰信号。您需要监视这些芯片信号的质量,而不是积极地监控信号本身。例如,接收方实际收到什么?你需要什么设备看到。这涉及到均衡。你需要形状信号的方式,其目的是要收到,”指出史蒂文哇,系统和解决方案的副总裁,在Rambus杰出的发明家。

汽车监控
当前活动的周围片上监测在汽车领域,推动了ISO 26262标准,因为这是每个人都使用测量系统的弹性,指出Anush莫汉达斯·,营销副总裁和业务发展NetSpeed系统。”ISO 26262做一份好工作的要求,问题是和运行诊断。你是否有问题,但这并不能告诉你如何恢复它。它没有告诉你要做什么在现场的情况。当你制造汽车,你关心ISO 26262,但并非如此。你关心发生了什么你的芯片驱动系统”。

汽车oem解决这个问题的方法之一是用在线监测,检查硬件是否正常操作。这是最佳当没有跑步以外的内建自测(阿拉伯学者)交通,它适用于点火启动或当系统首次提出。

“然而,如果你开车101和你想弄清楚你的芯片是否做得很好,你不能突然降低性能为零,“莫汉达斯·压力。

另一种方法使用了一种叫做网络阿拉伯学者,在系统在常规性能工作。这可能是一个有吸引力的汽车原始设备制造商希望诊断方法理解失败发生之前就,不。尤其是在自治系统,理解为什么坏了后只是绝对最低。

“同样,ISO 26262是必需的,但还不够,“莫汉达斯·说。”,其他的事情你需要在线监测确保诊断做了非常,非常好。下一步包括恢复技术,必须向系统架构。这适用于几乎任何知识产权或任何系统。你不能把它看作一个额外添加层;你需要建筑师。”

同样,在运行时监控/任务模式的背景下,这都是确保当一个产品出货是没有缺陷。即使在设备组装汽车,他们可以进行测试。但是问题仍然存在,是否他们会维持其运营质量。他们会保持长期安全运营能力,特别是在汽车实际运行吗?这就是需要额外功能,产品营销主管Stephen接线盒说导师,西门子业务

“过去,当你谈论DFT或测试,通常是在生产阶段,“说接线盒。“你制造的部分,你跑测试,以涵盖所有的缺陷,然后假设是这些部分将维持很长一段时间。在罕见的场合他们没有,你可以处理,当它发生。在汽车功能安全的环境中,任何下降是不可接受的,因此基础设施功能必须先发制人,以确保这不会发生。”

有更多可以用这种监测方法,。“你可以设置运行时性能计数器使用映射的服务质量和跟踪错误,”库尔特·舒勒说,负责营销的副总裁ArterisIP。“你想知道你期望的系统行为的行为。您可以使用探头看流量,点击每个X发生的次数,这样你就可以统计抽样。你也可以使用探针在运行时动态视图数据,类似于跟踪的数据通路。”

此外,这种方法可以用于跟踪安全漏洞,在汽车、工业和医疗应用程序可以有安全的影响。

“观察探针可以看看交通,但你也可编程防火墙插入datapath公司,”舒勒说。“从那里你可以确定通过而不让通过。有时候你不想让敌人知道你到他们,所以您可能想要阻止恶意流量不费一个中断,让对手知道。这种能力是除了硬件诊断。当你把所有这些结合在一起,你会得到一个功能安全解决方案在ECC或奇偶校验数据路径,硬件复制,阿拉伯学者,安全控制器,这些额外的运行时诊断。所有这些的组合,让它如此有吸引力。”

在数据中心
内部数据中心的服务器CPU温度升高,由于CPU漏电流功耗大大增加。实时温度监控系统是必要的,同时,允许电力优化。

“芯片嵌入式温度传感器也可以帮助延长设备寿命或提供保护,从而实现服务器关闭计划,后者是气温升高的结果动态CPU负载突然增加概要文件,“Moortec Crosher指出。

此外,需要在数据中心之间有共性与汽车的空间,很多时候只是一个术语的区别。

“数据中心,他们称这些RAS(可靠性、可用性、可服务性)特性,“说NetSpeed莫汉达斯·。“数据中心的人获得报酬和监控基于百分比的时间在线。这不是99,但是99你有多少9紧随其后。我们见过很多次了。一个数据中心脱机时为美国联合航空公司和数以百万计的人被困。它有害的宣传为曼联,数据中心的负面宣传。”

数据中心管理人员应对这是不要担心芯片级别的RAS。相反,他们关注架级或系统级,他说。“你怎么建立在系统级可靠性呢?network-on-chip,关键是如果你有不同的机架或不同的作为PCIe,如果退出时会发生什么呢?你重置你的整个芯片或你能优雅地处理事情会在线和离线吗?机制非常类似于汽车部门是如何运作的,但如何优雅的你是在接受错误并从错误中恢复过来。”

让IP处理它
设计知识产权的承诺一直是困扰工程团队来解决系统的复杂性。所以另一种片上监测的方法是实现专业知识产权被分散在一个大数字芯片帮助工程师了解芯片实际工作,在操作,实时与真正的软件,所有在系统层面上,和系统作为一个整体在较高的抽象级别,这样他们就可以迅速发现问题,首席执行官鲁珀特•贝恩斯指出UltraSoC

例如,嵌入式逻辑分析仪可以报告任何信号。“你可能用它来看看常见用例,缓冲水平和检查缓冲区被填满,清空,”贝恩斯说。“通常,你可以提高性能,发现你很保守的一个缓冲,只是波动在20%和30%之间。如果你让它去60%,它可以做两倍的数据在给定的时间。”

另外,协议分析仪可用于理解各种不同的互联和展示有效的流量通过一辆公共汽车。

IP今天是几乎每一个SoC系统的基础,这就是为什么IP是一个拼图的片上监测的关键。和IP在汽车空间正在发生一些有趣的变化。

高级产品营销主管Navraj Nandra接口IPSynopsys对此说,每个应用程序都有自己的挑战。例如,atomotive电子操作在一个恶劣的操作环境和非常高的温度,而工业应用并不总是相似的应力条件下操作。

“数据中心的区别在于,处理需求快速变化,相当于峰值需求的数据中心,其次是平静时期,“Nandra说。“你得到非常大的地方的温度变化影响芯片的温度,所以你需要算出在所有这些领域如何节流SoC的速度或限制其功能,这样你不会影响性能的不安全的范围。”

的一些方法,工程团队正在调查芯片上的PVT(过程、电压和温度)变化是通过添加更多的智能芯片。“分布式传感器在SoC的概念,这些分布式传感器是测量电压和温度在SoC,但很地方、“Nandra说。“例如,可以有一个传感器接近每个处理器在一个多处理器SoC。传感器每个交流中心经理,这是收集如何保持PVT监控整个SoC。中央管理器将设置一个指定范围的阈值电压,例如,这可以用来减少时钟速度,实现负载均衡,并改变处理器的其他方面。”

监测电源管理的另一种方法是电压控制,可以用来降低电压为了节省功率。“你可以做一些更复杂的设置一个水平,电压控制指定最低允许特定的性能目标,“Nandra说。“模块电压监控系统可以检测电压无常,可以有助于SoC的安全操作区域。最后,过程控制可以实现允许SoC达到最大可能的速度通过调整电压的水平。”

更细粒度的方法可以在汽车应用。“ADAS等安全关键应用,我们试图检测和控制失败,并减少随机硬件故障的影响,为此有片上监测是必需的,”他说。“硬件安全功能添加到SoC-things像奇偶校验,循环冗余码(crc),和ECC(错误校正码)——基本上允许的错误。一旦你发现了错误,汽车IP可以添加一些硬件安全机制。”

这反映在生产修改IP。PCI Express,例如,DDR现在包括支持CRC, particy保护和ECC。

要花多少钱?
的一个主要参数的在线监测是成本,这是更便宜的比冗余。

“与冗余相比,只有一个安装更多的设备,不是很多,”弗劳恩霍夫的Warmuth说。“然而,这个设备必须非常可靠的所以它本身不成为薄弱环节。不过,这种方法仍然可以是可行的和有成本效益的,因为它减少了这些额外的可靠性考虑这个设备。必要的改变的挑战在设计和实现一致的监控电路或设备不同小从面临的问题的方法来提高可靠性使用或考虑今天,如冗余。它可以定义和强制接洽新准则在整个行业。”

如何处理额外的监控需求方面的设计团队仍然在发展,但更多的特定功能已经被添加到设计IP, IP是针对一个特定的应用程序结束。包括内部的IP的诊断。这些诊断与外部诊断。

“这两种类型的这些诊断允许IP和SoC通过软件相互通信,这是一个交流方式错误和错误状态,“Nandra说。“这些诊断机制然后记录的一部分功能安全记录作为FMEDAs(和诊断故障模式影响分析),它允许系统的错误状态监控。这是SoC的一部分,但正日益成为知识产权的一部分,。”

随着时间的推移,这可能演变的一部分功能安全子系统,包括安全项目,可以一个处理器的一部分,随着工具等安全存储器BiST技术定期测试这些子系统内确保功能安全测试不干扰SoC的运行负荷。“其实变得非常复杂,Nandra说。“它本质上是一个功能安全子系统,它执行一个周期性的片上监测由于这任务模式操作。



留下一个回复


(注意:这个名字会显示公开)

Baidu