中文 英语
18lickc新利
的意见

当你不能在系统可靠性上精打细算时

面对自然现象和恶意攻击,保持系统可靠性的主要挑战。

受欢迎程度

不管我们喜欢与否,失败总会发生。重要的是为失败的发生做好准备,这包括采取措施,使我们能够迅速处理或解决问题。但并非所有的失败都是一样的。例如,您日常使用的笔记本电脑可能会偶尔出现故障。如果设计良好,您可以简单地重置机器以使其恢复到原始状态。但是,正如Maxim Integrated微控制器专家卡洛斯·罗德里格斯(Carlos Rodriguez)指出的那样,“我们并不总是拥有手动重置和重置我们正在设计的设备的奢侈。”

罗德里格斯最近主持了一次网络研讨会,“什么时候以及为什么系统可靠性很重要”在马克西姆的虚拟传感器的经验.在会议上,就是现在按需提供,他强调了维护系统可靠性的一些关键挑战,以及一些帮助您保持系统正常运行的解决方案。

为了构建他的讨论框架,Rodriguez概述了四种系统可靠性确实不容商榷的场景:

  • 这个设备不容易使用。这是农业或工业应用的情况,在整个领域(图1)或在制造设施内可能有数百个传感器。在这种情况下,必须对故障传感器进行物理定位并不是一种可持续的经营方式。在工业物联网环境中,如果传感器位于难以触及的位置,则可能需要停止生产线来解决问题。
  • 保持良好的沟通是至关重要的。一个例子是应急响应设备,在该设备中,错过通信可能导致毁灭性的后果。
  • 连续处理是至关重要的。例如,像心脏起搏器这样的医疗设备,即使是短暂的片刻也不能停止工作;否则,后果可能是致命的。
  • 存储的数据是有价值的。这种场景的例子包括一个加密硬件钱包应用程序,如果存储私有加密密钥的内存位置被损坏,对资金的访问可能会受到阻碍。


图1:当传感器分布在整个农场时,跟踪故障点可能是费时费力的。一个更好的策略是在设计阶段建立和维护高系统可靠性。

哪三件主要的事情可能出错并导致系统失败?Rodriguez指出,代码中可能存在破坏,从而阻止产生所需的输出。数据可能会丢失或损坏。或者,当数据从A点传输到B点时,可能会出现问题。

深入研究这些系统故障的根本原因,罗德里格斯指出了两个关键问题,以及解决这些问题的方法。其中一个问题是我们看不见的:阿尔法粒子。从太空落下的宇宙射线包含这些阿尔法粒子,它们可以在电子设备的内存中触发不希望出现的位翻转,并导致:

  • 系统故障
  • 内存损坏,导致数据丢失
  • 不可预测的设备输出
  • 其他突发事件

设备中的内存越大,比特错误的可能性就越大,因为阿尔法粒子进入这些区域的可能性就越大。当像笔记本电脑这样的设备受到这种阻碍时,您可以重置它。但如果它是一个无法重置的设备,系统的内存中就需要错误纠正码(ECC)。ECC检测内存中比特错误的确切位置并纠正这些错误。罗德里格斯说:“ECC将提高内存的稳健性,并降低系统在产品整个生命周期内发生故障的可能性。”

黑客是另一个主要问题。罗德里格斯指出,众所周知,黑客会找到多种方法来改变设备的性能。例如,通过:

  • 在沟通过程中交叉数据,并以虚假信息代替
  • 将代码注入微控制器以改变应用程序的行为
  • 从存储的数据中窃取信息

Rodriguez解释说,解决方案是在你的设计中集成一个具有强大安全功能的微控制器,例如:加密引擎、循环冗余码(CRC)、安全引导加载器、真随机数生成器(TRNG)和安全的非易失性密钥存储。他说,这些特征使黑客更难进行任何形式的篡改。

用于高可靠性系统的微控制器
Maxim Integrated推出了一种新的低功耗微控制器,旨在保持系统的高可靠性MAX32670它基于100MHz的Arm Cortex-M4处理器和浮点单元。它的嵌入式内存包括384KB的闪存(带有ECC)、160KB的SRAM(带有可选ECC)和16KB的统一缓存(带有ECC)。为了安全性,该设备具有安全引导ROM,安全非易失性密钥存储,TRNG, CRC 16/32和高级加密标准(AES) 128/192/256。该器件节能,在主动模式下工作低至44 μ A/MHz,在最低功率休眠模式下工作约0.1 μ A,并采用5mm x 5mm TQFN封装(更小的WLP将很快推出)。

罗德里格斯说:“就可靠性而言,它真的会让你的系统更上一层楼。”

要了解更多信息,请通过购买评估套件来评估MAX32670的下一个设计,MAX32670EVKIT,查看DARWIN系列超低功耗Arm微控制器,或观看ECC视频为了更好地理解设备如何检测和纠正错误。



留下回复


(注:此名称将公开显示)

Baidu