中文 英语
技术论文

减轻沉默的高性能计算中的数据错误了

受欢迎程度

新技术论文题为“减轻沉默HPC应用程序跨多个项目中的数据错误输入“由爱荷华大学的研究人员发表的,百度安全,阿贡国家实验室,本文是一个最好的纸决赛在SC22

研究者”提出MinpSID,一个自动化的SID框架自动识别和优先顺序孵蛋的指令在一个给定的程序,增强发展报道。评估显示MinpSID可以有效地减轻署覆盖多个输入的损失,”国家。

找到这里的技术论文在这里。2022年11月出版。演示幻灯片是在这里

黄、Yafan et al。”减轻沉默在HPC应用程序跨多个程序输入数据错误了。”高性能计算国际会议,网络,存储和分析。2022年。

相关阅读
筛查沉默的数据错误
可以找到更多的sd使用有针对性的电气测试和100%的检验,但不是全部。
沉默的数据损坏
如何预防缺陷会导致错误。
为什么沉默数据错误那么难找
微妙的IC缺陷数据中心cpu导致计算错误。



留下一个回复


(注意:这个名字会显示公开)

Baidu