技术论文

原因:亲近它,让它更酷-缩放款推理在多核cpu缓存计算

高效缩放款推理在多核cpu缓存计算

受欢迎程度

抽象——“深层神经网络(款)被用于各种各样的应用程序和服务。款的性质不断变化,竞争构建最优的硬件(在数据中心和边缘)仍在继续。通用多核cpu提供独特的吸引优势款推理数据中心[60]和[71]。大多数CPU管道设计复杂性是针对优化通用单线程性能,并对相对来说简单,但仍然非常重要,数据并行推理款工作负载。有效解决这种差异可以使原始性能扩展和整体性能/瓦特改进多核CPU推理款。

我们现在的半群,构建创新的解决方案,绕过传统的CPU资源这款推理能力和限制其性能的影响。从根本上讲,导出“保持接近”政策使连续的执行工作接近对方。原因使指令交付/解码接近执行数据和指令执行近。”

找到技术论文。

技术论文发表于ACM和IEEE 2021年第48届国际研讨会上计算机体系结构

来源:
Anant紫菜(英特尔实验室);拉胡尔贝拉(苏黎世联邦理工学院);Shankar Balachandran, Joydeep Rakshit, Om J俄梅珥(英特尔实验室);Avishaii Abuhatzera, Belliappa Kuttanna(英特尔);Sreenivas Subramoney(英特尔实验室)



留下一个回复


(注意:这个名字会显示公开)

Baidu