中文 英语
首页
技术论文

三代人的十个教训塑造了谷歌的TPUv4i

谷歌的TPUv4i进化

受欢迎程度

来源:
Norman P. Jouppi, Doe Hyun Yoon, Matthew Ashcraft, Mark Gottscho, Thomas B. Jablin, George Kurian, James Laudon,李胜,Peter Ma, Xiaoyu Ma, Nishant Patil, Sushma Prasad, Clifford Young,周宗伟(谷歌);大卫·帕特森(谷歌/ Berkeley)

找到这里是技术文件

2021 ACM/IEEE第48届计算机体系结构国际研讨会(ISCA)

摘要-“谷歌自2015年以来部署了几代TPU,给我们上了一课,改变了我们的观点:半导体技术的发展是不平等的;编译器兼容性胜过二进制兼容性,特别是对于VLIW领域特定架构(DSA);目标总拥有成本vs初始成本;支持多租户;深度神经网络(DNN)每年增长1.5倍;DNN改进了工作负载;一些推理任务需要浮点数;推论dsa需要空气冷却;应用程序限制延迟,而不是批处理大小;向后ML兼容性有助于快速部署dnn。 These lessons molded TPUv4i, an inference DSA deployed since 2020.”



留下回复


(注:此名称将公开显示)

Baidu