中文 英语
18.luck新利
的意见

热芯片上的下一代通用计算

这种处理器将为大多数即将推出的笔记本电脑、服务器和游戏机提供动力。

受欢迎程度

在最近举行的HOT CHIPS大会上,第一天的开幕产品是一听到文字处理器就会想到的芯片。这些是来自英特尔、AMD和IBM等公司的下一代芯片。还有很多其他芯片,比如Arm的Neoverse N2, NVIDIA的新数据处理单元(DPU),或者AMD的下一代图形架构。但在这篇文章中,无论如何,我将专注于这些来自业界大公司的通用处理器,这些处理器为大多数笔记本电脑、服务器和游戏机提供动力。

我不打算详细介绍所有这些架构,只是指出我在演讲中突然想到的东西。对于所有的英特尔处理器,在一周前举行的英特尔技术日上涉及了相当多相同的领域。你可以在YouTube上免费观看(你不需要注册HOT CHIPS)。警告,已经超过两个小时了。

Intel Alder Lake CPU架构(笔记本和台式机)

Alder Lake是一款全新的CPU内核,可从9W扩展到125W。它基于英特尔7处理器(记住7是新的10)。它有两种类型的内核,P-core代表最好的单线程性能(P代表性能),E-core代表吞吐量(E代表效率)。它们都有更深层的前端(执行单元之前的指令处理)和更深层的后端(管道阶段等)。

当然,就像所有具有两种不同内核大小的设计一样,其思想是通过在大内核上运行时间关键的内容,并使用较小的内核来处理不需要消耗太多电力或面积来完成工作,从而更快、更有效地处理异构工作负载。下文将详细介绍英特尔在这一领域所做的工作。上图显示,p核的运行速度比e核快50%以上,但2个p核和8个e核的吞吐量比使用4个p核高50%以上。

上面的图表显示了可伸缩性。注意,在处理器领域,“移动”指的是笔记本电脑,而不是智能手机。在接口方面,一切都是最新的,支持PCIe 5.0, DDR5和LP5。当然,支持较老的协议,如PCIe 4.0或DDR4。

正如上图所示,不同的芯片是由不同的构建块混合和匹配而成的。操作系统(和任何其他软件)的相同二进制映像在所有核心上运行时不变。

最大的新事物是Intel Thread Director。这提供了硬件支持,可以跟踪哪些线程应该在p核上运行,哪些线程应该在e核上运行,以及哪些线程应该从一个核移动到另一个核。它以纳秒精度监视每个线程的运行时指令组合以及每个核心(包括热)的状态。它并不在硬件上执行线程调度,但是运行时反馈被操作系统用来做出调度决策。超过一半的演示详细介绍了Thread Director是如何实现的,以及它维护哪些表。

你可以在YouTube上看到Thread Director的演示视频:

AMD下一代Zen 3 Core(服务器和游戏)

AMD讨论了新的Zen 3核心。这是他们禅宗路线图的最新进展(我开始听起来像一个大师)。最初的Zen和Zen+是14/12nm的。然后Zen 2是7nm。Zen 3(在HOT CHIPS上宣布的)仍然是7nm工艺,但Zen 4将是5nm工艺。

以上是规格。

我继续惊讶于每周期指令(IPC)仍然可能有如此大的增长。似乎什么都不会有那么大的区别了。但是Zen 3比Zen 2有19%的IPC提升。正如你在上面的柱状图中看到的那样,演示详细介绍了导致这种增长的因素。

以下是禅宗2和禅宗3之间的主要变化。

他们讨论了未来的V-cache技术与tsv和直接铜-铜键合。

这就是核心。它实际上是用来运送一系列产品的,其中一些使用了3D包装技术。

>5GHz下一代Z处理器芯片(主机)

IBM Z处理器是最初的IBM 360家族的后代。我曾读到,上世纪60年代的代码可能通过某种形式的虚拟化,在它们上运行时不会改变。当然,在Z大型机上运行的许多代码都是用Cobol编写的,这种语言可以追溯到20世纪50年代。在HOT CHIPS大会上宣布的新处理器被称为IBM Telum。

你必须有一个热芯片的骰子,这是IBM的。它与前任的主要区别在于左边。我没有足够的空间来详细阐述所有的细节。该芯片采用三星7nm技术,占地530平方毫米,配有22.5B晶体管,时钟频率超过5GHz。

IBM一直擅长的一件事是找到创新的方法来交付他们的处理器,使它们可靠、可维修和性能非常高。一个单芯片也可以是一个有两个芯片的多芯片模块,或者一个有四个芯片的抽屉,或者一个有四个抽屉的大系统。

另一个新功能是集成人工智能加速器。在HOT CHIPS大会上,IBM在这方面做了很多细节,但越来越多的人听到AI加速器,它们似乎都差不多——大量的TOPS,大量的带宽,处理稀疏性。

Intel Sapphire Rapids(服务器)

Sapphire Rapids是下一代英特尔数据中心芯片(英特尔术语为至强可扩展处理器)。

关于它的第一个重要的事情是它是一个多瓦的设计(瓦是其他人所说的die或chiplets)。但是,它在体系结构级别上是单一的,每个tile都可以访问所有其他tile的资源。

这是框图。当然,像所有处理器一样,它也是为人工智能而构建的。英特尔表示,它没有某种协处理器,而是具有完整的英特尔架构可编程性。



留下回复


(注:此名称将公开显示)

Baidu