禅宗的处理器设计

AMD公司的首席技术官谈论如何实现更多的性能/瓦特和芯片架构是如何变化的。

受欢迎程度

首席技术官马克Papermaster高级微设备公司,坐下来与半导体工程讨论如何保持每瓦特性能改善,新的包装选项,增加关注定制特定的任务。以下是摘录的谈话。

SE:当我们得到更多的物联网,我们必须处理更多的数据,更不用说汽车需要处理的数据和移动非常快,似乎焦点转移性能。人们要求权力或性能,了解他们不希望权力去了?

Papermaster:一件事是根本。大约每瓦特性能、性能在一个给定的能量水平。它影响了从个人电脑和数据中心到物联网设备和手机。你越快完成一个任务,你有更多的性能。一旦任务完成,你可以返回到零能量耗散的状态。更高效的处理可以实现在你的设计,你是提高能源效率。

SE:但通用处理器不需要你需要的无处不在。如何改变?

Papermaster:你肯定需要定制加工任务。如果你看看AMD的阵容,我们有一系列的计算能力。只是在我们有一系列的低功耗处理器,energy-optimized中心他们会有更少的地区,通常不太贵都到添加更多的cpu和利用并行性和更高的效率的核心处理要求更高的任务。他们被设计成节能。的“魅力”你把CPU核心变化,取决于你的应用程序是针对处理器。

SE:架构如何改变你前进,因为它是越来越难保持摩尔定律?

Papermaster:摩尔定律还没有消失。我把它叫做“摩尔定律+”。摩尔定律是一倍的性能,让你的成本和能量耗散是一样的。这是一个经济的声明。经济来自客户的需求仍然存在。我们会对这两种方式。首先,它是在设计本身。你必须做出的设计,从体系结构的角度看,更多和更有效的。我们设计了一个全新的CPU核心,禅宗,从头开始。我们实际上在2012年末开始这项工作,所以我们已经工作了四年。 It takes four years to get a brand new x86, high-performance CPU done. We are right on track. It’s a very modern core and very efficient in terms of driving that performance per watt of energy, and it’s very scalable. We also designed it to work very well with accelerators, like our GPUs. You can add more CPUs if you need to get more work done, and you can connect to GPUs,FPGA或其他加速器。

SE:有什么不同在禅宗与过去你在做什么?

Papermaster:当我们看着禅,我们决定做出改变。我们有一组power-optimized低端的处理器。我们有一个非常高性能的处理器和高端中期范围。在禅,我们想要一个新的和现代的核心在每一个方面,这意味着它可以处理各种工作负载。它有高吞吐量,能源效率和浮点效率。它可以从低端应用高性能的应用程序。完成设计和过程。设计微体系结构,攻击每个元素执行单元,缓存的子系统、调度的各个方面,以确保你是消除瓶颈。技术是双重的。我们利用了新的14 nmfinFET技术。你和finFETs可伸缩性是相当大的范围,因为它几乎没有泄漏。当你关掉clocks-when你不是做积极的工作,你可以得到非常接近于零的能量,和泄漏低于先前的技术。但当你打开时钟和加速你的工作量,你会很快每瓦特性能。

SE:让我们看看吞吐量和如何实现这一点。你如何移动数据内部和外部以较高的速度比过去你在做什么?

Papermaster:与任何微处理器,它是设计一个平衡机。你要看看你所有的执行单元的内部需求。你要看你需要的带宽量以及如何优化带宽和延迟。你管喂养这些引擎有多大?你能多快的移动数据引擎?这是禅宗的CPU设计背后的核心原则。外扩展以及互连世界其它地区。它是一样的内存和I / O。你需要足够的带宽和管道优化你的延迟,以确保你不产生瓶颈。

SE:你要做什么?

Papermaster:我们看我们可以做什么来加速,确保没有瓶颈的执行流。我们已经改善了micro-op缓存,让这些指令进入管道的效率。我们也做了一些效率的减少周期执行的数量虽然我们的执行单元。而言,内存缓存和喂养它,我们优化子系统。我们后退几步,端详着工作负载在哪里。

SE:如何减少周期的数量?嵌入式软件或外部软件吗?

Papermaster:不,是低级的。这是我们禅宗设计师卷起他们的袖子,把创造力来优化他们能得到多少时钟/周期指令完成。你的微处理器流水线的核心工程。

SE:你得到的性能?

Papermaster:我们设定了一个目标的指令每个时钟改善40%在过去的一代。我们今天装运挖掘机,先前的核心,我们在AMD的产品。在2017年初禅宗出来时,它将有40%的改进。你可以得到的唯一方法就是使用的组合设计的方方面面,喂养的引擎,优化发动机引擎本身和提高吞吐量。这些都是三要素的得到改进。那些已经存在的微处理器设计一段时间会说这不是火箭科学。他们是对的,但这些都是杠杆。而是把它分解成数十种你驱动到一个设计特定的改变。

SE:所以在软件方面又发生了什么改变?

Papermaster:我们致力于开源软件。我们有一个,你看看我们的微处理器LLVM开源编译器优化性能得到的CPU。当你看加速器,gpu,我们把堆栈和开源。如果你去www.gpuopen.com你会看到所需要的软件和工具使用我们的Radeon技术加速。

SE:特别是在GPU的空间,你开始使用一些2.5 d包装。适合一切哪里?

Papermaster:我们推出R9机型的愤怒,这是我们另外的产品2.5 d技术。R9机型愤怒和愤怒X,我们拉近了记忆。利用包装技术,我们把成堆的高带宽内存和把它在GPU芯片驻留在相同的硅载体。,极大地减少了我的时间得到记忆,吸数据从内存和放回内存,它节省了巨大的能量。当你移动数据,这是一个很短的连接硅而不是,dGPU(离散图形处理单元)到一个单独的内存单元。

SE:任何计划将这种架构添加到CPU的一面吗?

Papermaster:我们看到HBM在未来的扩展应用程序。最大的司机HBM成本下降。今天它是非常棒的高端独立显卡,而成本下降时,你会看到应用程序外围生长。

SE:内存成本,插入器或在哪里出现问题?

Papermaster:两个。成本降下来一代又一代地在任何技术成熟。卷上去,HBM成本将会降低。这个方法同样适用于插入器。制造卷上去OSAT行业获得更多的专业的包装技术,成本会下降,。

SE:你看到的进化高级包装?

Papermaster:包装和集成以及如何把不同的解决方案放在一起会让我们在摩尔定律的速度性能增加,每18到24个月翻一番。这是一个基本的推动者。它从2.5 d。展望未来,你会看到3 d集成,在那里你可以堆栈更复杂的活动设备在活跃的设备。您将看到新类型的有机包装出来,非常密集的互联,允许multi-chip连接以较低的成本点。这将刺激能够混合和匹配不同的cpu、gpu,加速器,和不同的技术节点。当你得到这种异构的实现发动机与成本效益的集成,使性能效率大幅上涨。

SE:你也可能更快地进入市场和一个定制的解决方案比你现在能做什么,对吗?

Papermaster:当然。当你有单片集成在一个死去,每一个元素,在单片硅必须创建单一的开发进度,优化新块硅。在这样的空间移动,你必须这样做能够达到和大规模的成本点。考虑智能手机、平板电脑、和高容量和低端个人电脑。我的感觉是,这些将保持独立。但你价值链需要更多的调整,它创造了很多选项为客户创建非常优化和创新的解决方案。

SE:真是世界天翻地覆,因为它曾经是高价值的解决方案的高容量。现在看起来我们进入更高的价值,因为我们进入定制或semi-customized解决方案。

Papermaster:有新趋势驱动计算的新时代。在计算方面,大数据分析,你需要的原始数据处理大型数据中心能够为企业提供他们需要的信息。然后有可视化与虚拟现实增强需要难以置信的呈现能够创造新的环境和分析数据以不同的方式或创造新的市场。你会看到全新的这种身临其境的技术的应用领域。这两种数据处理方面,分析能够处理所有这些数据,然后可视化方面都需要高性能。他们将需要以不同的方式放在一起比技术迄今为止。

SE:需要灵活性,对吗?

Papermaster:确实。回想一下手机的时代。我们开始与一些手机,但它不是十分起飞。你有最初的智能手机,然后有一个应用程序成立的世界。苹果创新与删除应用程序在iPhone上,然后其他人也跟着来了。它把爆炸的应用程序。同样的事情也会发生在这些新领域。它将目标开始,但随着软件和应用程序开始成长,你就会看到硬件匹配这些用例。游戏和娱乐可能是一种形式因素。医疗可能是另一组目标形式因素的技术。

SE:安全呢?你怎样对待你?

Papermaster:我们看看安全以一种非常简单的方式。是基本的用户采用这种技术。它是必须的。我们的技术有很强的安全的基石。我们接触这个的方式利用我们的经验和游戏机。我们曾与游戏机用semi-custom技术提供商。考虑他们的业务,你必须保护标题。我们不得不变得非常安全。我们已经与手臂和嵌入式TrustZone在我们的每一个微处理器和图形处理器。TrustZone实现的ARM处理器,AMD元素周围的建筑,我们自己的加密和我们自己的精心设计可控性访问技术。 From the very moment you boot that engine and allow access to element on the chip design, it’s in a controlled secured environment with controlled access.

SE:手臂已经从TrustZone信任链的概念。

Papermaster:这是一个生态系统以外的设备和AMD关系到任何生态系统。信任和安全,我们构建成微处理器从任何消费设备是可扩展的,消费者或商业电脑,直到服务器和网络应用程序。我们提供完整的安全在任何微处理器元素和创建一个应用程序接口,我们可以连接到的其他生态系统。再一次,这是我们的承诺,合作和开放标准。

SE:我们一直遵循相当长一段时间,但是无论它有多好,黑客仍然闯进来。

Papermaster:你不能妥协加密数据时,我们的哲学是基于一个安全的和经过验证的访问,和我们的客户决定当他们想要在一个安全的环境。当他们做的,他们的数据可以被加密。

SE:回到可伸缩性,你如何到达那里?可伸缩的架构吗?是你添加更多的芯片吗?更多的核心?

Papermaster:你可伸缩性是关于建筑师设计,《盗梦空间》的设计。我们设计了禅宗高性能和节能。在我们的测试阶段接近我们的船日期在2017年初。从那里,我们在一开始设计的可伸缩性。我们有一个悠久的历史能够规模的微处理器核我们建立在历史。我们调整了我们的超级交通进一步和出色的可伸缩性当您添加内核。当你看看我们如何连接到其他国家通过I / O,我们有一个非常健壮的I / O历史在我们的设计。可伸缩性和连通性是系统设计的关键要素。

SE:你仅仅使用散装CMOS,或者看一些新材料吗?

Papermaster:这些是散货互补金属氧化物半导体设计。我们与铸造厂紧密合作。当你看到他们的路线图从长远来看,你会看到大量CMOS。你可以看到修补冶金和设备结构,你会看到复合结构需要继续设备可伸缩性。这一切即将到来。它在很大程度上仍是一个批量CMOS的方法,但你会看到很多创新。

SE:摩尔定律的放缓似乎引发了比以往更多的创造力。它不再是一个问题的萎缩。现在是把所有这些旋钮,对吧?

Papermaster:是的。的日子一去不复返了映射到下一个技术节点,知道你会保持领先的竞争曲线。体系结构和设计,以及工艺技术,以及具有创新能力一起连接异构的解决方案。

SE:它,一个架构不适合吗?与我们更多的垂直市场,如医疗,当前体系结构可能不适用。你开始做多个迭代,你没有在过去有什么关系呢?

Papermaster:是有限度的创新结构软件。一次又一次,我们看到一个人有一个更好的方法和全新的架构去解决问题。问题是,当你有小部件,没有软件上运行它。这是一个巨大的任务,软件生态系统。因此,我们利用x86系统的cpu。这是久经考验的,安装了一个巨大的基地。我们的观点是,你需要与软件生态系统密切合作,让他们释放潜能的架构。

SE:这是一个大问题是软件的一个步骤,太遥远。单独的硬件和软件开发,然后他们试图弥合两个。如果他们一起工作,你可以有巨大的改进的性能和效率。

Papermaster:我们看看前面的软件生态系统,我们针对我们回来工作,以确保我们带来价值,生态系统与生态系统。

SE:部分硬件定义软件,但软件定义硬件?

Papermaster:绝对的。过去的日子,你可以在一个角落里,设计一个更好的解决方案而不结合生态系统已经一去不复返了。

SE:你Linaro方面,工作吗?

Papermaster:我们做的。我们正忙于Linaro介绍了A1100 ARM处理器,8核心部门设备和我们提供今天在我们生产混合。我们的观点是,我们欢迎竞争从ISA的角度看。我们专注与禅宗在返回高性能与X86、我们的文化遗产。但是我们之所以把A1100和正在看空间如果手臂起飞,对我们来说并不难主并添加到我们的产品组合。我们专注于X86和我们看臂空间,与Linaro和其他财团。

SE:出售臂软银对你和你的手臂的关系吗?

Papermaster:我们不预期变化。

SE:当你看到了,你最担心你要去哪里,将来是什么?

Papermaster我不担心我是个身经百战的老兵。我经历过很多次的专家说,“接近终结”。这是预言半导体缩放,但我们继续看到半导体的发展能力。你听说的创新的计算引擎。我没有看到尽头的推动创新在我们的CPU和GPU引擎。

有关的故事
CPU、GPU或FPGA吗?
需要一个低功耗设备设计?你应该选择什么类型的处理器?
异构系统挑战成长
如何确保不同类型的处理器将SoC工作。
异构多核头痛
使用不同的处理器系统中,功率和性能,但它却使缓存一致性更加困难。
有多少核心?(第2部分)
扇出和2.5 d将会改变内核执行和怎样使用它们;混合架构演变。
有多少核心?(第1部分)
设计团队正在重新思考正确的数量和类型的核心,他们需要多大,和它们是如何组织的。



留下一个回复


(注意:这个名字会显示公开)

Baidu