热芯片2009:这都是多核和低功耗

改变焦点突显出根本问题在处理器设计先进的流程节点;解决方案和创新是关键。

受欢迎程度

由Pallab Chatterjee

处理器的游戏改变了。现在的目标是数据吞吐量,而不是更高的兆赫和更多的瓦。

这种转变主要本周热芯片会议上演讲。在前几年,主题是单核性能更高,更多的权力和较小的几何图形的过程。今年全是多核和multi-power选项的现实过程技术,经济保持没有高功率密度设计融化硅和package-begin。

新服务器平台在企业领域的目标是多核多线程处理器高速multi-chip数据总线。AMD Opteron处理器的家庭,例如,现在包括新的“Magny-Cours。“这是一个双工位MCM的配置45纳米SOI伊斯坦布尔六核的处理器使用灰狗体系结构。它有一个64位核心4 x 6.4 gt / s超传输接口和一个新的低功耗DDR3内存接口。

死的核心体系结构(见图1)包括一个分布式L2高速缓存的六核的单位,一个共同的L3缓存,然后集中的DDR内存控制器接口。

图1

图1

MCM最后确定的双工位配置(参见图2)是一种新的处理器优化为企业通过支持2 p / 4 p配置在一个标准的机架单元。它可以支持高速DRAM访问而不需要缓存探测其他核心的地位。

图2

图2

英特尔强调" nehalem - ex "企业的架构的处理器。这是45 nm制程8核处理器四个QPI渠道和DDR接口。类似于应用程序通过AMD的部分加以解决," nehalem - ex "是针对减少延迟和数据吞吐量最大化没有提高时钟频率的部分。模具图(见图3)显示了由8个核心,分布式缓存和一个共同的“uncore”区。芯片两侧QPI和SMI接口。

图3

图3

减少内存延迟DDR3通道有两个环协议的分布式LLC缓存和调度程序能够支持32同时请求(参见图4)。

图4

图4

使用QPI接口允许死亡之间的高速通信和可能导致非常高的线程和核心服务器模块(见图5)。这个配置包含八套接字和四芯片I / O中心支持。

图5

图5

TI OMAP处理器,多媒体核心设计功能的分布式处理和高速内存接口。多核处理,它是一个大型结构模拟和数字模块。这个芯片架构优化的标准函数,non-graphic内容创建任务。它特性两个皮层A9核心,两个皮层M3任务处理器,和64 x-lite通用DSP核心。支持的处理器核心和多媒体(音频和视频),一个芯片的电源管理和调度功能是确保未使用部分关闭。

Nvidia提出了主题的新用途GPU通用数据处理引擎。该公司提出了一个高性能的平台,在以后的章节中,高管提出了最低配置引擎和填补PC特性集集成电路称为离子。现在的离子可以作为一个选项为小格式嵌入式pc和英特尔Atom处理器作为同伴的筹码。离子处理器硬件和软件特性电源管理控制。这包括在核心的软件打开或关闭方面块没有被绑定到一个基于固定的时钟时间的应用。在这个场景中,功率调节是基于数据的,而不是基于一个固定的任务。

第一天继续附加在英特尔处理器应用程序和更多的细节设计,包括多核处理器架构。这些设计与嵌入式缓存的共同趋势是注重交换和封闭的未使用的块。

第二天会议的亮点是IBM Power7处理器的引入,SOI eDRAM monolothic 45 nm制程工艺设计与八个核心和32个线程/芯片。设计特征与一个集中分布的L2缓存L3缓存和一个共同的DDR3接口。而不是QPI接口,它有自己的指令预取为高带宽通信接口。应用程序和4芯片设计是针对标准单模拉MCM模块计算密集型数据中心。硬件的应用程序架构支持多达32的芯片(8四反水雷舰芯片)在一个单一的配置和内存结构。

讨论的所有处理器和芯片显示他们的低功耗特性。包括标准,synthesis-able低功耗方案的多个同步时钟路径根据主人,封闭的权力,在软件的控制下多模和省电功能,降低操作电压的核心与I / O。没有真正的创新投入的定制电源处理解决方案架构,就已知的解决方案的广泛使用过去的几年里。这一趋势似乎是多核和multi-die数据传递作为第一目标;后发现,那么广泛权力处理将得到解决。GPU的计算引擎使用不同的电源/性能曲线的标准多核引擎和它的力量解决方案最终将提高在不同方案下路径产品前进。



留下一个回复


(注意:这个名字会显示公开)

Baidu