多核的疯狂

对于智能手机来说,四核真的比双核好吗?这场辩论的双方都提出了一些令人信服的、令人困惑的论点。

受欢迎程度

马克·拉佩德斯著
智能手机和平板电脑正在向新的、更快的应用处理器、基带、图形芯片和内存迁移。

仅在手机芯片组领域,就有大量的选择和设计考虑。有些设备将应用处理器和调制解调器结合在同一个芯片上。有些是单独的设备。此外,架构范围从单核到八核设备。

最重要的是,器件最终将从平面晶体管迁移到finFET晶体管。不甘示弱的是,有几个主要的技术平台可供选择:大块CMOS和完全耗尽绝缘体上硅(FD-SOI)。初创公司SuVolta也凭借其双门2D晶体管获得了一些关注,但到目前为止,它在竞争激烈的市场上仍然处于劣势。

毋庸置疑,整车厂面临着一些艰难的选择和挑战。普遍的看法是,下一代智能手机和平板电脑将需要更多的核心和新的晶体管架构。毕竟,消费者想要更高的性能、带宽和电池寿命。

然而,在现实中,没有一种万能的技术。随着市场继续分化成各种细分市场,比如入门级手机、智能手机、超级手机和平板电脑,不同的架构和技术都有发展空间。

不过,原始设备制造商必须重新考虑他们的设计和产品选择,然后再选择拥有最多内核和常规流程的设备。事实上,手机芯片制造商ST-Ericsson高级计算部门的负责人Marco corno说,有一个普遍且过于简单的信息,即在移动系统中,更多的处理器核心意味着更好的性能。

事实上,手机设计要复杂得多。corno说,决定多核系统效率的因素有很多,比如软件、芯片频率、面积和功率。一般来说,四核及四核以上的处理器对于今天的系统来说可能是多余的,从而给oem和消费者带来不必要的成本。他说:“如果软件可以利用这些核心,那么增加更多的核心是有意义的。”“问题是软件无法利用它们。”

相反,他认为移动平台的最佳解决方案涉及两种主要技术:双核和FD-SOI。与目前速度较慢的四核移动设备相比,双核架构提供了足够的马力,而且效率更高。他补充说,大块CMOS的气体正在迅速耗尽,这推动了对FD-SOI等新技术的需求。

尽管如此,在体积和SOI之间有各种各样的权衡,更不用说从平面器件到finfet的影响。ARM CPU组的项目管理总监John Goodacre表示:“finfet在能效方面的进步相当不错。“不幸的是,使用finfet,我们失去了动态范围。”

多核:事实vs虚构
无论如何,在个人电脑和移动系统的处理器开发之间有一些相似之处。2001年,当时的英特尔首席技术官帕特•盖尔辛格(Pat Gelsinger)宣称,如果芯片按目前的速度扩展,到2015年,处理器的功率密度就能达到太阳表面的功率密度。

当时,IBM、英特尔、AMD和其他公司都在竞相通过提高时钟频率来开发更快的微处理器。当时,英特尔声称其奔腾4处理器将扩展到10ghz,但实际上,散热问题将时钟速度限制在3.8 GHz。

然后,大约十年前,英特尔和其他公司放弃了“兆赫之争”,转而专注于多核设计。这大大强调了核心效率和功耗,但多核也对PC软件造成了根本性的破坏。应用程序必须以并发和并行的方式编写,以便在多个处理器上有效地映射程序。即使在今天,并行性仍然是系统环境中的一个挑战。

在某种程度上,历史正在移动处理器领域重演,至少ST-Ericsson是这样认为的。为了证明自己的观点,这家手机芯片制造商考察了苹果iPhone 4S和iPhone 5的性能。iphone 4S基于苹果的A5应用处理器,其中包括来自ARM的双核800 mhz Cortex A9芯片。iPhone 5基于苹果的A6处理器,该处理器有两个基于ARM技术定制的1.3 ghz内核。

使用Browsermark、Geekbench和Sunspider对iPhone 4S和5的软件性能进行了基准测试。评测是由硬件评测网站AnandTech进行的。

ST-Ericsson从AnandTech的基准数据中得出了两个结论。首先,iphone的双核处理器低于其理论峰值性能。ST-Ericsson表示,就CPU效率和频率而言,iPhone的所有处理器都没有显示出“饱和”的迹象。

其次,iPhone 5的运行速度比4S快。据ST-Ericsson称,这与双核芯片没什么关系,更快的速度归功于“其他硬件优化,比如改进的内存子系统”。

该公司表示,与PC一样,问题在于软件在多核移动设计中的比例不足。iPhone的双核设计也会影响时钟频率,因为系统中的共享资源存在冲突。

现在,市场对四核的需求正在增加。ST-Ericsson的corno说:“有很多关于四核的营销,但四核并没有带来很多好处。”

例如,在Web浏览中,当系统从单处理器转向双处理器设计时,运行速度可以提高30%。但据该公司称,从双处理器转向四处理器时,系统的性能只提高了0 - 11%。

第二个意见
对于多核的争论,ARM有不同的观点。ARM的Goodacre说:“对于多核,我把工作分散在两个核上。“总的来说,指令的数量大致相同,甚至可能更少。然后,我可以开始玩电压的电力游戏。对于给定的工作负载,您可以降低相关核心的频率。”

真正的问题是该软件能否利用并行执行的多核设备。“我们有单线程的应用程序。它们在一个线程上运行得非常好,”他说。“问题是,如果现有的工作负载可以在一个核上工作,为什么我还需要多个核?我们今天真正看到的是很多独立的子系统。这就是我们可以利用双核和四核的地方。这意味着一切都运行得更快、更顺畅。”

ARM将其称为显式并发。游戏和社交媒体这两个蓬勃发展的领域可能需要多核设计。“在用户界面中,在Facebook上上下滚动可以占用4个cpu。在Android应用程序上来回切换是另一个问题。”“当我们观察LTE带宽时,这些管理线程在IP流量方面相当重要。所以,你可能有三个主要的线程,加上管理。所以,四对于设计阶段是合理的。一个保持管理到位。另一个将网络任务放置到位。用户界面和应用程序都需要一个。”

在工艺和晶体管方面也有权衡。Goodacre表示:“通过电压和频率的调整,批量生产可以将功率/性能比降低50%左右。”FD-SOI具有特定的体偏置技术,可以进一步降低电压,同时仍然提供性能。”

当被问及转向finfet时,他说:“finfet的有趣之处在于曲线的陡度大大降低。它扁平多了。在动力效率方面,我没有太多的动态范围,”他说。

为了应对动态范围问题,ARM提出了向异构架构的转变,称为big.LITTLE。今年1月,三星推出了一款基于超大处理器的八核应用处理器。小建筑。三星的Exynos 5 Octa由4个cortex - a15组成,用于处理高强度的任务,而4个cortex - a7用于较轻的工作负载。

“我为什么要用8核?有些线程使用较小的处理器会更好。这便是我们的“LITTLE”核心。实际上,我们的‘大’芯和‘小’芯之间的功率效率相差大约4到6倍,”Goodacre说。

问题是规模是否大。LITTLE最好是散装还是FD-SOI?“FD-SOI使用big.LITTLE能进一步拉伸电压吗?在我们测量之前,这还有待证实,”他说。

在任何情况下,今天的双核架构,结合FD-SOI,是一个潜在的强大组合。ST-Ericsson自己也推出了一款基于28nm FD-SOI的集成双核手机芯片组。意法半导体(STMicroelectronics)负责前端制造和工艺研发的执行副总裁乔尔•哈特曼(Joel Hartmann)表示,FD-SOI部件比批量设备快30%。他说:“我们已经展示了50%的功耗降低。”

一家公司为FD-SOI的争论注入了新的变数。“FD-SOI是一种更简单的技术,”模拟服务提供商Gold Standard simulation首席执行官阿森·阿塞诺夫(Asen Asenov)说。“与批量生产相比,流程步骤更少。”

Asenov说,在32nm/28nm时,FD-SOI中由随机离散掺杂剂引入的统计变异性低于体积。使用FD-SOI,在几乎相同的驱动电流下,阈值电压变化减少了6倍以上,漏电减少了5倍。

意法半导体的FD-SOI技术基于门优先技术。使用门优先的FD-SOI,芯片制造商可以将电压降低到0.7V以下。然而,金标准的模拟显示,28nm的栅极FD-SOI可以使电源电压低于0.5V。

“如果采用金属门优先的FD-SOI,并与28nm体块进行比较,FD-SOI仍然具有较低的可变性。如果能开发出金属栅极涂层,将会带来额外的好处。”“总的来说,FD-SOI有很好的机会提供28nm的低功耗扩展。许多基础设施已经到位。有足够的证据让大型无晶圆厂公司非常认真地考虑转向FD-SOI。”



留下回复


(注:此名称将公开显示)

Baidu