对称多处理已经关注,但未来收益将要求其不为人知的相对的。
当我们听到这个词“多处理”,我们经常把它和“对称多处理(SMP)。“这是由于SMP的最初的患病率在高性能计算的世界里,现在在x86 / x64服务器和个人电脑。然而,多年以来,SMP的扩展能力表现核心数量的增加是贫穷。在SMP(有关更多信息,无法很好地伸缩,读杰克Ganssle 2008 embedded.com的文章,“Nulticore效应”,或者IEEE /桑迪亚实验室的文章,“超级计算机多核是一个坏消息:添加核心减缓数据密集型的应用程序”)。
处理器公司服务于移动和消费电子市场避免了纯粹的SMP的解决方案,实现了非对称多处理(AMP)架构。AMP的一个例子是一个移动电话调制解调器基带SoC,其中包含一个ARM处理器和DSP处理控制和信号处理,分别。我们也看到AMP架构在今天的移动电话应用程序处理器,通常有多个CPU核和单独的离散图形核心,核心视频核心,音频和影像核。
电池的尺寸和热驱动不对称多处理在移动设备上。
移动世界一直被迫使用“最好的核心工作”,因为限制的电池尺寸和散热。所以架构在流动性一直从基线的期望创建异构核心AMP。
这是在服务器和个人电脑市场相比,具有相对无限的(至少相比,移动电话)的功耗和散热能力。在这些市场,它总是容易添加更多的相同类型的核心,连接使用缓存一致性和重用遗留软件上运行。
事情开始变化,不过,SMP的方法开始逐渐消失。例如,对于服务器农场,像谷歌和Facebook,功耗和散热已经成为巨大的成本和环境问题。在电脑空间,我们遇到了一个“GHz墙”,有一个阶跃函数的唯一方法提高性能是为不同的工作负载类型有不同的核心优化。
为什么没有AMP在个人电脑和服务器市场中实现吗?
是很困难的。
在流动的设计,每个异构处理核心,无论是图形、音频、DSP,等等,通常有一个自定义固件和软件堆栈。这个软件必须集成与CPU内核的操作系统,这需要编码工作在操作系统硬件抽象层和司机。
此外,这些异构的核心没有单一视图的系统内存,所以复杂的同步方案通常是用硬件和软件实现。上下文切换和抢占难以实现。最重要的是,每一个核心要求专家程序员代码,熟悉的人在一个特定的核心的指令集和工具链。因此,在相对不对称多处理繁荣closed-to-developers / isv流动和消费电子世界虽然SMP盛行于个人电脑和服务器的完全开放的世界。
异构系统架构基础
HSA基金会是一个非营利组织,打算让世界更容易采取AMP架构。
它的目标是:
为了实现这些目标,保险公司将创新提供技术框架和架构来解决以下问题:
HSA如何做呢?
HSA的目标和选择解决的问题是令人钦佩的,但却难以实现。在我的下一篇文章中我将讨论的手段HSA基金会将简化异构处理不对称。具体来说,我将介绍HSA的解决方案堆栈,包括HSA汇编程序,运行时,终结器,和内核驱动程序,以及HSA软件库和中间语言。
来源
Ganssle,杰克。”Nulticore效应。”Embedded.com, 2008年12月8日。
摩尔,SamuelK。”超级计算机多核是一个坏消息:添加核心减缓数据密集型的应用程序IEEE Spectrum, 2008年11月。
Kyriazis,乔治(AMD)。“异构系统架构:技术评审。“白皮书,HSA基金会,2012年8月。
处理器核心的性能图”超级计算机多核是一个坏消息:添加核心减缓数据密集型的应用程序IEEE Spectrum, 2008年11月和桑迪亚实验室。
高通Snapdragon从S4框图http://www.cnx-software.com/wp-content/uploads/2011/10/qualcomm_snapdragon_s4_block_diagram.jpg。
HSA解决方案堆栈图来自菲尔罗杰在AMD Fusion 2012会议上的演讲题为“程序员指南概率的宇宙:异构系统架构”。
库尔特·舒勒在Arteris营销副总裁。
留下一个回复