系统与设计
的意见

SMP(对称多处理和HSA基金会

对称多处理已经关注,但未来收益将要求其不为人知的相对的。

受欢迎程度

当我们听到这个词“多处理”,我们经常把它和“对称多处理(SMP)。“这是由于SMP的最初的患病率在高性能计算的世界里,现在在x86 / x64服务器和个人电脑。然而,多年以来,SMP的扩展能力表现核心数量的增加是贫穷。在SMP(有关更多信息,无法很好地伸缩,读杰克Ganssle 2008 embedded.com的文章,“Nulticore效应”,或者IEEE /桑迪亚实验室的文章,“超级计算机多核是一个坏消息:添加核心减缓数据密集型的应用程序”)。

kurt1

处理器公司服务于移动和消费电子市场避免了纯粹的SMP的解决方案,实现了非对称多处理(AMP)架构。AMP的一个例子是一个移动电话调制解调器基带SoC,其中包含一个ARM处理器和DSP处理控制和信号处理,分别。我们也看到AMP架构在今天的移动电话应用程序处理器,通常有多个CPU核和单独的离散图形核心,核心视频核心,音频和影像核。

电池的尺寸和热驱动不对称多处理在移动设备上。
移动世界一直被迫使用“最好的核心工作”,因为限制的电池尺寸和散热。所以架构在流动性一直从基线的期望创建异构核心AMP。

屏幕-射- 2012 - 09 - 26 - - 8.26.27点

这是在服务器和个人电脑市场相比,具有相对无限的(至少相比,移动电话)的功耗和散热能力。在这些市场,它总是容易添加更多的相同类型的核心,连接使用缓存一致性和重用遗留软件上运行。
事情开始变化,不过,SMP的方法开始逐渐消失。例如,对于服务器农场,像谷歌和Facebook,功耗和散热已经成为巨大的成本和环境问题。在电脑空间,我们遇到了一个“GHz墙”,有一个阶跃函数的唯一方法提高性能是为不同的工作负载类型有不同的核心优化。

为什么没有AMP在个人电脑和服务器市场中实现吗?
是很困难的。

在流动的设计,每个异构处理核心,无论是图形、音频、DSP,等等,通常有一个自定义固件和软件堆栈。这个软件必须集成与CPU内核的操作系统,这需要编码工作在操作系统硬件抽象层和司机。

此外,这些异构的核心没有单一视图的系统内存,所以复杂的同步方案通常是用硬件和软件实现。上下文切换和抢占难以实现。最重要的是,每一个核心要求专家程序员代码,熟悉的人在一个特定的核心的指令集和工具链。因此,在相对不对称多处理繁荣closed-to-developers / isv流动和消费电子世界虽然SMP盛行于个人电脑和服务器的完全开放的世界。

异构系统架构基础
HSA基金会是一个非营利组织,打算让世界更容易采取AMP架构。

它的目标是:

  • 使异构编程容易、一流的普及补充CPU计算
  • 继续提高异构系统的功率效率(AMP),让它从智能手机到云平台的选择
  • 给市场带来强大的开发解决方案(工具、库操作系统运行时)来驱动创新的高级内容和应用程序
  • 促进增长的异构计算人才通过HSA开发人员培训和学术项目推动学习和创新

为了实现这些目标,保险公司将创新提供技术框架和架构来解决以下问题:

  • 统一的编程模型——今天,CPU和GPU(或其他加速器)核心分别设定,与GPU视为远程处理器。HSA将允许开发人员目标任务并行的CPU或GPU通过编写语言,类似于他们写作时使用今天的多核CPU。
  • 统一的地址空间- HSA支持异构芯之间的虚拟地址转换的HSA-specific内存管理单元(HMMU)。HSA计算引擎将使用相同的虚拟地址空间page-able今天所使用的cpu。
  • 排队——cpu、gpu和其他内核队列任务,通过HSA运行时本身。排队可以在硬件管理,以避免操作系统的系统调用,使非常低的延迟核之间的通信。
  • 抢占和上下文切换- HSA使工作抢占,作业调度和故障处理能力来克服潜在的问题由流氓或断裂过程。

屏幕-射- 2012 - 09 - 26 - - 8.26.43点
HSA如何做呢?
HSA的目标和选择解决的问题是令人钦佩的,但却难以实现。在我的下一篇文章中我将讨论的手段HSA基金会将简化异构处理不对称。具体来说,我将介绍HSA的解决方案堆栈,包括HSA汇编程序,运行时,终结器,和内核驱动程序,以及HSA软件库和中间语言。

来源
Ganssle,杰克。”Nulticore效应。”Embedded.com, 2008年12月8日。
摩尔,SamuelK。”超级计算机多核是一个坏消息:添加核心减缓数据密集型的应用程序IEEE Spectrum, 2008年11月。
Kyriazis,乔治(AMD)。“异构系统架构:技术评审。“白皮书,HSA基金会,2012年8月。
处理器核心的性能图”超级计算机多核是一个坏消息:添加核心减缓数据密集型的应用程序IEEE Spectrum, 2008年11月和桑迪亚实验室。
高通Snapdragon从S4框图http://www.cnx-software.com/wp-content/uploads/2011/10/qualcomm_snapdragon_s4_block_diagram.jpg
HSA解决方案堆栈图来自菲尔罗杰在AMD Fusion 2012会议上的演讲题为“程序员指南概率的宇宙:异构系统架构”。

库尔特·舒勒在Arteris营销副总裁。



留下一个回复


(注意:这个名字会显示公开)

Baidu