捕获性能

架构策略的例子得到功率预算的最佳性能。

受欢迎程度

制定最佳性能的挑战对于一个给定的功率预算不是一个新的,但是在许多power-sensitive应用程序,平衡是棘手的,需要复杂的技术。

特别是在许多系统公司的媒体处理器市场阻碍力量,能量和热能的问题。

“这真的不是一个电池的问题,这是一个热的问题,”杰姆戴维斯说,一个手臂研究员和副总统的技术为公司的媒体处理部门。“如果明天有人生产电池,彻底改变你的充电功能,它不会改变我的问题。我的问题仍然是热的预算。大量的客户,他们是热有限——不同数量不同的分类,但肯定在高端,超级电话,那是一个热的问题。”

如何提供额外的性能在同一热预算问题。

媒体处理器业务竞争残酷,需要一批技术策略设计的最高执行gpu最低的权力。手臂的图形处理器,由其设计团队的一些技术包括基于题目的呈现和多核架构。

“我们仍然从根本上相信基于题目的呈现,它不仅仅是,严格地说,将GPU的砖瓦匠。它是一个本地的思考方式在数据保持尽可能的一切,和外部内存带宽最小,”他说。恰当的例子,你可以有10000个浮点运算的能量所需的能量重新加载缓存1。

规定的手臂设计它的gpu。“我们试着让当地的东西。和手臂实际上认为“当地”已经被重新定义。以前当地的芯片/芯片,但现在与硅几何图形的变化我们的晶体管的方式扩展但电线不是——晶体管扩展的力量与力量的电线不是,”戴维斯说。“扩展方程的方法是现在,而不是扩展统一意味着如果你不小心,如果你试着做一些集中,都说,你最终得到的所有电线和芯片收缩不正常。”

和驱动臂所做的每件事,因为他指出的那样,“有人是要构建这个。和机会,因为我们在高容量难以置信的高容量市场的这些新产品,这些都是人们使用新的,现代的过程。”

多核时,戴维斯说这都是可伸缩性和学习伙伴。“他们许可的东西从你,你认为你知道他们要做什么,然后去做一些完全不同的,这是伟大的,因为通常你卖一个许可证,他们离开并构建五个不同的芯片。他们正在试图做的是不同的用例,不同的性能点,通常当他们购买时,他们并不知道他们正在寻找什么。这是一个非常有吸引力的概念。“我可以从这个性能点扩展到这种性能点。我可以从这个区域规模。我可以打这个设备市场,设备市场。我们不想让20 gpu——这将是困难的,所以我们希望可伸缩性介绍我们所做的一切。可伸缩性的核心数量、可伸缩性的设备得到实现。”

戴维斯推荐以下方法优化能源效率的建筑:

做事——不要做两次,一次更好。
——不做原来的事情你不需要做什么。图形是在GPU扔一个荒谬的内容——只有一半的出现在屏幕上。
应用智能你做事的方式会得到非常好的好处,这通常需要重新排序,你做事情的方式。

“如果你不这么做,直到最后一刻,你必须这样做,有可能你到达那里的时候,你发现你没有做到。例如,向前像素杀死缓冲区。我们所做的一大堆东西,把它放在一个管道,它将退出另一端和最终的完成。但实际上,扩大,缓冲区的大小,花上硅增加缓冲和结束时,当你拉出来,说,有什么在缓冲会覆盖这个?是的。好了,不要这样做。那里,你会花一些硅以节省能源,通常,这是你做的权衡,”戴维斯解释道。

最简单的一个是缓存。花上硅缓存,减少内存带宽、内存带宽就是力量。LP DDR-4,大约只有100兆瓦每gb每秒,所以任何你可以刮掉,支付股息。

他指出,手臂现在看着不仅减少了内存的交通,交通也发送质量更好记忆。“如果你发送DRAM内存事务的方式能够更好地转化为LP DDR破裂,那么会节省电力。”

记忆是中央权力的方程,不仅对手臂。弗兰克铁,产品营销高级总监Rambus指出,关键是要保持最低的能量状态的内存,尤其是DDR。包括开关,记忆的能力,并保持它当你不使用它。

“我们跟随控制器的的能力把内存进入低功耗状态,”铁说。“我们将提供所有的钩子和支持的不同能量状态所需的内存,尤其是在LP DDR,但我们也有我们支持DDR多个功率状态。我们允许内存被压制成各种能量状态的基础上,从系统命令。”

曾经是做出这些决定完全由CPU,但越来越多的他们被分散在整个设计。”一方面,内存子系统内最终的CPU,被处理的内存控制器,就是把体育的那些力量,“铁解释道。“这些决定做系统层次。另一方面,在子系统层面,有些事情我们可以做来帮助促进这些转换的速度。”

此外,罗兰Shalinsky, Rambus的战略发展总监指出,DRAM和PHY都必须支持这些不同的权力模式。然后,然后控制器或CPU通过控制器来驱逐的命令,把体育变成权力模式,推动它到DRAM。你必须支持它,那么别人的控制核心,进入它。

”根据界面的PHY和DRAM本身之间的一些接口是更有效率的力量——在切换或力量的数量,用于信号本身,“Shalinsky说。“如果你看看我们的一些专有接口,他们确实试图解决这方面的更高效的信号技术。但是如果你正在寻找在行业标准PHY你连接体育只是一个行业标准DRAM,那么你真的没有一个技巧锦囊妙计。你要坚持标准,像其他的子系统。”

此外,产品营销主管马克•格林伯格DDR控制器IPSynopsys对此说,因为内存可以总功率预算的25%,有效地使用内存,性能和权力——变成了一个非常有趣的话题。“你怎么解决它正确,这样你得到的性能,您需要,但也没有拨号太高?“在DRAM方面特别,Synopsys对此技术在其平台架构师和DDR Explorer工具,允许诸如逻辑地址到物理地址映射以最优的方式,得到了设备的性能。它还允许不同的映射为不同的工作负载分析获得最佳性能的DRAM设备没有抖动它太多增加太多的力量。

”也,我们看它以同样的方式,我们来看看多少工作是在单位时间内完成,并能够优化时钟频率,这样我们不会孵蛋的速度比我们真正需要的,并试图压低的权力。这些技术都是使用系统级模型可用在这些工具,允许人们这样做的分析和优化,帮助找到合适的组合设置的DDR子系统将得到最好的使用的DRAM,”他说。

优化能源
从总体设计的角度来看,主要目标是优化能源而不是权力。原因,根据伯纳德·墨菲,首席技术官Atrenta是,它提供了更多的灵活性,提高性能的一些时间,只要综合能力随着时间的推移在预算之内。

“最基本的架构方法叫做“快然后停止运行,”墨菲说。“你做一些高性能计算在短时间内,然后关闭。如果时间运行状态显著小于时间断开状态,综合能源可以在较低的性能远低于计算时间较长。手臂的大。是这种方法的更精致的版本。你使用大功率CPU的短时间内需要高功率,然后门CPU当你不需要高速,并切换到一个较低的CPU力量。”

一般原则是,很多功能只需要相对较短时间的计算之后,更长的空闲期:为物联网设备常常是这种情况。

“吉姆Kardach FINsix集成产品主管,谁知道一个建筑从他的时间在电源管理英特尔最近观察,设备应设计工作效率,还有效地什么也不做,”他说。“例如,轮询架构燃烧重大能源不必要当什么也没有发生,在一个中断架构将更有效(似乎是显而易见的,但这是一个真正的问题在USB)。所以节能设计的通信协议使高性能在需要的时候,但仍在一个功率预算。”

很明显,越来越多的设计团队都希望减少能源和电力。“特别是在去年,在每一个客户会议,人们谈论减少能源,不仅权力,”维克Kulkarni说,高级副总裁和总经理的RTL电力业务Ansys-Apache。“手臂的大。小策略得到了每个人着迷的跑得快,停止策略,而不是一个连续的低功率的策略。考虑的东西这是影响局部加热芯片。中速连续时钟将增加衬底温度和导致泄漏。一阵计算紧随其后的潜伏期可以让芯片冷却。这是一个战略主要使用在手机应用程序。”

Kulkarni发现RTL权力分析似乎已经成为一个关键系统世界和现实世界之间的这东西可以连接和长大。

另一种方法包括抽象RTL权力模型为了使操作系统和事务级别的决定。这里,Ansys正在与Docea RTL权力的权力,使抽象模型从Ansys工具到Docea Aceplorer工具。“权力政策”可以由系统架构师决定电力系统级分析用例模型。

其他策略包括:
•前计算的共同的价值观,即。0 * N 1 * N, 2 * N,等等,不需要乘法器的活动。
•状态和计数器编码以减少切换。
•内嵌信号编码以减少大电容的切换。
•异步逻辑仍然减少权力和实现高性能。
•基于模拟的开发流,可以真实的场景如固件和操作系统启动,1080 p视频帧数据。

异构体系结构
尽管虚拟平台开发人员“治之没有位置低功耗架构,它的工具被用于估计,使动态分析完整的软件堆栈的影响——操作系统固件程序- soc和系统的能耗,根据CEO。“我们看到,我们的客户所使用的各种体系结构与权力约束。大多数的这些架构的共同点是异构性:使用正确的适当的任务处理器。”

他认为下一步发展的系统架构启用优化处理资源的共享。“我们看到了两种基本的方法。首先是一个架构的异构计算方法,如异构系统架构(HSA)正在开发的基础上,使异构系统的简单编程。第二是使用虚拟机监控程序控制资源分配SoC。这种方法在过去的两年里已得到了显著增强硬件虚拟化的介绍说明手臂和MIPS架构,使虚拟机监控程序的性能和更低功率运行开销比前几代的虚拟机监控程序不依赖于底层硬件。这两种方法互补大于竞争。”

沿着这些线路,Krishna Balachandran产品管理总监节奏说,另一个常见的解决方案是流水线。“你算出管道的深度和多少阶段管道因为你增加吞吐量。你不增加性能每条指令,但你最终不得不把更多的指令通过这个管道。因此输出测量在一段时间内要高得多,这意味着性能。这是一个技术的成功应用,并继续使用勉强功率预算。流水线的优点是,一些管道阶段是不活跃的,或不消耗功率,所以这是一个权力高效技术的定义。”

总结起来,帕特谢里登,虚拟样机产品营销主管Synopsys对此断言方法做这一切在系统层面。“模拟架构在开发周期的早期,你可以看一个架构的性能权衡。也有事情已经被添加到这些方法在过去一年左右的时间,提供覆盖能力模型组件在系统模型中,定义权力状态和数量的能量消耗此模拟时的居民组件状态——这是所有可能与架构原型。”



留下一个回复


(注意:这个名字会显示公开)

Baidu