中文 英语

处理器运行的蒸汽吗?

第二个两部分组成:更多的内核和更快的核心应该是更好。有时这是真的,而不是其他人的。

受欢迎程度

看看这些天任何智能手机,你会发现一些参考的核心设备。这不是核心的数量差异,要么即使时钟速度运行。性能取决于他们是如何利用底层设计,发生的频率,他们分享多少内存,有多少交互之间的核心,利用它们和软件应用程序。

性能是编织紧密围绕一个功率预算,特别是在移动设备之间更多的时间充电是必不可少的,但也越来越插在墙上的那些设备。半导体和完整系统设计的经验法则是,你可以贸易权力的性能,但你不能两者兼得。不那么明显,但同样重要的是互联的速度,处理片上与片外,多少和多少缓存一致性将在所有这一切中发挥作用。设计误会这种平衡可能很多内核,可以夸耀的时钟速度快,但仍然不执行比模型替换为更少的核心和慢的时钟。因此,虽然单处理器不能得到任何更快的通过将时钟频率,有方法的显著改善性能之外的处理器速度。

提高效率
软件虚拟化已成为一种利用更多的内核在设计。它是与性能相关的频率更低,因为它实际上并不加快个人操作。但它可以加快多种操作,有或没有硬件的一些帮助。它还可以沼泽系统在相干问题如果不是正确的架构。

技术优先由IBM在1960年代末来提高性能的大型机通过允许更多的任务被调度simultaneously-gained广泛关注在过去的十年中,提高利用率的数据中心。通过允许任何操作系统上运行的任何应用程序是排队在同一台服务器上使用薄层的代码称为虚拟机和虚拟机监控程序来管理,服务器利用率从低约5%提高到90%。反过来,让数据中心节省一大笔钱为机架式服务器供电和冷却,以及缩小整个机器的内部数据中心的数量。在某些情况下,储蓄以数千万美元。

这种方法进一步完善了“1型”虚拟机监控程序使用一个更薄层的代码运行直接在金属上而不是在一个操作系统的结果是更好的能源效率和性能相同的操作。虚拟化也尤其具有吸引力最近在所有大小的处理器作为一种安全措施,因为它允许将事务相互隔绝。而不是物理分离功能与组件和流程,从来没有真正触摸,他们几乎可以分开,这是一个更少的昂贵的方法。

但并不是所有虚拟化需要做软件。不公开的方法是硬件虚拟化,利用未使用的处理器周期如果他们运行不同的处理器。使它更快,更少的倾向于错误,和更有效,它可以更好的利用处理能力甚至在单核处理器。

“您最大化您的处理器使用利用它,就好像它是一个不同的处理器,”安德鲁·Caples说核的高级产品经理导师图形的嵌入式软件部门。“所以它作为虚拟CPU,但身体只有一个CPU。这是一个领域MIPS(现在的一部分想象力的技术)有一个性能增益。您还可以使用它来最小化同时增加电力和热力性能。”

提高工作每个时钟周期的重大挑战之一是制造商所有类型的处理器。依赖于指令集的一部分,也可以包含的比特数和操作的效率。Synopsys对此MIPS表达了同样的目标,例如,使用一个不同的技术。

“这不仅仅是增加指令,”迈克汤普森说,产品营销经理Synopsys对此的弧处理器。“你可以添加更多的核心寄存器和指定源和目标,你可以把寄存器有单一时钟读写访问。你可以提高性能通过使用虚拟机监控程序性能密度,所以你在同一处理器上运行第二个系统。影响效率的最大化,因为你利用未使用的周期。”

它也暗示16/14nm因为逻辑运行得更快,但至少最初的记忆会慢于逻辑。“有一些方法可以减轻,如更多的阶段来访问内存,”汤普森说。“但是你愿意花多少钱在内存大的司机?”

卸载任务
卸载一些处理的通用处理器的核心方案提高性能和降低功率。这种不同的功能的应用程序利用多核。

“你可以有一个硬关联到特定的核心,或者你可以有一个柔软的亲和力和加载不同的任务处理器可用时,“导师的Caples说。“这样你可以分配一些处理器数量的任务。所以你会得到一个从软件,适用于多核性能,不仅从添加越来越多的核心。”

有多少核心有效取决于有多少他们可以有效地使用。大多数软件线程可以使用两个核心。一些软件可以螺纹有效地使用四核。之外,然而,软件必须做高度重复的任务可以被解析成小块,独立计算,然后重组的最后,在多处理世界是最大的挑战。

“在某种程度上,这是一个问题我们已经处理的诞生SoC——写代码,”说,首席技术官超音速。“这都归结为处理器的能源效率。我们已经到膝盖的曲线使它跑得更快是昂贵的。问题不再是对并行处理器。大概有多少应该使用单独的处理器,以及我们如何可以帮助软件社区使用平台的处理器和不同的指令集。在中间组装,还需要一些变化,你有聪明的调度器移动流程。”

仍有巨大的努力在特定于应用程序的处理器和编译器技术来加快软件为特定处理器。这有助于解释为什么Synopsys对此收购目标编译器技术本月早些时候。

权力和吞吐量
的挑战之一处理器制造商高级节点的吞吐量。记忆和逻辑之间的电线长,薄在每个新流程节点,提高问题不仅仅是性能。选择每瓦特性能的新方程,但有时甚至是不充分的。

“在某些情况下,不仅性能/瓦特,“说伊兰Briman,负责营销的副总裁切瓦。“有时纯粹的性能差距,需要一个特定于应用程序的通用处理器。例如,你甚至不能想象运行LTE PHY(物理层)甚至最快的cpu你会发现无线基站。只是不适合,无论你的预算可能是力量。另一个例子来自于计算摄影领域。最受欢迎的应用程序在这一领域是透镜阵列,在多个- 4 x 4 -传感器同时捕捉图像,然后操纵和融合在一起来创建一个高质量的图像。试图映射等计算到最快的cpu你会发现应用程序处理器将会失败。在这种极端的情况下,这些通用处理器只是缺乏所需的性能,更不用说权力的担忧。”

Briman指出,特定于应用程序的范围从非常低功耗处理器,不间断一直到高性能浮点向量处理器。”最重要的障碍等供应商接受处理器编程和开放的软件开发人员。这些通常是cpu非常熟悉和舒适的工具和ISA。你怎么能让他们使用一组不同的工具,特定于应用程序的ISA和一个明确的重点以高效的方式编码吗?这就是各种自动卸载工具派上用场,有助于抽象的处理器的软件开发人员,一个阶段,开发人员并不需要知道处理器上他运行代码。从他的观点来看,这都是基于arm和实际卸载应用程序特定的处理器自动发生。”

这些被要求更频繁的问题。粒度的设计已经达到了处理器,应用程序,预算的权力。

“你需要打开时钟速度做你需要做什么?副总裁”Aveek问Sarkar产品工程和支持ANSYS / Apache。“时钟速度的决定因素,或者你需要更多的更特定于应用程序的核心,优化它呢?finFET,过渡泄漏电流是不相干的。但是如果你曲柄时钟,你仍然必须处理权力。如果你把电源电压为0.7伏,甚至0.6伏特finFET性能几乎没有变化,但如果你在28 nm,你把它得到显著降低性能。与此同时,如果你推高时钟速度,你否定的目的你想完成什么。这就是为什么我们看到总的趋势为特定功能更多的内核。在过去这是时钟速度。现在是关于功能和特定于应用程序的设计。”

堆叠同死2.5 d3 d——给另一个促进提高吞吐量,更少的内存泄漏,降低I / O能力,提供可以证明是划算的。组件之间的距离短,电线连接是广泛的,它需要更少的能量来驱动信号。但也有一个反向趋势开始成形,。而不是处理器定义软件,讨论在系统公司软件定义硬件本身,以及它如何表现。,这可能证明是一个更昂贵的方法来设计,因为它可能不需要最新的技术来提高性能。十亿年盖茨可能并不重要的硬件设计是根据软件的需求。

在每一个设计的一部分,不过,权力成为限制因素在一个处理器可以运行速度。虽然是有意义的为特定的功能,添加更多的核心处理器本身没有得到更快。只有更多的人,他们都是工作更有效率。这就是良好的工程。但它可能需要很长时间的营销世界想出一个好办法卖掉它。

查看这个报告的第一部分,点击在这里



1评论

[…],可以对半导体的未来产生深远的影响。这些将在第二部分处理的[…]

留下一个回复


(注意:这个名字会显示公开)

Baidu