gpu权力之前

AI, ADAS,深度学习、游戏和高性能计算继续推动gpu进入新的应用领域。

受欢迎程度

cpu、gpu,长一个插曲是世界突然处理器的新星。

他们是第一选择,从人工智能汽车ADAS系统应用和深入学习系统由卷积神经网络。他们仍在高性能计算的中流砥柱,游戏和科学计算,等等。甚至著名的挑战在编程gpu没有停止他们的轨迹,由于更好的编程语言。

增加的GPU计算是非常相关爆炸在并行编程罗伊·金说,加速计算产品领先英伟达。“Going forward,现在已经适用于一段时间,你的处理器性能的方法是去平行对许多人来说,原因有很多。它只是碰巧当Nvidia发现gpu通用的处理,这是在当时很多研究人员和开发人员争相找出如何得到更多性能的代码,因为他们无法依靠单一核心去任何更快的频率。”

大约在2000年代中期,Nvidia gpu完全可编程的远见。最近,GPU计算的深入与人工智能数据中心。虽然仅仅是一个开始的AI gpu,有一些显著的基准,如谷歌的去比赛去它的大师之间的人工智能机器AlphaGo。AlphaGo赢了。

gpu的计算和图形作为一种视觉处理数以百万计的像素在屏幕上,在大规模并行编程水平。市场已发展到不仅包括出售GPU芯片的公司,比如英伟达和AMD但其他人,专门从事嵌入式GPU核心主要针对移动空间,包括手臂马里和家人想象力的技术“PowerVR图形处理器。

在嵌入式GPU空间,手臂与马里GPU芯片出货量稳步增长。2014年,全球出货量芯片包含一只手臂马里图形处理器5.5亿;2015年,这一数字升至7.5亿,同比增长36%。该公司预计今年更高增长。

“我们认为这一趋势的延伸,即硅伙伴解决超级手机/平板电脑市场最新,最伟大的手臂马里GPU,使芯片在使用过程尽可能快,”杰姆戴维斯说,手臂技术部门研究员和副总统的媒体处理组。“他们是热对权力的限制,需要最新的硅工艺的优点。他们适合尽可能多的GPU核心可以在其功率预算实现了最大的性能。其他合作伙伴,解决大众市场,使用更广泛的各种流程和适合更温和的核心,平衡性能与成本。执行速度在设计方面和执行(硅硬化)仍TTM的关键。”

从技术上讲,GPU的优点是相对简单的。“这是一个数字世界——这都是1和0,所以一切都可以通过计算,”戴维斯说。“图形是一个计算问题,我们指定要打印的东西,显示,等等,以一种每像素在屏幕上说,运行代码。对于场景中每个顶点,运行一个不同的代码块。现代屏幕1080 p至少2像素,所以我有200万执行这个小的代码片段。我在现场,可能有300000个顶点,我有该池反复的事情要做。我们说这听起来很像线程级别的并行性,所以我能做的就是运行所有这些小片段程序并行而不是在序列。我们设计一个处理器的处理它的图形处理器。是的,有一些固定的函数,它是把颜色放在屏幕之类的东西。只是作为一个处理器执行这些小片段代码,我们非常擅长并行运行的东西。”

cpu和gpu之间的主要区别之一是gpu不是那么好做一件事在很短的一段时间。

“CPU将谈论多少时钟需要指令,这将是重要的,以及有多少钟才能取回这从内存加载指令,这很重要,”他解释道。“GPU上我们会说其中一个需要多长时间执行并不重要,比起成千上万需要多长时间执行。gpu都是关于吞吐量和并行性,而cpu都是关于一个线程的执行速度。如果你想出了另一个问题空间并行的——如果我可以提取大量的线程,然后运行在GPU可以非常有效。如果你有问题,看起来像运行Linux和响应中断,它将在GPU上运行很差,所以你不能不劳而获。”

实际上,一个CPU很擅长所有的事情。GPU,相反,是很好的在问题空间的一个角落里,戴维斯说。”不可避免的结果,我们没有必要吹嘘,但仍然是科学明显,是有选择的一个角落擅长问题空间,会有角落我们不太擅长。”

在手机市场,gpu通常更关注电力和能源效率比为图形设计的主要任务。

“手臂和想象力会告诉你能够使用GPU进行其他类型的应用程序,它总是一个程度的问题,”说,节奏研究员、IP Group的首席技术官。“这不是黑白,所以他们可以合理地说,你可以用它为其他东西,他们建立了软件工具和编程模型,以便它可以被用于其他任务。但手机是一个与更大的专业化领域,很难被最有效的图形渲染设备和也是通用的越来越多样化和发散的任务。”

再生草说,有时一个处理器设计需要解决一个特定的任务。例子:在服务器领域,谷歌最近推出了其张量处理单元,这是一个逻辑代替GPU在服务器,它说的是关于一个10倍更有效。

“当你知道你通常解决的是什么问题,你可以经常这样做比如果你再利用的东西真的是建造另一个领域,”他说。“是的,谷歌有一个数量级,但他们知道他们的问题,我可以找到一个数量级几乎任何问题只要是明显不同于竞争的硬件设计解决的问题。他们知道他们的问题在神经网络训练和推理,它有一定的计算特性。有些事情需要做好,和其他东西,你发现在你不需要的GPU。算法能够工艺,和能够工艺数据类型,以及能够省去无关的东西在GPU不可避免地给你的东西将是更小、更快和更低的功率比这类事情。如果你想做你的日常通勤,唯一可用的是麦克卡车,你可以开始工作,但大18轮大拖车可能足以携带你的笔记本电脑。所以一个数量级比麦克更节能卡车并不难。你知道你不是带着20吨的货物。”

扩大gpu的机会
这并不限制gpu可以做什么或者他们会结束,然而。Sundari Mitra的首席执行官NetSpeed系统指出,在过去的五年里,我们看到图形的出现是一些特定方面的水平真的极其快速的计算行业需要做什么。

“我们看到,发展和接受的一些神经或机器学习技术,”她说。“图形芯片公司是第一个公司,走进它,意识到他们可以适应图形处理器做更多的特殊功能和分析和自适应行为因为它有利于。虽然CPU公司一直专注于获得更好的规格和数量,图形更关注,“我这么大,强大的东西。让我看看更大,强大的事情我可以做,因为我已经有信封。你已经告诉我,我可以自由分离我从很多低功耗。让我创新的空间,看看我能做什么。“[,]图形处理器有很多创新[,]因此,一些公司正在积极地向前发展,做更多,因为他们没有阻碍。”

她指出,图形公司仍然必须学习的学科其他行业已经忍受。“但他们有优势,这将是有趣的,看看会发生什么。”

一个清楚的是,有更多的人比过去,计算市场和在一块硅。

“把苹果主应用程序处理器核心,举个例子,“肯·布鲁克说,产品营销经理,解决方案组Synopsys对此。“你看,越来越多的地区被gpu。以前有一个,现在苹果A9大约有一打他们,因为你可以在串行并行cpu必须做什么。有更多的多线程cpu,但并行的gpu是建立他们运行在一个较低的频率——有时时钟频率的一半。但同时它们占用了大量的空间,这样你就可以把死。”

布鲁克指出,GPU内存逻辑和约80% 20%。“当你有一个打他们的死,能很快达到芯片面积的实际成本。”

具有讽刺意味的扭曲,gpu
推测在一段时间内,一些算法利用EDA工具gpu可以加快设计了基于gpu的服务器上运行,而不是CPU-based机器。似乎有道理,但不是每一个工具。

“大规模并行计算仍然是路径包含运行时,我们继续在这个方向投资,扩大我们的技术效果很好使用许多核心cpu,”胡安·雷伊说,高级主管工程的口径导师图形。“不幸的是,gpu没有证明真正有用为大量关键EDA算法,虽然他们在一些领域的应用程序被证明是有价值的。”

虽然不适合所有的应用程序——包括EDA,然而,gpu的计算密集型任务的可能性在上升。这一丑闻打击接近半导体掩模优化设计领域,这样的公司d2利用gpu面具数据准备软件通过利用GPU加速的发展。

多少新应用gpu最终是一种投机行为。但至少就目前而言,似乎没有任何短缺的可能性。

额外的资源在gpu上
参观Nvidia的失效分析实验室
从微软研究论文:加速器:使用数据并行程序gpu通用用途
文章从佛罗里达国际大学:一个案例研究在科学应用移植到CUDA GPU

有关的故事
CPU、GPU或FPGA
需要一个低功耗设备设计?你应该选择什么类型的处理器?
如何选择一个处理器吗
没有明确的公式怎么使用,但是有很多意见谁应该作出决定。



留下一个回复


(注意:这个名字会显示公开)

Baidu