英特尔的下一步行动

公司进军深学习打开大门,各种各样的新架构,包括瓷砖,先进的包装和更多的定制解决方案。

受欢迎程度

Gadi歌手,英特尔副总裁和总经理的人工智能产品组,坐下来与半导体工程谈论英特尔的深度学习,为什么公司的愿景是远远超出了x86体系结构和单芯片的解决方案。

SE:改变处理器的一面是什么?

歌手:最大的变化是增加了深度学习和神经网络。在过去的几年中,如此快速而深刻的变化,我们试图评估潜在的和我们所做的。但与此同时,你还需要退一步,想想适合与其他互补功能。这是整体转型的一部分。

SE:真正有这是一个识别,你可以开发算法与机器而不是用手,对吧?

歌手:从1960年代,最初的方法是就休眠,直到计算机科学家杰弗里•辛顿和其他人发现了一个更好的方法来处理多层有效地在2000年代早期。大突破,当深度学习被认为是一个主要的计算力,发生在几年前。那时ImageNet显示可以达到在人类与图像识别精度。我们开始看到伟大的语音识别结果。在2015年到2016年,结果开始看好足以成为一个主要变化因素。在那个时候,世界是平的,至少在图像。这是相对简单的图像和简单的、直接的讲话。最的努力被证明是可能的与深度学习所以你可以达到一定程度的准确性或一些组的结果。的方法来创建和证明模型,主要的架构是cpu和gpu。问题的办法之前,c++,像一些前辈的咖啡,CUDA等专有的环境。 It required a lot of expertise and effort in building the compute architecture, as well as in the deployment. In terms of who was involved, if you look at the technology in the field today, those were the early adopters.

SE:自那以后又发生了什么改变?

歌手:在过去的几年中,我们已经看到了未来的深度学习的时代。数据本身变得更加复杂。我们已经从2 d到3 d图像。我们正在与诺华,看3 d细胞显微图像,试图找出潜在的恶性细胞。图像本身是25倍更复杂的数据,但你确定是一个更精致的模型。

SE:英特尔符合这些架构。与人工智能的一个重大问题和深层学习是他们迅速改变,所以你需要一个非常灵活的架构。英特尔计划在这里什么?

歌手:在过去,问题陈述的很清楚。你知道你需要图形芯片或CPU芯片两到三年,和公司竞争有一个已知问题的最佳解决方案。深度学习空间,企业竞争是基于最好的理解问题,因为它的发展。您需要一个架构,能够理解和预测趋势,并准备即将到来的时候在市场全面生产和deployment-not当它被设计和测试。

SE:变化的市场,还是仍然相同的架构?

歌手这影响到方方面面。我们不认为一个架构可以满足所有需求。我们相信胜利的解决方案是一个投资组合的产品显然是与众不同的。所以你有不止一个,但你没有太多。你看看完整的范围从低于瓦到300至400瓦,从推理和培训和紧急毫升,关注吞吐量关注延迟。还有一组不同的敏感性能/瓦特。的值是多少功率效率的解决方案吗?你愿意交换其他东西?这不仅仅是一个从一个实例化的小程度上的不同。有一系列的需求,必须要有一组架构,是互补的。

SE:那些是什么结构?

歌手:有三个元素。其中之一是,我们需要一个投资组合,因为我们的客户要求。你需要从终端设备的解决方案,是否这是一个摄像头或无人驾驶飞机或一辆车,一个网关,聚合点,云或本地服务器。你需要一组解决方案非常有效的在每一个点。我们的硬件策略的一个元素是为投资组合提供互补的体系结构和解决方案。另一个因素是进一步让AI Xeon坚实的基础。

SE:培训或推论?

歌手:让我们开始与推论。至强推论是一个伟大的解决方案。这是一个很好的解决方案。Xeon作为推论并很好解决方案相比于其他产品,它有额外的总拥有成本优势和灵活性。如果你看看Facebook,他们展示了前七个服务培训和推理。

SE:但这是相同的一个电话或一个摄像头在汽车,因为它是像Facebook这样的公司吗?

歌手:这就是为什么你需要不同的体系结构。你想要推测在大数据中心。你可以使用相同的计算推论和其他任务。在低端,这就是我们Movidius架构,在一个瓦特几瓦(英特尔收购了Movidius,使得计算机视觉低功耗处理器,2016年9月)。所以你可以在实时创建音乐。你可以检测早期皮肤癌通过连接(英特尔/ Movidius计算棒)的电话,做非常重要的分析终点。

SE:那么你有数据中心和边缘。第三段你的策略是什么?

歌手:系统集成。当你看系统集成,很多的价值有正确的解决方案与数据移动。一个好的解决方案需要最小化数据移动因为10倍做乘法/积累数据。优化系统和软件栈如何在正确的时间正确的地方的数据是任何解决方案的关键。

SE:这听起来像一个全面改变英特尔。

歌手:绝对,因为当你看改善基本Xeon-we有一个良好的基础,而现在我们有了DL(深度学习)提高VNNI(神经网络矢量指令集)和BFloat 16。在过去英特尔浮点,SIMD向量。我们说人工智能需要一组功能。我们将在x86重要的新功能。我们想为这两种架构提供一个优化的解决方案。这就是我们与Movidius进来,我们会介绍Nervana。这也是FPGA发挥作用的地方。把最好的x86,用最好的架构,加快提高它。然后,观察系统,不仅仅是主机和加速度。这也是内存和网络,集成。 What do you put on die and what do you put on tiles in package? And what do you integrate in the same rack?

SE:所以你看一个平台战略,包括先进的包装。这是英特尔从未做过认真。你如何看待这个上演吗?

歌手:于集成有很大机会采取不同的事物和紧密集成。我们绝对是工作。我们看到了非常高的价值。

SE:一个大的变化在新硬件架构基本上是增加密度的数据,你的每个周期做更多,对吗?

歌手:这是数据压缩,增加了计算的并行性。当你看架构如Nervana NNP(神经网络处理器),这是从头构建的。你处理神经网络,张量。你管理结构。这是思维的基础架构。VNNI,你提供的指令结构能够做计算数组。

SE:还有更多的好处不仅仅是收缩的特性,对吧?

歌手:我们需要什么我们可以从流程。我们一直把设计和架构作为一个向量。‘这是这个过程给了我们什么,我们将利用它。但我们的宪章是驱动设计和架构更高效,更说明每循环。这总是一个向量需要跑得一样快。

SE:但现在你所有的这些作品必须组合在一起。所以事情可能在内存中存储和读取不同。

歌手:是的,你必须把这些数据从内存结构。另一件事,我们需要看到的是如何inter-mix纯粹的神经网络操作和常规之间潜在的代码捆绑在一起。如果你看看发生了很多的工作,它假定很多新的计算需要深入学习。实际上,它需要的是一个更一般的任务,神经网络和深度学习。你需要一个非常有效的神经网络结构。但如果有部分的顺序或更多条件方程,它需要做那些有效。你需要能够从一个到另一个地方。我们解决问题关于如何做神经网络以一种最优的方式在一个真正的解决方案,还有其他的元素,。如果你看看NNP机器翻译或其他类似的拓扑,他们内部的事情,不是单纯的神经网络活动。他们是互补的解决方案的一部分。

有关的故事
大的变化对主流芯片架构
AI-enabled系统被设计来处理更多的数据在本地设备扩展福利下降。
英特尔购买NetSpeed NoC,织物IP
创业成为英特尔的硅工程集团;英特尔转变方向。
安全漏洞在机器学习和人工智能
机器学习的主要目的是使用机器训练其他机器。但是如果有恶意软件或其他的训练数据的缺陷?



留下一个回复


(注意:这个名字会显示公开)

Baidu