目标和裁剪eFPGAs

Achronix首席执行官0在定制的新水平,如何跨越了不同的市场,为什么嵌入式编程变得更受欢迎。

受欢迎程度

总裁兼首席执行官罗伯特·布莱克Achronix,坐下来与半导体工程讨论什么变化在嵌入式FPGA的世界,为什么新级别的定制是如此重要,难度水平实现嵌入式可编程性。以下是摘录的讨论。

SE:有很多方法可以去创建一个芯片,但是许多协议仍在发展。一些市场的新,而其他人则喜欢汽车和工业大大改变。对于他们中的许多人,有很多的不确定性,协议或哪个版本的计划将获胜。这是怎么打到eFPGA世界吗?

布莱克:这就是我们看到的问题。显然,需要得到更好的效率计算,并简单地添加更多的核心并不一定会解决这个问题。 你不能让他们走的更快,因为他们太饿了。所以你需要一个不同的平台,会给你一些灵活性,因为未来很不确定。

SE:你看到的增长?是离散或嵌入式fpga吗?

布莱克:你会看到增长。你仍然会看到加速器连接通过作为PCIe或CCIX(缓存相干互连加速器)或OpenCAPI(打开相干加速器处理器接口)的任何其它接口标准,可以用来把加速器计算环境。当一个人开始考虑嵌入技术,然后他们可以提高一个数量级,延迟带宽。

SE:因为都是坐在同样的芯片吗?

布莱克:是的。你不想去通过一个狭窄的管,你必须排队和序列化/反序列化如果你感兴趣有非常快的计算。就像在CPU架构缓存。随着时间的推移这些进化的原因是你想要的CPU结构和内存之间非常紧密的耦合结构。也是如此,如果你想做加速度。你不想把加速器远离计算资源。你想要那些非常接近,因此当你发出请求周转时间是非常快的。

SE:任何反馈而言,它很难使用一个eFPGA吗?

布莱克:没有什么不寻常的。你看到恐惧任何人当他们尝试新事物,其中包括没有前一个FPGA集成。就像将一个内存块。有一个接口,这是一个自定义块,输入/输出端口,它有时间你必须满足。一段时间后,他们开始看到,从集成的角度看,它有更多的相似之处添加内存结构的物理实现asic。软件元素的添加复杂性,但是工程师们很快意识到他们熟悉如何使用软件工具在一个单独的包。里面不是非常不同。这是一个学习的运动,但它仍然是一个相对简单的过程。

SE:“啊哈”当一个工程师找出他们能做什么?

布莱克:人们非常习惯与传统的CPU环境你能做什么,但不同的是,他们不熟悉这种30 x或50提高计算性能,这是正确的去。

SE:你如何看待这个推出不同市场?

布莱克:我们看到的空间最感兴趣的是任何一种数据中心计算和计算边缘的新类。高性能计算具有非常低的延迟,所以这可以适用于任何应用程序需要紧密连接计算。它提供了不同级别的能力,无论是延迟和性能,在一个非常不同的价格点。

SE:数据中心或云吗?整个云的前提是灵活性。

布莱克:这是两个。然而,最初的是云计算资源,这些都是作为一个服务。

SE:任何其他市场?

布莱克:是的,无线基础设施是另一个。如果你看一下5 g推广,有大量的不确定性的标准将如何演变。公司非常关注建筑soc这个市场没有能否经得住时间的考验。他们需要灵活性和嵌入式FPGA是最理想的方法。这是一个集成,成本和功耗玩。它只是一个适合这个空间。三分之一增长市场为嵌入式fpga是网络,它包括任何top-of-the-rack切换。当你得到这些多个10 g links-10/25/100G-the经典计算CPU环境跟不上。周期的数量得到从3 GHz机不匹配的数据率。你需要更多的灵活性,无论是新级别的加密加密或深层数据包检测从CPU将这些功能。 The acceleration sits between the network interface and the CPU resources to be able to pre-process or screen or encode/decode.

SE:机器学习,更多的是一种水平技术?

布莱克:空间是非常有趣的。有很多兴趣GPU的学习/培训阶段的机器学习GPU的体系结构。但如果你看看它的推理片,变量精确定点,这是理想的fpga。已经有很多研究认为语音识别一比特的算术就足够了。如果你做图像或视频处理,一些网络是8位的精度。但一些碎片可能不到,和一些可能更。现在你有了这个基本问题的深度和网络的组成发生变化。这是变量精确算法。如何构建一个架构,可以跨越?FPGA-like架构可以从1比特宽32位宽,实施任何中间。

SE:颗粒如何得到的?

布莱克:我们推出一个新功能,将使我们能够做一些戏剧性的改善效率。通过添加新块嵌入式FPGA结构我们可以定制资源在这些街区。这将使一个戏剧性的对死亡的影响大小、功率、性能和吞吐量。

SE:这总是eFPGAs的承诺。有什么不同吗?

布莱克:逻辑和内存加速器的主食。但是如果你开始配置不同的工作负载,你会发现某些东西出来的重任。例如,你可以用/使用大量的资源积累,或者你可以大幅改变资源利用定制的数量。我们看到,企业想添加更多的定制嵌入式FPGA内部结构,我们开放在过去只是我们内部的能力。


图1:硬件加速器的必要性。来源:Achronix

SE:这听起来不容易从设计的角度来看。有一个陡峭的学习曲线吗?

布莱克:在软件世界中,人都熟悉分析代码,找块被使用最频繁,然后优化和改善。我们要做的是分析的加速器。我们发现某些事情可能是有益的,如果他们被硬化。我们将与终端客户合作。我们的一些终端客户有专业知识和知道他们想加速。这样他们可以定制。在过去,你可能会改变列的数量和资源。现在我们添加另一个维度,你添加一个或多个加速器密切匹配他们想加速的应用程序。

SE:让我们回到目标市场。还有其他市场您的目标吗?

布莱克:是的,我们呼吁任何人做任何形式的非结构化文本匹配。如果我在看数据库加速度,也许我想数据库中匹配你的名字与一些属性,看看有多少实例。在最低水平,有一个二进制字符串,我想匹配。在某些情况下,这不是一个完美的匹配,所以你寻找最佳匹配。

SE:像一个高斯分布?

布莱克:是的,你怎么做?在一个可编程的架构可以实现许多实例,简单地运行它们所有的并行。这些东西不一定适合GPU环境中很好,因为这是一个非常非常不同的工作负载。

SE:这是一个大数据类型的方法。

布莱克:是的,这就是为什么用edge-based计算块,人们看着挖掘数据看看他们可以获得什么样的见解。

SE:工业控制和工业物联网呢?有一个合适的吗?

布莱克:是的,有。这是一个经典的空间fpga和控制算法。在一些空间,你有适应微控制器或cpu性能水平,在某些情况下,这些东西足够实时需要可预测的实时响应。这需要你更多的汽车类自动化,现在你需要瞬时可预测的性能。

在汽车SE:你做什么?

布莱克:这对我们来说是一个新的空间。但是考虑到融合不同的感官和解释数据的能力在许多不同的有点惋惜雷达和摄像头,但声音和运动detectors-embedded fpga可以帮助你作出预测关于什么类型的控制车辆的需求。这是需要一段时间,因为在汽车等有严格的要求。

SE:你挑选其他的程度?

布莱克:我们必须非常精确。我们会选择仔细道路的成功,我们已经与先前的产品。基本的市场我们有都是相关的。另外,汽车公司想知道更多关于嵌入式fpga能做什么。但在那个空间,挑战是建立一个产品和满足这些产品的可靠性约束,这就需要我们在这些领域的投资。

SE:支持基础设施,工具,这种结构的测试用例依赖的地方很多次?

布莱克:如果你把它从使用模型的角度来看,如果我们建造这些面料,我们走的道路是建立一个加速器编译器。我们不知道什么样的资源,但我们知道有些加速器符合5 g无线空间,CNN中的某些适合更多的空间,和某些东西适合深层数据包检测和处理以太网流。我们有能力构建一个适应加速器织物的不同的市场以非常快速的方式。旁边,块是至关重要的,因为你需要的工具提供的工具,使集被编程。但这是我们的基本业务。这就是我们做的。从测试和生产的角度来看,我们必须能够测试这些结构。在发现测试fpga是不简单。但是你有一个可编程的织物,可以生成任何一种结构。自检的能力是一个巨大的好处。 As a customer embeds those functions and their ability to then test those, we supply all the test vectors for manufacturing test.

SE:哪里,开销的性能和权力吗?

布莱克:它是最小的。这是开销的百分比。

SE:你进入至关重要的市场。任何关于可靠性的问题,因为这是一个新技术?

布莱克:一般来说,这些产品已经被用于相当高卷,数以百万计的意义单位。在这样的空间中,有一个期望,这些产品将在24/7。可靠性有很高的要求。

SE:谁是最大的竞争机器学习和人工智能吗?

布莱克:竞争是不同的。你显然有现有的FPGA的球员。此外,还有gpu,获得了大量的注意力在机器学习的学习阶段。但更大的市场是在推论方面,和这些产品的成本和功耗是至关重要的。这就是为什么嵌入式解决方案的空间会有吸引力。

SE:你做了任何权力和eFPGA和ASIC的性能比较?

布莱克:同样的比较可以是这样的:在过去的人看着一个FPGA转换成一种低成本的ASIC,因为节约成本。世界上,我们会说,‘我做一个FPGA设计原型,并最终和我要变硬的原型,因为它不会改变了。储蓄多少我可以转移到一个ASIC吗?在一些情况下,如果你建立一个函数没有更多的变化,你可以找到一个5 x成本结构改进,根据复杂性。范式转换是可编程序逻辑,或者这类可编程结构,被视为开销让你进入市场。但你从来没想过要用这些长期,因为一旦你让他们投入生产你不想改变它们了。从那时起已经有了根本性的改变。CPU、DSP或GPU进行编程以同样的方式的开销FPGA-like结构带来的开销。一个新的需求是它可以不断重新编程。

SE:任何计划创建一个平台吗?基本上你可以开发你自己的可编程的织物和别人可以添加秘方或函数等等。

布莱克:我们仍然要构建自己的硅。我们将构建包这些加速度函数部分。有人在董事会层面可以使用它们。但我们也有客户想要在一个包中。在这些情况下,我们生产芯片或许可他们制造的芯片和包访问的组件。第三块是把它放在相同的死亡。

SE:权衡是什么?

布莱克:在某些情况下,可能更有意义整合在包级别比死的水平。有一个非常复杂的经济形势是否去on-die或于。如果你想要最高的带宽,延迟你on-die最低。但是如果你建造一个大型SoC,把一个加速器,提供一个芯片上的经济学。与一个包你在权衡带宽和延迟。取决于有人想解决,我们可以提出一个死,我们可以提出一个chiplet解决方案,或者我们可以去插入器或有机硅衬底。



留下一个回复


(注意:这个名字会显示公开)

Baidu