嵌入式fpga走向主流?

可编程设备正在被更多的市场领域所采用，但它们仍然没有被包括在主要的soc中。这种情况可能会改变。

2016年10月27日-由:布莱恩•贝利

片上系统采用了许多处理变体，从通用cpu到dsp、gpu和针对特定任务高度优化的定制处理器。当这些选项都不能提供必要的性能或消耗太多电力时，自定义硬件就会接管。但是有一种处理元件很少在主流SoC中使用，那就是芯片FPGA．

在fpga中实现的解决方案通常比任何指令集处理器都要快，在大多数情况下，它们以较低的速度完成计算总能量消费。但是，它们的整体功耗更高，性能比定制硬件慢。此外，由于FPGA是一种固定资源，它们使用了更多的硅面积，因此必须将足够多的硅放在芯片上，以应对被认为是最坏的使用情况。

独立FPGA市场目前由两家公司主导，赛灵思公司而且阿尔特拉(英特尔)。部分原因是他们不仅仅生产芯片。fpga需要一个复杂的生态系统使其可用。这个生态系统与支持处理器所需的生态系统非常相似。从FPGA到eFPGA的转换为这个生态系统增加了更多的复杂性，因为它需要为每个系统定制一个工具链知识产权被授权的核心。

过去，有几家公司试图开拓嵌入式FPGA领域，但都没有成功。那么到底发生了什么变化，这是否有可能成为越来越多的soc中考虑的一种新的处理器类型?

不断变化的风景
要理解为什么eFPGAs这次可能会成功，需要理解整个行业和特定市场内发生的变化。许多市场都依赖于摩尔定律它提供了更小、更便宜、更快的过去产品的复制品，从而实现了更高的集成度和更低的功耗。但这其中大部分已经结束。

在高端市场，产品周期正在放缓。“网络和通信芯片的设计周期很长，通常是在先进的工艺节点上制造的，掩模成本为200万至500万美元。Flex Logix．“问题在于，协议和数据包等标准正在迅速变化。过去，这些芯片每隔几年就会重新设计一次，以跟上潮流，这是一个越来越昂贵的提议。此外，数据中心正在推动芯片可编程，这样它们就可以在系统内自动升级，从而提高数据中心的经济效益，使他们能够进行自己的定制和优化，以获得竞争优势。”

eFPGAs的成功也可能使其他市场扩大。“客户主要是网络和有线基础设施，包括以太网交换和路由应用，”公司总裁兼首席执行官Robert Blake说Achronix．“FPGA的基本可编程特性将用于计算，因此将导致市场规模的大幅增长。这包括加密和解密、压缩和解压、非结构化搜索、机器学习和人工智能。”

FPGA应用程序和增长阶段:由Achroni提供x

与之相对的是小型微控制器。“每种产品的销量都在下降，尤其是在物联网领域，”该公司业务发展经理约安•杜普雷特(Yoan Dupret)表示薄荷．“嵌入式fpga越来越受欢迎，因为人们试图通过增加芯片的总体容量来扩大利润率。这是通过使用FPGA结构创建多个变体来实现的。”

Tate补充说:“微控制器通常有几十种变体，在旧的进程节点中使用不同的串行I/O协议(I2C, SPI, UART等)。现在，先进的微控制器正在转向40nm，掩模成本约为100万美元，可以使用嵌入式fpga有效地进行定制。”

Hugh Durdan，设计IP营销副总裁节奏对此表示赞同。“传统的微控制器市场创造了许多不同类型的设备，每种设备都是根据I/O接口的数量和类型定制的。他们这样做是因为应用程序对成本敏感，而更通用的部件无法承担成本。在0.25微米范围内，这种方法很有效。在0.25微米范围内，一套掩模的成本为5万美元，你可以用一个月的时间制造出一套设备。但这一切都改变了。即使是简单的物联网器件从55纳米到40纳米，因此掩模成本正在上升。FPGA可能是解决这个问题的一种方法。尽管这会增加制造成本，但它会减少可用于许多应用的NRE-one设备，从而节省前期成本。”

独立于预期市场之外，嵌入式fpga制造商发现他们不再以低批量和中等批量应用为目标。Tate说:“嵌入式fpga正在被集成到大批量的SoC和MCU芯片中，并将实现以前不可实现的新应用程序和架构。”

布莱恩•拉米雷斯(Bryan Ramirez)是导师图形他看到了许多他们可能成功的潜在领域。“fpga擅长于数据处理，可以使用大规模并行的应用程序，以及可重新配置性非常重要的任何地方。受益于嵌入式fpga的应用是那些具有异构处理应用的应用。数据中心加速是一个明显的选择，因为通过与主处理器一起运行，可以加速FPGA上的各种搜索算法。eFPGAs还可以与自动驾驶中使用的MCU一起用于视频处理。”

机器学习，大数据
fpga可以发挥作用的一个领域是机器学习，这是目前技术的热点之一。

“我们只是在学习如何制造不需要编程的机器，”at的首席技术官表示超音速．“关于最有效的机器拓扑结构和所需的算术的必要精度，以及介于两者之间的一切，都有大量的讨论。在网络拓扑还处于学习阶段时使用fpga似乎是很有意义的。因此，它们确实需要FPGA的灵活性，因为硬件方面还没有完全理解。”

它们还可以在数据中心发挥作用，在数据中心，数据的爆炸式增长推动了降低服务器供电和冷却成本的巨大努力。

“使用FPGA，你可以在主处理器上实现软件，并在编程到FPGA的硬件中以更节能的方式执行相同的功能，”他说。Durdan。“但算法仍然会定期更新。它仍然需要是一个可编程的软件模型。即使在数据中心，也不仅仅是他们想做什么的算法。他们可能会在不同的时间使用多种算法。”

所有这些目前都是通过一个高端CPU实现的，一个FPGA连接到一个板上的CPU。“微软(Burger FPL2016)和其他公司已经表明，fpga作为协处理器具有显著的优势，但fpga到cpu的连接是一个性能瓶颈，”Tate说。“通过构建xeon + fpga芯片，首先实现芯片与芯片之间的互连，然后再实现单个芯片，瓶颈就被打破了。随着封装和高功率SerDes的消失，性能会提高，成本/功耗会下降。”

将FPGA嵌入SoC结构的最大优势之一是可用的引脚数量。“考虑一个典型的中级FPGA设备，它可能有大约300个引脚，”Blake说。“当嵌入时，可能会有更多的针——大约16000个。尽管它们的工作频率可能较低，但它们仍然提供了一个数量级以上的带宽和更低的延迟。”

当然，这是要付出代价的。温嘉德说:“FPGA在面积上的效率大约比定制逻辑低25倍。“处理器并不比FPGA差25倍。情况可能会糟糕5倍，但这取决于你想要做什么。一个小型嵌入式FPGA有多少等效门?如果它的密度是25倍，而你想要10,000个ASIC门，那么FPGA中的10,000个ASIC门就是250,000个门。我可以在这个领域制造10个小型32位处理器。”

温嘉德补充说，fpga往往希望代工厂能提供最大数量的金属层。“嵌入式fpga也无法逃避这个问题。”

Menta的Dupret对此并不担心。“随着新技术的发展，大多数节点的金属堆栈都相当高，当谈到28nm或14nm时，至少有8或9级。这对于嵌入式FPGA来说是一个优势，因为这意味着您可以通过更容易的路由来减少FPGA占用的面积。”

生态系统
嵌入式FPGA的成功将取决于许多因素，围绕该产品的生态系统是复杂的。首先考虑FPGA IP核要比内存编译器复杂得多。您不仅必须提供所需的逻辑块数量，还必须提供内存数量、形式因素、嵌入式硬核(如dsp)类型的数量，以及希望在其中交付IP的技术节点等因素。这需要一个复杂的工具套件，包括集成所需的所有模型和视图。

布莱克说:“它不完全是一个FPGA编译器，不像你认为的内存编译器那样可以在几分钟内完成。”“但这可以在几周内完成。我们提供的是GDSII全定制IP构建块，以及信号完整性、时序、测试模型和程序以及文档的必要模型。”

供应商也在努力在这个过程中增加最大程度的灵活性。Dupret说:“虽然我们有一个DSP模块，并且正在开发其他更有效的应用程序，但我们也可以使用客户的DSP，并将其集成到eFPGA中。”“这意味着他们可以保持竞争优势，因为他们通常拥有与竞争对手的知识和差异化。”

然后核心的积分器必须能够对FPGA编程。独立FPGA供应商在工具链上的投资与他们在硬件本身上的投资一样多。它需要逻辑合成引擎，地点和路线，测试设计(DFT)方法、计时引擎等等。这些工具链中的每一个都是针对已创建的核心定制的。

只考虑一个可能需要的工具。“有效的合成通常比物理核心本身提供同样多的功率和性能设计优化，FPGA合成通常比ASIC更先进，”David Kelf指出OneSpin解决方案．“考虑到所提供的综合优化级别，对设计逻辑进行健全检查RTL代码是关键。这需要使用专门的等效检查(EC)来处理这些激进优化的顺序性质。事实上，随着这些核心进入ASIC设计，在FPGA上设计原型可能会更加困难。这是因为包含核心的ASIC可能仍在生产中，使得FPGA设计的EC与ASIC本身的EC一样重要。”

如果包含嵌入式FPGA的芯片的最终客户也被允许对其重新编程，则会增加额外的复杂性。

整个生态系统是许多eFPGA提供商发现自己激烈竞争的一个领域。最初，似乎他们的重点是SoC开发人员将进行编程。这是因为所提供的工具链。Achronix的Blake说:“像在编程语言中经常做的那样展开事物，并为这些功能构建并行实现的能力可以提供实质性的加速。”“今天，我们使用硬件描述语言(Verilog而且硬件描述语言(VHDL))，我们提供函数库。这是一个不断发展的领域，随着编写和翻译软件到硬件的语言水平不断提高，这些东西也会得到改善。”

Menta的Dupret对此表示赞同。“我们基于标准HDL，所以这是一个标准的FPGA流程。对于数据中心来说，需要从更高级别的语言开始，并且能够将CPU上运行的内容和FPGA上运行的内容分开。”

许多现有的高级综合(HLS)流还没有针对这些设备。Cadence的Durdan解释道:“随着HLS的出现，用类软件语言编写并将其转化为编译硬件的能力已经取得了很大的进步。”“随着机器学习和神经网络的出现，应用领域变得火热起来。如今，大多数部署都不是采用嵌入式解决方案，而是将FPGA放在处理器旁边的板上。”

结论
这个市场还很年轻，变化很快。布莱克说:“我们现在正处于技术成本的临界点。”在16nm芯片上，你可以集成足够多的功能，以经济有效地将FPGA加速添加到SoC中。”

但这并不适用于所有人。Dupret说:“如果你不需要灵活性或不需要改变算法的功能，那么eFPGA就没有意义。”“标准的设计总是会更有效率。但如果你使用的是密码学或神经网络，在CPU上运行它们的效率相当低。”

但对于必要的工具，或许仍有更多的怀疑。Mentor的拉米雷斯说:“我不相信这在今天是可能的。“这是因为创建有效和可用的实现软件存在困难。我很难看到嵌入式FPGA如何取得成功，除非有一家成熟的FPGA供应商在提供嵌入式FPGA结构的同时提供实现软件。”

这总是另一种可能性。随着成本的迅速下降2.5 d由于FPGA供应商已被证明是这一领域的技术领导者，他们可以推出自己的解决方案，而不会出现一些令人头疼的问题。

有关的故事
为物联网数据海啸做准备
随着互联设备数量的增加，技术挑战也在增加。
CPU, GPU，还是FPGA?
需要低功耗的设备设计?应该选择哪种类型的处理器?
FPGA原型开发取得进展
流行的设计方法可以在第一块硅可用之前进行更复杂的硬件/软件验证。
Menta嵌入式FPGA可编程性
还有什么比开发与处理器IP配套的基础设施更糟糕的呢?也许是嵌入式FPGA所需的工具链。

布莱恩•贝利

(所有的帖子)
Brian Bailey是半导体工程EDA的技术编辑。

嵌入式fpga走向主流?

布莱恩•贝利

留下回复取消回复

知识中心博客

Makimoto的波

高级综合(HLS)

现场可编程门阵列(FPGA)

硬件描述语言(VHDL)

技术论文

热门文章

真正的3D比2.5D更难

围绕小芯片形成的小型财团

不均匀电路老化问题日益突出

技术预测:晶圆制程将持续到2040年

2nm工艺的计量策略

知识中心
探索实体、人员和技术

相关文章

浮点8能解决AI/ML开销吗?

真正的3D比2.5D更难

RISC-V推向主流

围绕小芯片形成的小型财团

选择正确的高带宽内存

RISC-V芯片有多安全?

芯片技术和行业动态即将发生重大变化

启动资金:2022年11月

赞助商

最近的评论

关于

导航

与我们联系

嵌入式fpga走向主流?

布莱恩•贝利

留下回复取消回复

知识中心博客

Makimoto的波

高级综合(HLS)

现场可编程门阵列(FPGA)

硬件描述语言(VHDL)

技术论文

热门文章

真正的3D比2.5D更难

围绕小芯片形成的小型财团

不均匀电路老化问题日益突出

技术预测:晶圆制程将持续到2040年

2nm工艺的计量策略

知识中心探索实体、人员和技术

相关文章

浮点8能解决AI/ML开销吗?

真正的3D比2.5D更难

RISC-V推向主流

围绕小芯片形成的小型财团

选择正确的高带宽内存

RISC-V芯片有多安全?

芯片技术和行业动态即将发生重大变化

启动资金:2022年11月

赞助商

通讯注册

受欢迎的标签

最近的评论

关于

导航

与我们联系

知识中心
探索实体、人员和技术