系统与设计
的意见

领域特定的处理器支持超过摩尔

获得更好的性能通过创建一个处理器核心使用自定义指令的目标地址的瓶颈。

受欢迎程度

上个月是55th周年戈登·摩尔的著名论文让集成电路填满更多组件。他的长远趋势在集成电路硅使用先后实现更小的特征尺寸。这篇论文以来,集成电路开发人员一直在依靠他的三个预测:

  1. 每个芯片的晶体管数量呈几何级数增长。
  2. 时钟速度呈几何级数增长。
  3. 每个晶体管的成本递减指数增长。

这些预测在很大程度上适用于近半个世纪,使一代又一代的处理器通过更复杂的处理器达到较高的计算性能和更高的时钟速度。这些改进主要是通过通用处理器中实现新技术节点。

从大约2005年,提高时钟频率开始平整,导致停止单线程性能。从那时起,使用多个核心在一个死亡已成为家常便饭,但是这些核心主要是通用的,是否应用程序处理器或单片机。

如果你正在设计一个芯片和一些性能挑战,你只需遵循摩尔定律和进入一个小硅几何和使用通用的处理器核心?这可能是一个昂贵的方法因为工序成本更高的小几何图形。同样,你可能不会实现你的性能最有效的方法。

许多嵌入式应用程序包括加密、DSP、编码/解码或机器学习。这些操作通常通用核心上运行效率低下。例如,伽罗瓦字段通常用于加密,但是需要许多时钟周期乘法操作。

因此,如何处理计算瓶颈?在极端的情况下,实时处理视频数据,也许是有意义创建专用的计算单元来处理一个狭窄的范围的计算密集型操作。然而,这可能不是最好的交易。

它往往会是理想的运行计算密集型操作和其他嵌入式功能在同一处理器核心。理想情况下,大多数silicon-efficient处理器实现将针对您的特定应用程序。

这可以通过创建一个处理器核心,自定义指令的目标地址的瓶颈。添加自定义指令不需要昂贵的硅资源。例如,Microsemi创建了自定义为RISC-V-based音频处理器DSP指令产品:他们定制的Bk RISC-V处理器交付4.24 x的性能原始RV32IMC核心但只需要在硅谷地区增加了48%。此外,代码尺寸缩小到原始尺寸的43%1

所以你怎么能有效地实现自定义指令?同样重要的是,你如何确认他们是正确实现?未来我们将参观这些话题的帖子。

1丹Ganousis &维贾伊安,为物联网的应用程序,实现RISC-V设计自动化会议2017



留下一个回复


(注意:这个名字会显示公开)

Baidu