中文 英语
18lickc新利
的意见

语音应用将使一类新的边缘AI芯片成为可能

完全的语音识别将需要基础创新,允许处理以非常高的每瓦性能。

受欢迎程度

语音识别在众多设备中已成为越来越重要的功能。像Alexa或OK谷歌或Siri这样的唤醒词现在已经成为可穿戴设备、智能扬声器、手机甚至笔记本电脑的标准功能。这些设备已经出货数百万部,消费者越来越善于利用这一功能。唤醒词识别功能正在慢慢演变为关键字个性化。唤醒词个性化使用户可以设置自己的词来唤醒设备。该特性的进一步扩展涉及到命令识别。命令识别使设备能够识别数十个语音命令。

语音可以来自各种各样的环境,可能是嘈杂的,也可能是有风的。新兴的语音相关用例处理背景噪声消除,或语音增强,或主动噪声消除。这种用例的一个例子是在后台运行时完全消除吸尘器噪音的设备。一些设备制造商甚至在考虑在设备上启用完整的语音识别功能。具有这种功能的设备将能够倾听用户的问题,理解上下文,并提供答案。例如,你可以问微波炉如何设置才能做出最好的微波炉爆米花,然后这个设备就会返回并描述设置。

语音处理的计算成本很高。语音应用程序的计算范围可以从MegaOPS到GigaOPS(如果没有压缩,甚至更高)。任何支持语音应用的芯片都必须在这些设备规定的性能、功耗和成本范围内提供必要的计算。这为人工智能芯片公司提供了一个新的增长市场。

这些芯片必须克服几个挑战,才能使其成为可持续的长期业务。首先,对于电池供电的设备来说,每瓦性能的限制尤为关键。芯片必须在可用能量范围内提供尽可能高的计算能力,才能有效地处理语音。芯片还应符合性能要求,例如在所需的每瓦性能范围内的延迟。

目前流行的唤醒词检测芯片是基于CPU/DSP架构的。公司如Syntiant新思国际,Ambiq已经出货数百万台的处理器使用CPU/DSP架构。其他一些供应商,如模拟设备使用收缩阵列加速人工智能算法。然而,考虑到半导体节点物理所施加的限制,这些架构要在完全语音识别所需的计算能量范围内扩展,如果不是不可能的话,也是极其困难的。为了达到实现完全语音识别所需的计算水平,可能需要进行一些根本性的创新。新的架构,允许处理在非常高的性能每瓦,如内存中的处理(PIM)或Legandre存储器,可能是必要的。

然后是物料清单(BOM)限制。语音是这些设备的众多功能之一,原始设备制造商必须平衡可用预算和芯片支出。目前还不清楚原始设备制造商是否愿意单独为这种支持语音功能的新型芯片付费,如果愿意的话,价格是多少。这可能会限制这种芯片的平均销售价格(ASP)。原始设备制造商可能会要求以尽可能低的价格获得最大的功能。例如,与相同价格的唤醒词检测相比,完整的语音识别功能可能需要1美元。如今,该行业处于后者的价位。

此外,还存在进化算法的挑战。语音应用程序可以使用经典的、浅层的机器学习算法,也可以使用现代的、更深层的基于神经网络的算法。语音应用程序管道也可能要求支持语音解码/编码和DSP。所有这些概念都是相对较新的和不断发展的。将这些软件算法映射到给定的芯片架构是一个巨大的挑战。压缩和优化以获得最佳性能是一个更大的挑战。

然而,趋势是积极的到2022年,原始设备制造商是宣布产品及供应商资金轮.为了充分利用这一机遇,芯片行业必须克服几个挑战并不断创新。随着时间的推移,我们将知道语音应用是否会导致一种新的AI芯片类别。



留下回复


(注:此名称将公开显示)

Baidu