的意见

边缘AI推理的挑战

训练和部署CNN解决方案时的常见陷阱，以及如何避免它们。

2021年7月1日-通过:Vinay梅塔

将卷积神经网络(cnn)引入您的行业——无论是医疗成像、机器人还是其他一些视觉应用程序——都有可能实现新功能，并减少现有工作负载的计算需求。这是因为单个CNN可以取代计算成本更高的图像处理、去噪和目标检测算法。然而，在我们与客户互动的经验中，我们看到了同样的挑战和困难，因为他们将一个想法从概念转化为产品。在本文中，我们将回顾常见的挑战，并解决一些可以在边缘AI应用程序中平滑开发和部署CNN模型的解决方案。

利用现有模型

我们看到很多公司试图从头开始创建模型。但是，几乎每个应用程序都已经有了现有的模型，因此与其重新发明轮子，不如从基于这些体系结构之一的网络开始通常要容易得多。此外，从一个已知的模型开始将减少为应用程序训练模型的时间、数据和精力，因为可以在一个称为“迁移学习”的过程中重新训练现有模型。“例如，与其试图定义自己的姿势估计网络，不如从OpenPose模型开始，从那里开始处理你需要识别的姿势数据。同样，如果您试图执行对象检测，YOLOv3等解决方案提供了一种计算简单而直接的方法，可以在对数据集进行重新训练后完成工作。

简单的模型很有效

对于大多数应用程序，事实是您不需要最新最好的CNN体系结构。例如，如果您的应用程序只需要非常确定地检测几个不同对象之间的差异，那么即使是YOLOv3 unaugmented这样的简单检测器也可以完成您需要它完成的任务。同样，如果超分辨率或图像去噪是你的最终目标，你可能只需要一个10层网络，每层过滤器少于64个。一旦客户意识到他们的应用程序可以用比前沿研究简单得多的模型来解决计算复杂性的一小部分，他们就会受益匪浅。我们的目标是不让向cnn的迁移变得更加困难。

早期集成量化

量化一个模型从多字节精度(如FP32或BF16)到单字节可以成倍提高推理速度，而精度几乎没有下降。然而，许多客户在量化他们的模型时遇到了麻烦，因为它在训练和模型创建过程中增加了步骤，这可能很难实现。例如，PyTorch和ONNX等框架公开了它们自己的量化模型的方法，但它们并不总是彼此兼容。Flex Logix已经帮助客户导航不同的量化选项(例如，静态、动态、训练感知)。主要的收获是，您应该与您的方法保持一致，并从开发模型的一开始就以量化为目标。

结论

大多数客户在尝试将cnn引入他们的行业时都会遇到同样的问题，但Flex Logix可以帮助缓解过渡并释放应用程序中AI的潜力。使用已有的模型，为应用程序优化模型，并尽早量化工作负载将帮助您运行应用程序，并为客户交付额外的价值。

Vinay梅塔

(所有的帖子)
Vinay Mehta是Flex Logix的推理技术营销经理。

边缘AI推理的挑战

利用现有模型

简单的模型很有效

早期集成量化

结论

Vinay梅塔

留下回复取消回复

技术论文

热门文章

向小芯片进军

启动资金:2022年11月

高级节点IC应力影响可靠性

异构超低功耗RISC-V SoC运行Linux

让尖端节点的芯片产量更快

知识中心
探索实体、人员和技术

相关文章

芯片设计随着基本定律的失效而转变

新一代晶体管有什么不同

定制的硅响尾蛇芯片设计生态系统

所有的半导体投资都去了哪里

芯片架构的基本变化

EDA的下一个化身

内存设计如何优化系统性能

为什么地理围栏将启用L5

赞助商

最近的评论

关于

导航

与我们联系

边缘AI推理的挑战

利用现有模型

简单的模型很有效

早期集成量化

结论

Vinay梅塔

留下回复取消回复

技术论文

热门文章

向小芯片进军

启动资金:2022年11月

高级节点IC应力影响可靠性

异构超低功耗RISC-V SoC运行Linux

让尖端节点的芯片产量更快

知识中心探索实体、人员和技术

相关文章

芯片设计随着基本定律的失效而转变

新一代晶体管有什么不同

定制的硅响尾蛇芯片设计生态系统

所有的半导体投资都去了哪里

芯片架构的基本变化

EDA的下一个化身

内存设计如何优化系统性能

为什么地理围栏将启用L5

赞助商

通讯注册

受欢迎的标签

最近的评论

关于

导航

与我们联系

知识中心
探索实体、人员和技术