中文 英语

ML模型的市场会实现吗?

关于这是如何工作的有很多讨论,甚至还有一些开创性的工作,但没有确切的结论。

受欢迎程度

开发人员正在花费越来越多的时间和精力创建用于各种应用程序的机器学习(ML)模型。虽然随着市场的成熟,这种情况还会继续,但在某种程度上,其中一些努力可能会被视为一遍又一遍地重塑模式。

成功模型的开发者是否拥有一个可以将这些模型作为IP出售给其他开发者的市场?是否有开发人员会使用这些模型?有没有成熟到可以上市的车型?

“从终端客户的角度来看,肯定有很多公司,尤其是在物联网领域,没有足够的时间、精力和资源来培训网络,因为培训网络是一项繁重的工作,”Tensilica AI产品的产品营销总监Suhas Mitra说节奏

至于可能已经准备就绪的潜在领域,“在图像和自然语言理解方面的应用中,预先训练的模型可以开开开合地很好地工作,”思科的物联网、计算和安全产品营销经理Sree Harsha Angara说英飞凌

许多行业观察人士可以预见未来的市场人工智能模型。有些人非正式地说,他们已经就位了。“我相当确定这样的概念已经存在了,”安加拉说。“它可能像市场,也可能不像市场,但现在人们确实在卖模型。”

更正式的市场计划已经在进行中,不仅涉及完全训练有素的模型,还包括可以组装或组合的模型碎片。但是,模型是托管在云端,还是托管在设备的边缘,区别非常大。在后一种情况下,许可证限制可能会阻碍一个有意义的市场。

消除重复
一项新技术的早期阶段往往以大量的重复开发为标志。在硅电路方面,我们坚持了几十年的态度,“我们自己做所有的电路。”然而,在某种程度上,人们开始注意到他们一直在重做电路,而这些电路对芯片的价值并不重要。

例如,如果一个芯片仅仅需要一个PCIe端口来存取数据,这就意味着要研究大量的PCI规范来弄清楚如何做到这一点。对于一个配角而不是主角的芯片功能来说,这将是一个巨大的负担和时间消耗。

这个行业花了一段时间才开始流行起来,但今天电路IP的市场非常强劲。人们普遍期望,如果它不是一个差分电路,如果好的IP可以以合理的价格获得,那么你就使用IP,而不是在电路上浪费内部资源。

我们现在处于早期机器学习(ML),每个人都在发明自己的东西。但某些领域,如视力,可能会开始变得平衡,因为新进入者被证明无法证明比以前的人有显著的好处。

而这种改造并不便宜。英飞凌首席机器学习/音频系统工程师Ashutosh Pandey指出:“如果你从头开始,你可能需要花费几个月或一年的时间,以及数万或数十万美元。“而对于一个预先训练好的模型,有人已经为你做过了,”

我们是否正处于一个训练有素的人工智能模型的IP市场可能开始有意义的时刻?至少有一家公司是这么认为的。但对于这种情况是否会发生,以及市场应该是什么样子,人们有很多看法。

人工智能链中最有价值的是什么?
如果你今天问人们,对最好的人工智能开发最有价值的东西是什么,你通常会得到一个词:数据。“在边缘,我想说训练数据甚至比模型本身更重要,”Angara说。

训练数据是一个巨大的不平衡因素,因为一些大公司拥有超大的数据宝库,而另一些公司则只拥有相比之下看起来微不足道的数据。也就是说,开源数据可以从许多组织获得。在某种程度上,大型科技公司在数据方面的主导地位,是由其他人愿意分享数据来回答的。

另一个问题是,根据定义,人工智能模型是否具有差异化。这些天,他们似乎是。像分类这样的应用虽然很常见,但还没有达到“完全解决问题”的状态。公司仍在以分类的质量来区分自己。

目前还不清楚这种情况会持续多久。像自动驾驶这样的应用程序需要分类,但如何处理这些类将变得更加重要。人们可以想象在不久的将来,人们的态度是,“是的,任何人都可以做分类,但不是每个人都能像我这样处理结果。”

在这种情况下,一遍又一遍地重新设计分类模型没有多大意义。从历史上看,这是一个IP市场可以立足的情况。

市场需要什么?
市场最明显的成果就是模型本身。更好的是训练它的模型和数据,尽管在许多情况下这可能是一个很大的要求。但它在边缘应用中可以用于优化。英飞凌的Pandey说:“如果你想创造出同类中最好、功耗最低的产品,训练数据非常重要。”

不同的公司可能擅长不同的事情,因此能够挑选一流的模型是有益的。GenesisAI创始人兼首席执行官Archil Cheishvili表示:“假设用户想要进行语音翻译。为此,你需要语音识别和翻译。谷歌可能有惊人的语音识别,但它的翻译可能非常糟糕,而Facebook的翻译可能更糟糕。”

因此,在交付产品之前,每个市场都需要一种评估产品质量的方法。评估可能首先意味着查看已发布的基准测试,提供这些基准测试与各种各样的应用程序良好关联。如果没有,或者对基准的信任还没有很好地建立起来,潜在的购买者可能会想要某种方式来证明候选模型适合他们。

另一个需求是需要能够针对特定的应用程序修改模型。转移学习可以使用新数据修改预先训练的模型。但是,模型结构的一些透明度是必要的,以便购买者知道哪些层应该冻结,哪些层需要重新训练。这样的透明度会在一个运作特别良好的模式中暴露竞争秘密吗?

在电路IP中也有一些先例,尽管有点不同。对于像PCIe收发器电路这样的东西,对于给定的实例可能需要许多可能的自定义和个性化设置。这样的模型通常是高度参数化的,因此客户可以调整电路以完全满足他们的需要。

对于AI模型,这并不一定是参数化的问题(理解这里的“参数”与其他AI用法不同,后者指的是模型权重)。但是,创建一种公开抽象内部信息的方法是可能的,例如,在重新训练时确定要冻结的层。在重新训练模型时,工具需要一种方法来尊重这种设置。

购买者还可能需要一些测试数据用于评估模型。通常情况下,训练数据的一部分会被留出用于测试,因为这是确定准确性的方法。有人可能会建议,知识产权卖方可能需要提供测试数据。

这种方法的一个可能的问题是,卖方可能已经挑选了这些数据,因此另一种选择是期望买方提供他们自己的测试数据。这可能会给出一个更可信的结果。它还将减轻卖方提供这些数据的需要。

房间里的大象:免费的东西
一个蓬勃发展的模型市场有一个巨大的潜在障碍——许多模型都是免费的。那么为什么会有人付钱呢?

IP at的战略营销经理罗恩•洛曼(Ron Lowman)表示:“很多时候,模特都是免费赠送的Synopsys对此.“他们的专有部分是训练模型的数据。有些模型被认为是专有的,但如今几乎没有市场接受度,因为到目前为止,客户使用的都是免费模型。”

这就说明了为什么一个市场可能有价值。如果出售的模型是预训练的,prêt-à-porter,买方不需要获取训练数据。如果这种模式是免费的,人们就没有动力去购买。

如果一个模型没有经过预先训练,买方实际上是在为卖方购买一项服务,以便为他们训练一个模型。这对于没有资源进行自己培训的小公司来说可能有价值,即使他们有自己的数据。

“培训对于获得你想要的准确性至关重要,我认为服务公司会说,‘我们会帮助你进行培训。把你的数据集给我们,’”公司推理产品销售和营销副总裁Dana McCarty说Flex Logix

Flex Logix的高级营销总监山姆·富勒(Sam Fuller)说:“它可能很像现在的大多数软件。”“很多东西都是免费的。但如果你真的想要一个解决方案,你就必须花钱请人来解决问题,把它整合起来,因为这真的很难。”

如果一个付费模型需要某种程度的再培训,那么它就会与所有其他需要再培训的免费模型竞争,而且,它更像是一种服务销售,而不是模型本身的销售。

富勒提到了一家取得了一些成功的公司,但其人工智能业务涉及修改服务,而不是固定的模型。“他们是从在田里数羊开始的,”他说。“他们意识到,没有人真正拥有这样做的系统。所以他们建立了系统并进行了调整。如果你想数牛、数汽车或数摩托车,你就点一下,‘我需要一个能做这些事情的模型。’然后他们大概会为你建立那个模型。”

拥抱树还有一个依赖环绕式服务作为收入来源的市场。

这个与免费软件竞争的问题是一个关于市场是否可行的意见分歧。“我不认为人们会为模特付费,因为有太多的模特是免费的,”McCarty说。

基于云的市场
这样的云市场与针对边缘设备的市场在运作上有本质上的不同,一般来说对买家和卖家来说都更简单。“成为云计算或企业的模型提供商或解决方案提供商要容易得多,”腾讯的产品营销、人工智能和软件总监尼克•倪(Nick Ni)表示赛灵思公司.“你不必担心基于边缘的设计的复杂性。你只需要遵守托管规范就行了。”

云中的超连通性意味着,与其直接购买一个模型并在自己的网站上实例化它,卖方的单个实例化可以通过API为买方服务。即使在今天,这种基于api的方法对于基于云的应用程序也是很典型的,毫秒级的延迟对于这样的应用程序是可行的。

买方的应用程序将向卖方的模型发送推理查询,而买方从未正式拥有该模型。业务模式可能有所不同,但它们可能是某种形式的订阅,包括可能根据每个时间段的API请求数量收费。

买家究竟是如何评估模型来选择一个模型的,这很简单,只要允许一些试验推论来获得准确性。为了得到统计上有意义的结果,可能需要安排足够的样本。当候选模型在没有再培训的情况下按原样使用时,这样的评估结果将是最有意义的。

再培训可能由卖方使用买方的数据来完成。这将使评估变得更加困难,因为根据定义,候选模型在再培训之前的最终应用程序中并不好。

此外,卖家可以将他们的模型作为教师模型提供,允许其他模型通过查询教师来作为学生进行训练。这也是一系列推理查询。

Cheishvili说:“我不需要有数据来教这个模型如何识别颜色、框架等等,我可能会和一个学生模型一起工作,它可能只擅长识别框架或颜色。”

多个这样的学生模型可以一起工作,提供的不是完全的同类最佳模型,而是模型的同类最佳组件。Cheishvili继续说道:“如果你想构建最好的图像识别工具,那就寻找真正擅长识别颜色和帧的解决方案,然后尝试将它们结合起来。”“你可以以低得多的成本生产出最好的图像识别功能。”

可以通过一系列API调用将多个模型链接在一起,一个模型的结果将用于后续模型的API调用中。

一个基于云的示例
GenesisAI在云市场的早期尝试实现了一个用于推理请求的标准API。但是,在他们的情况下,这些不一定是预先训练好的模型。在这个有点像赌博的过程中,买家会发布训练数据、最低成功指标和奖励。然后,多个卖家可以通过使用买家的数据来训练他们的模型来竞争。至关重要的是,每个竞争供应商都必须承担一定的风险。

GenesisAI的Cheishvili表示:“我们希望为人们交换数据和交易服务创造一种激励机制。”“他们这样做的方式是,他们不会放弃任何疯狂的专有产品。”

理想情况下,他们中的一个有最好的结果,获胜者收集为比赛张贴的所有赌注。如果没有卖家达到成功的最低标准,就没有赢家,买家将收集赌注。

这就提出了一个问题:卖家会有多渴望竞争,因为失败可能比不赢得交易更糟糕:这意味着失去股权。太多的损失将成为负担。

也就是说,一旦交易完成,将市场的功能与赢得交易的过程分开是很重要的。可能的情况是,竞争交易的手段发生了变化,而不影响已经在运行的模式的功能。

交易达成后,就有了持续的商业模式。Cheishvili解释道:“只要用户开始订阅和处理请求,API供应商就可以从他们的API中获利。“订阅机制可以通过多种方式集成——要么与请求数量挂钩,要么只是每月或每年不限请求的订阅。”

无法获得模型所有权的一个风险是所有者可能会破产,或者出于其他原因将模型从市场上移除。

Cheishvili说:“如果API提供商倒闭了,有两种选择。“API订阅者必须在我们的市场上找到一个替代API来完成相同的工作(很少有API是完全独特的,没有其他API执行相同的任务)。或者,我不排除即将离职的API提供商提供购买源代码的选项。”

边缘模型
将嵌入边缘设备的模型的市场将需要非常不同的工作方式。不可能要求连接到基于云的模型,通过API进行查询。延迟将是不可接受的——没有连接,设备将无法工作。

在这里,买家很可能需要获得模型的实际所有权。一个模型链不需要通过链接API调用来工作,而是通过模型将输出放在系统已知的位置,从这些位置可以将它们用作下一个模型的输入。

图1:在左边,一个边缘设备将需要模型驻留在设备内。在这种情况下,完全所有权的可能性更大。在右边,云模型可以通过API进行交互,而不转移模型的所有权。资料来源:Bryon Moyer/Semiconductor Engineering

图1:在左边,一个边缘设备将需要模型驻留在设备内。在这种情况下,完全所有权的可能性更大。在右边,云模型可以通过API进行交互,而不转移模型的所有权。资料来源:Bryon Moyer/Semiconductor Engineering

在许多方面,这样的市场可以以一种非常类似于电路IP的方式运作。数字版权管理(DRM)功能可以在购买之前保护知识产权,允许在不泄露商店的情况下进行评估。Xilinx的应用商店采用了这种方法。

但这样一个市场有一个主要的问题,即模型是为了钱而出售的,所有权是转移的。这可能会违反任何来自开源网络的模型的许可限制。

大多数熟悉的网络——如ResNet、YOLO和Inception——都是免费提供的,但根据具体的许可证,限制可能有所不同。一般来说,这些许可证禁止直接销售模型或其衍生品。事实上,一些许可要求在类似的许可下通过开源提供任何派生版本。

米特拉说:“如果你采用开源网络并对其进行修改,你就不能为此要钱。”“从技术上讲,它是衍生的,必须被视为开源的。”

因为现在互联网上的很多模型都是从这些基本模型中衍生出来的,如果没有在限制中找到一些巧妙的漏洞,就不可能训练它们,然后直接出售。可以利用模型销售系统,但不能孤立地销售模型。

我们说的是非常受欢迎的网络。“当我们谈论YOLO、ResNet之类的东西时,我们通常是在处理在标准图像数据库上训练的模型。”甚至训练数据也是开源的。

实际上,没有模型本身是有用的。它通常是大型应用程序中整个管道的一部分。这个应用程序可以出售。“人们永远不会把一个模型直接投入生产,因为你必须添加你的逻辑来建立你的管道,让它变得有用,”倪说。

这就是培训或任何其他开发工作的服务角度变得重要的地方。像红帽这样的公司之所以成功,并不是通过将Linux的特定实例货币化(这是授权条款不允许的),而是通过提供公司认为有价值的开发和管理服务。

倪补充道:“他们试图出售IP,但他们抱着一个充分的期望,如果他们得到一个主要客户,他们可能会在设计服务方面签署NRE合同,并真正建立整个定制。”

因此,围绕开源模型的扩散赚钱是有先例的,但不是从模型本身赚钱。

在Xilinx应用商店的具体例子中,任何纯模型都来自自定义模型,而不是来自开源。任何开源模型都是一个更大的包,在一个更完整的应用程序中,包括模型和其他围绕它的电路。在这种情况下,盈利的并不是单纯的模式。这是一个完整的应用程序。

结论
向技术专家询问销售模型的可行性,就会清楚地发现,这还不是一件被广泛接受的事情。有些人会说这样的市场已经存在。其他人会说它们不存在,但最终会存在。还有一些人怀疑它们能否与免费模式共存。

有些人只是没有看到未来市场的迹象。“我没有看到任何人说,‘嘿,我有一个更好的专有视觉模型,我将授权给你,’”富勒说。

这表明这样的市场在未来更有可能出现。在机器学习的早期阶段,这并不令人惊讶,因为在许多情况下,我们还没有达到不断重新发明轮子的地步。但人们现在正在考虑这个问题,在某些情况下,把市场放在一起。随着最佳实践变得明显,它们的工作方式可能会发生变化,尽管我们可能还需要几年时间才能达到这一点。



留下回复


(注:此名称将公开显示)

Baidu