AI的新模式–AI与SaaS、传统软件的不同

blank

AI的新模式--AI与SaaS、传统软件的不同

SaaS与AI一直是我最关注的两种技术模式,本质上来讲,它们的模式有什么区别?在云计算越来越成为确定性趋势的情况下,AI所面临的挑战在什么地方?

A16Z最近讨论了一个有趣的话题,AI与SaaS、传统软件业务模式上的根本区别。

技术上来讲,人工智能似乎是软件的未来,所以许多创业者和投资人都争相押注AI赛道,但是A16Z注意到,

AI公司的经济结构与软件从根本上来讲并不一样,有时甚至看起来更像传统软件服务公司。

例如许多AI公司具有的特点包括:

1、 由于大量使用云基础架构和持续的人力支持,降低了毛利率

2、 边缘案例的棘手难题,导致规模化遇到挑战

3、 由于AI模型的商品化和数据网络效应的挑战,导致防御护城河较弱

在AI公司的财务数据中,A16Z看到了出乎意料的一致性,即毛利率通常在50-60%的范围内,远远低于SaaS 60-80%的水平。早期的资本投入可以在短期内掩盖这种效率低下的情况,但是,在后期还没有一种方法能够完全解决这些问题。

正如SaaS和传统软件比,引入了一种全新的经济模式一样,A16Z认为AI正在创造一种本质上新型的业务模式。所以他们讨论了AI和传统软件公司的不同之处,并就如何解决这些差异分享了一些建议。

软件+服务=AI?

软件(包括SaaS)的美妙之处在于,它可以一次生产,多次销售。这个特性创造了许多引人注目的业务收益,包括经常性收入流,高毛利率(>60-80%),以及(在网络效应或规模效应占主导地位的,相对罕见的情况下)超线性的规模效应。软件公司还具有建立强大防御性护城河的潜力,因为它们拥有自有的知识产权(通常是代码)。

服务业占据了另一端。每个新项目都需要专门的人员,并且只能销售一次。因此,收入往往是非经常性的,毛利率较低(30%至50%),并且在最好的情况下规模化也只是线性的。同时可防御性更具挑战-因为任何非客户所有的知识产权都不太可能具有广泛的适用性。

人工智能公司越来越多地将软件和服务两者的元素结合在一起。

大多数AI应用程序看起来像普通软件。它们依靠常规代码来执行诸如与用户交互,管理数据或与其它系统集成等任务。但是,应用程序的核心是一组经过训练的数据模型。这些模型解释图像、转录语音、生成自然语言并执行其它复杂任务。有时维护它们会感觉更像是服务–需要大量的、针对特定客户的工作和投入成本,而这些成本却超出了典型的客户支持和客户成功职能。

这种动态的变化以多种重要方式影响着AI的业务模式。在以下内容中,我们将展开探讨毛利率,可扩展性和可防御性。

“AI公司似乎越来越多的将软件和服务的要素与毛利率、可扩展性和可防御性结合在一起,这可能完全代表一类新的业务模式”

毛利率,第一部分:云对于AI公司来说是一笔巨大的成本,有时是隐藏成本

在企业本地部署软件的时代,交付产品意味着淘汰和运送物理介质-无论是在服务器还是台式机上运行软件的成本均由买方承担。如今,随着SaaS的普及,该成本已被推还给供应商自身。大多数软件公司每个月都要支付一大笔AWS或Azure账单-软件要求越高,金额就越大。

事实证明,人工智能的要求很高:

  • 训练一个单一的AI模型可能会花费数十万美元(或更多)的计算资源。尽管将其视为一次性成本很具有诱惑力,但再训练越来越被认为是一种持续的成本,因为构建AI模型的数据往往会随着时间而变化(这种现象称为“数据偏移-data drift”)。
  • 与运行传统软件相比,模型推理Model inference(在生产中生成预测的过程)也更加复杂。与从数据库中读取数据相比,执行一连串的矩阵乘法只需要更多的数学运算即可。
  • 与传统软件相比,人工智能应用更有可能在图像,音频或视频等富媒体上运行。这些类型的数据消耗的资源比通常的存储资源更高,处理成本也跟高,并且经常遇到ROI感兴趣区域问题-应用程序可能需要处理大文件才能找到相关的小片段。
  • 已经有AI公司已经告诉我们,与传统方法相比,云计算操作可能更复杂,成本更高,特别是没有好的工具可以在全球范围内扩展AI模型。结果,一些AI公司必须定期跨云区域(Cloud Region)传输经过训练的模型,以提高可靠性、合规性并降低延迟,这会增加大量的出入成本。

总而言之,这些投入耗费了AI公司在云资源上经常花费的25%或更高的成本。在极端情况下,处理特别复杂的任务时,初创企业发现实际上手动处理数据比执行经过训练的模型要便宜。

优化的方式是采用专用的AI处理器,它们可以更有效地执行计算,而优化技术(例如模型压缩和交叉编译)可以减少所需的计算数量。

但是目前还不清楚效率曲线的形状。在许多问题领域,为了获得更高的精度,需要指数级的处理和数据。就像我们所之前提到的那样,这意味着模型的复杂性正以惊人的速度增长,并且处理器不太可能跟上。摩尔定律是不够的(例如,自2012年以来,训练最先进的AI模型所需的计算资源增长了300,000倍,而NVIDIA GPU的晶体管数量仅增长了约4倍!)。分布式计算是解决此问题的有力方法,但它主要解决的是速度问题,而不是成本。

毛利率,第2部分:许多AI应用都依靠“人在回路中”来维持高精度

“人在回路中”有两种形式,这都会导致许多AI初创公司的毛利率降低。

第一:训练当今大多数最先进的AI模型涉及到手动清理和标记大型数据集。这个过程昂贵,费力,并且是更广泛采用AI的最大障碍之一。另外,如上所述,一旦部署了模型,训练就不会结束。为了保持准确性,需要不断捕获,标记新的训练数据,并将其反馈到系统中。尽管诸如像漂移检测和主动学习之类的技术可以减少工作量,但轶事数据(样本量比较小,没有完善的科学实验证明,这种数据有可能是不可靠的)显示,许多公司在此过程中的支出高达收入的10-15%(通常不包括核心工程资源)。

第二:对于许多任务,尤其是那些需要更多认知推理的任务,通常需要人类实时介入AI系统。 例如,社交媒体公司雇用数千名人工审核员来增强基于AI的审核系统;许多自动驾驶系统都包括远程人类操作员;大多数基于AI的医疗设备都与作为联合决策者的医生进行交互。随着人们对现代AI系统的能力越来越了解,越来越多的初创公司开始采用这种方法。一些计划销售纯软件产品的人工智能公司正越来越多地将服务能力引入内部,并制定相关成本。

随着AI模型性能的提高,对人工干预的需求可能会下降。但是,不太可能完全杜绝人工。无人驾驶汽车等许多问题过于复杂,以至于无法通过当前的AI技术实现完全自动化。安全、公平和信任的问题也需要人为监督,这一事实很可能会体现在美国欧盟和其他地区当前正在制定的AI法规中。

“随着AI模型性能的提高,对人工干预的需求可能会下降。但是,不太可能完全杜绝人工。”

即使我们最终实现了某些任务的完全自动化,也不清楚由此可以提高多少利润。AI应用的基本功能是处理输入数据流并生成相关的预测。因此,操作系统的成本是所处理数据量的函数。一些数据由人工处理(相对昂贵),而其他数据则由AI模型自动处理(期望更便宜)。但是每一个输入都需要以某种方式进行处理。

因此,到目前为止我们所讨论的两类成本,即云计算和人工支持,减少一个往往会导致另一个增加。它们都有可能被优化,但都不可能达到与SaaS相关的接近零成本的水平。

扩展AI系统可能比预期的要困难得多,因为AI生活在长尾中

对于AI公司而言,知道何时找到PMF比传统软件要难。你很容易觉得自己已经达到了目标——特别是在签下了5-10个大客户之后——却发现你机器学习团队的积压工作开始膨胀,客户部署计划开始不祥地延长,还从新的销售团队中抽走了资源。

在许多情况下,罪魁祸首是边缘情况。许多AI应用程序都有开放式接口,可以处理嘈杂的非结构化数据(例如图像或自然语言)。用户通常缺乏对产品的认知,或更糟的是,他们认为产品具有人类/超人类的能力。这意味着边缘情况无处不在:我们看到的AI产品多达40-50%的预期功能都在用户意图的长尾中。

换句话说,用户可以,也会在一个AI应用中输入几乎任何东西。

“用户可以,也会在一个AI应用中输入几乎任何东西。”

处理这种海量的状态往往是一项持续的工作。由于可能的输入值范围如此之大,因此每个新的客户部署时都可能生成从未见过的数据。即使是看起来很相似的客户(例如,两家汽车制造商都在进行缺陷检测)也可能需要实质上不同的训练数据。

一位创始人称这种现象为AI产品的“时间成本”。她的公司会在接触每一家新的客户进行专门的数据收集和模型微调。这使得他们可以看到客户数据的分布,并在部署前消除一些极端情况。但这带来了新的成本:在模型精度达到可接受的水平之前,公司的团队和财务资源都会被占用。训练期的持续时间通常也是未知的,因为无论团队如何努力,往往没有什么选择可以更快地生成训练数据。

人工智能初创公司通常最终会花费比预期更多的时间和资源来部署产品。提前识别这些需求可能很困难,因为传统的原型设计工具(例如模型、原型或Beta测试)往往只覆盖最常见的路径,而不能涵盖边缘情况。与传统软件一样,在最早的客户群中,这个过程特别耗时,但是与传统软件不同,它不一定会随着时间的流逝而消失。

捍卫AI模式的剧本仍在撰写中⚔️

伟大的软件公司是建立在强大的护城河之上的。网络效应、高替换成本和规模效应是最强大的力量。

所有这些要素对于AI公司也是可能实现的。护城河的基础通常是由技术上领先的产品所构成的,尤其是面向企业市场。率先实现一个复杂的软件,可以产生主要的品牌优势和几乎独占的排他期。

在AI世界中,技术差异化更难实现。新的模型架构主要是在开放的学术环境中开发的,参考实现(预先训练的模型)可以从开源库中获得,模型参数可以自动优化。数据是AI系统的核心,但它通常属于客户,在公共领域,或随着时间的推移成为一种商品。随着市场的成熟,它的价值也在下降,并且显示出相对较弱的网络效应。在某些情况下,我们甚至发现与AI业务模式相关的数据并不经济。随着模型变得越来越成熟,正如《数据护城河中的空洞承诺》中所言,每一种新的边缘案例的解决成本都变得越来越高,同时为越来越少的相关客户提供相应价值。

这并不一定意味着AI产品的防御力要比纯软件产品要差。但是对于人工智能公司而言,护城河似乎比许多人预期的要浅。从防御性的角度来看,人工智能在很大程度上可能是对基础产品和数据的一种转嫁。

“这并不一定意味着AI产品的防御力要比纯软件产品要差。但是对于人工智能公司而言,护城河似乎比许多人预期的要浅。”

建立,扩展和捍卫优秀的AI公司-给创始人的实用建议

我们认为,人工智能公司要取得长期的成功,关键是要应对挑战,并充分利用服务和软件的优势。秉承这种精神,创始人可以采取许多步骤来使新的或现有的AI应用蓬勃发展。

尽可能消除模型复杂性我们已经看到,在每位客户训练一个独立模型的初创公司与能够在所有客户之间共享一个模型(或一组模型)的初创公司之间,COGS(业务成本)存在巨大差异。 “单一模型”策略更易于维护,能更快地推向新客户,并支持更简单、更高效的工程组织。它还能够减少数据管道的扩展和重复的训练,从而可以显著减少云的成本。虽然达到这种理想状态没有灵丹妙药,但是关键之一是在达成协议之前要尽可能多地了解你的客户及其数据。有时很明显,新客户会为你的机器学习工作带来巨大的负担。在大多数情况下,仅涉及少数几个独特的模型或进行一些微调,调整会更加细微。做出这些判断(权衡长期经济健康与近期增长)是AI创始人面临的最重要工作之一。

仔细选择问题域(通常是窄范围的),以降低数据复杂性。从根本上说,实现人工操作自动化是一件很难的事。许多公司发现AI模型的最小可行任务比他们预期的要窄。例如,有些团队并不提供一般的文本建议,而发现在电子邮件或职位发布中提供简短的建议会更加靠谱。CRM领域的公司已经发现,AI只用于更新记录会具有巨大的利基价值。像这样的一大类问题,人类很难执行,而AI则相对容易。它们往往涉及大规模、低复杂度的任务,例如审核、数据输入/编码、转录等等。专注于这些领域可以最大程度地减少持续边缘情况的挑战,换句话说,它们可以简化人工智能开发过程中的数据输入。

“我们认为,人工智能公司要取得长期的成功,关键是要应对挑战,并充分利用服务和软件的优势”

计划高可变成本。作为创始人,你应该有一个可靠、直观的商业模式的心理框架。这篇文章中讨论的成本可能得到优化-降低一定的幅度-但假设它们完全消失是错误的。相反,我们建议建立一个低毛利率的业务模式和GTM(Go To Marketing)战略。一些好的建议是:深刻理解为模型提供数据的分布情况;将模型维护和人工干预视为首要问题;跟踪并衡量你的实际可变成本,不要让它们隐藏在研发中;在你的财务模型中做出保守的单位经济假设,尤其是在融资期间;不要等待规模扩大或外部技术进步来解决问题。

融合服务。要有巨大的机会来满足市场,这可能意味着要提供全栈翻译服务而不是翻译软件,或者运营出租车服务而不是出售自动驾驶汽车。建立混合业务比纯软件更难,但是这种方法可以提供对客户需求的深刻洞察,并诞生快速增长的、定义市场的公司。服务也可以成为启动公司进入市场引擎的绝佳工具-有关此事的更多訊息,请参阅这篇文章-特别是在销售复杂的和/或全新技术时。关键是要以坚定的方式追求一种策略,而不是同时支持软件和服务客户​​。(这种方式曾经在我的知识星球中也简单讨论过)

做好改变技术栈的准备。现代人工智能仍处于起步阶段,帮助从业者以高效和标准化的方式完成工作的工具才刚刚构建起来。在接下来的几年中,我们希望看到工具被广泛使用,使得模型训练自动化、提高推理效率、标准化开发人员工作流、监控和保护生产中的AI模型。通常,云计算作为软件公司要解决的成本问题也越来越受到关注。将应用程序紧密耦合到当前的工作方式可能会在将来导致架构上的劣势。

用老方法建立防御能力。虽然尚不清楚AI模型本身或基础数据是否会提供长期的保护,但好的产品和专有数据几乎总能建立好的商业模式。人工智能为创始人提供了一个新的视角来解决老问题。例如,人工智能技术在相对沉闷的恶意软件检测市场中,仅仅只是表现出更好的性能就带来了新的价值。在最早的、独特的产品能力基础上,构建有用户粘性的产品和持久性业务的机会是永恒不变的真理。有趣的是,我们还发现有几家AI公司通过有效的云战略巩固了自己的市场地位,类似于最新一代的开源公司。

* * *

总结一下:从传统意义上讲,当今大多数AI系统都不完全是软件。因此,人工智能企业看起来并不完全像软件公司。它们涉及持续的人力支持和重大可变成本。它们通常不像我们希望的那么容易扩展。强大的防御能力(​​对于“一次生产/多次出售”这种软件模型至关重要)似乎并不是免费的。

这些特征使得AI在某种程度上感觉像服务业。换句话说,你可以替代服务型的公司,但不能(完全)代替服务。

信不信由你,这可能是个好消息。诸如可变成本,动态扩张和防御性护城河之类的事物最终由市场而不是单个公司决定。事实上,我们在数据中看到了不熟悉的模式,这表明AI公司确实是新事物-进入新市场并创造大量机会。已经有许多伟大的AI公司成功地走出了概念迷宫,并创造出性能始终如一的强大产品。

“诸如可变成本,动态扩张和防御性护城河之类的事物最终由市场而不是单个公司决定。事实上,我们在数据中看到了不熟悉的模式,这表明AI公司确实是新事物-…”

人工智能仍处于从研究课题到生产技术过渡的早期阶段。人们很容易忘记,AlexNet在不到8年前发布,它可以说是开创了当前人工智能软件浪潮的先河。智能应用正在推动软件行业向前发展,我们很高兴看到它们下一步的发展。

资料来源:传统软件的毛利率估计是基于publiccomps.com上列出的一些上市公司得出的;服务公司的毛利率估算基于10-K filings年报;人工智能业务的毛利率估算基于对人工智能初创公司创始人的多次访谈。

原文:The New Business of AI (and How It’s Different From Traditional Software)

What do you think?

Written by marketer

blank

交互设计思考:信息设计中的层级与层级感

blank

对SaaS企业级服务创业的一点点看法