在选择GenAI供应商时如何权衡风险和回报

11月中旬，OpenAI董事会解雇了公司CEO奥特曼，他让ChatGPT声名鹊起，并开启了企业AI部署的新纪元。在接下来的三天里，几乎所有的公司员工都表示要离开公司，OpenAI的命运看起来非常不确定。

整个业务都建立在OpenAI及其API之上。

根据O‘Reilly上月底发布的一项调查，23%的公司正在使用OpenAI的一种模型，它最接近的商业竞争对手，谷歌的Bard，远远落后，只有1%的市场份额。其他受访者表示，他们没有使用任何GenAI模型，正在构建自己的模型，或者正在使用开源替代模型。

撇开这一事实不谈，这是一项全新技术的高采用率，也是这个领域风险有多大的一个指标。如果ChatGPT工具消失，所有OpenAI的API突然停止工作，一个把自己的未来押在ChatGPT上的企业将陷入严重的困境。那么，如果OpenAI在一夜之间就崩溃了，这对这个领域里无数初创企业的生存几率又有什么意义呢?

根据G2的最新软件状况报告，AI是G2历史上增长最快的软件类别，该公司现在总共跟踪了1078家AI供应商，AI类别比去年增加了643种新产品。

合成媒体，包括AI生成的文本、图像、音频和视频，与前一年相比增长了222%，AI写作助手品类增长了177%，因此，寻找高性能AI供应商的企业有很多选择。

食品跨国公司Rich Products的CIO Yexi Liu表示：“我们一直在与Gartner、麦肯锡等合作伙伴进行广泛的研究，以了解市场格局以及其他公司是如何使用这项技术的。”这家市值38亿美元的公司拥有1.1万名员工，业务遍及100多个不同的国家，并已经选择了最广泛的AI提供商 - 微软、SAP和Salesforce。

除此之外，大多数供应商仍然做得不够好。

Liu说：“许多GenAI供应商声称他们提供了端到端的AI解决方案，但现实情况是，这些公司中的许多仍处于早期阶段，目前市场上还没有明确的领头羊。”

在评估供应商时，Rich Products会考虑他们的技术、架构、业务价值和实用视角，Liu说，“目标是了解AI将如何从整体上造福Rich Products的业务。我们关注供应商的成熟度，以及他们是否在适合我们业务的重点领域取得了成功。”

安永会计师事务所10月底发布的一项针对1200名全球CEO的调查显示，99%的CEO正在计划或已经在GenAI领域进行“重大”投资，但这并不完全是一个安全的赌注，倒闭的风险只是早期采用者必须努力应对的众多灾难情景之一。此外，与AI生成的文本和图像相关的版权诉讼、AI生成内容的准确性，以及敏感信息成为GenAI模型的训练数据并暴露于世界的风险，也一直存在。训练数据集和结果都存在偏见，存在道德担忧、成本失控、集成挑战、模型漂移、缺乏透明度、数据安全风险、抄袭风险和监管风险。

而且，不仅仅是初创企业会让企业面临与AI相关的第三方风险，老牌供应商也在竞相将GenAI添加到他们的产品和服务中。

对GenAI持观望态度也会带来重大风险，包括员工和客户被更灵活的竞争对手抢走，以及在理解如何使用这项新技术方面落后。

因此，公司在评估GenAI供应商时必须问的通常尽职调查之外的首要问题是培训数据、版权、附加值和模型独立性。

数据隐私、安全性和合规性

对于Rich Products来说，数据保护、负责任的AI和值得信赖的AI至关重要。

“我们必须保护我们的知识产权，并确保我们的AI解决方案的设计将是公平、公正、安全和可解释的，” Liu表示，“这是没有商量余地的，我们会事先与供应商明确定义，我们不会就保密信托达成合作伙伴关系。”

此外，对于特别敏感的商业信息和数据，他预计会有更高的安全性。“供应商必须为我们提供在自己的租户中构建AI解决方案的能力。”Liu表示。

许多企业在选择供应商时，无论是否使用AI，都已经将网络安全和数据隐私放在或接近清单的顶部。在受监管的行业中，供应商还必须遵守特定的法规，如HIPAA或PCI。

同样的方法可以扩展到包括GenAI供应商、产品和服务，但有一些新的曲折，例如，Gartner分析师Arun Chandrasekaran说，公司应该已经询问供应商在他们的云环境中有什么样的安全审计和标准。

他说，现在，有了GenAI，他们还应该询问供应商采取了哪些措施，以确保数据保持隐私，而不是被用来训练和丰富他们的模型。

“提示数据在他们的环境中是如何存储的?”他问，“我能在我自己的虚拟云中运行它吗?”

总部位于亚利桑那州的解决方案集成商Insight负责合作伙伴联盟和运营的高级副总裁Megan Amdahl表示，她的公司评估GenAI供应商，既供内部使用，也代表客户。

Insight有一个合作伙伴合同管理团队，负责密切关注供应商协议。

“如果他们有任何我们认为有风险或有问题的条款，我们要求执行审查，”她说，“我们不仅让我们的合同团队为最初的签署做好准备，而且还要审查他们要求的所有附录，以确保我们防止可能插入的任何类型的风险。“

这不仅仅是一个理论上的问题。今年早些时候，视频会议供应商Zoom添加了GenAI功能，包括自动会议摘要。今年3月，该公司授予自己使用客户数据培训其车型的权利。今年夏天，当人们发现细则时，企业非常愤怒，Zoom很快就撤掉了。

模型培训

除了诉讼，还有一种可能的监管行动，可能会禁止某些类型的培训数据，这些风险可能会延伸到使用这些产品和服务的企业。

Chandrasekara说，公司还应该向供应商询问他们的模型培训流程，“他们在模型培训过程中的透明度如何?”

特别是，他们如何确保自己没有侵犯私人数据，他问道，有没有对该公司采取任何法律行动?

他补充说，企业还可以问另一个问题：“作为客户，他们为我提供了什么样的法律保护和法律赔偿?”

几家主要供应商已经宣布，他们将赔偿企业客户与使用他们的产品相关的潜在版权风险，例如，微软在9月份宣布了对Copilot的法律赔偿政策，该公司表示，如果你因版权原因受到挑战，我们将对涉及的潜在风险承担责任。

谷歌在10月份宣布了一项类似的政策，使用了几乎相同的措辞，提供Firefly图像生成模型的Adobe在6月份宣布了自己的法律赔偿。Firefly是Photoshop和其他Adobe产品中支持新的生成性填充功能的模型，也可以作为独立服务提供。Getty、OpenAI和亚马逊也紧随其后。

他们有护城河吗?

当ChatGPT第一次发布时，它没有阅读PDF文档的能力，但分析PDF内容的能力是GenAI的一个主要企业用例。结果，几家初创公司如雨后春笋般涌现，以填补这一功能空白。

10月，ChatGPT添加了PDF上传功能，让大多数这些初创公司一夜之间变得无关紧要，使用这些初创企业的技术构建PDF工作负载的企业现在面临着在客户重新构建系统之前就倒闭的风险。

Constellation Research的副总裁兼首席分析师Andy Thurai表示，这并不是一个新问题，一家初创公司很容易在任何技术领域过时。“不同的是，AI模型发布功能的速度令人难以置信，” Thurai说，“在其他软件迭代中，它没有那么快，这将需要六个月到一年的时间，这将让规模较小的供应商有时间进一步创新，或者让客户有时间进行迁移。”

他建议企业客户用“kill switch”哲学来接近他们的AI供应商，这不仅仅是因为他们有被淘汰的风险。

他表示，可能存在管理或组织问题，就像OpenAI所发生的那样。

“而且这些供应商中的一些有可能很快就会破产，”他补充道,“他们可能很快就会花光自己的钱，然后破产,或者他们的一个系统被黑客入侵了，你不想再让你的电话通过那里了。”

为了为这种情况做好准备，企业应该有一个后备计划，允许他们在没有特定供应商的情况下继续运营。

“你必须有一个kill switch选项。”他说。

SSA&Company负责应用解决方案的副总裁Nick Kramer表示，“kill switch不仅仅是在不重建整个解决方案的情况下更换供应商的技术能力，它还包括终止关系的合同能力。”

普华永道法律技术和联盟主管Sandeep Agrawal表示，企业还需要注意供应商提供的产品的防御性。

他说：“很多公司对GPT-4或Claude 2做了一个薄薄的包装，称其为GenAI，但那下面到底是什么呢?他们在工程和治理方面是否拥有合适的技能组合?”

如果一家供应商没有增加太多显著的价值，他们将很难维持业务，特别是如果他们的关键功能是由AI平台本身实现的，比如PDF发生的情况。

“我们的法律团队和采购团队必须理解和分析PDF文档和合同，其中一些是20年前签署的。”他说。

因此，普华永道将受益于一家提供阅读PDF功能的供应商，但现在这是一项标准功能，不需要单独的供应商，除非卖家做了什么特别的事。“例如，假设他们上传了数百万份合同，理解合同的具体语言，并花费时间和精力培训和微调模型，以获得对特定问题的更好回应。”他表示。

他补充说，一个通用的基础模型将给出PDF的通用答案，这可能适用于一般业务用户，但不适用于非常特定和技术领域的人，他补充称，内部进行这种微调将需要大量时间，因为上市速度非常重要。

他表示，普华永道雇佣了4000名律师，并拥有大量与法律文件相关的专有数据。

“如果你有专有数据，你可以用它来创建合同、法律研究、诉讼和索赔的专门域模型，”他说，“但如果你试图自己建造所有这些，你就不会在上市速度方面取得成功。这也是我们选择那些已经这么做的公司的一个重要原因。”

比如，专门从事法律PDF、金融PDF或与制药行业相关的PDF的供应商仍然能够提供价值。

“供应商需要了解他们所在行业的环境，”他说，“你能否创建更多属性、更好的用户界面和更友好的工作流?”

模型独立性

除了寻找在他们正在使用的基础模型之上提供显著附加值的供应商外，普华永道还选择了在他们使用的模型上灵活的供应商。

“12个月前，每个供应商都专注于ChatGPT在做什么和在做什么，” Agrawal说，“现在更多的老牌供应商在后端都是多车型，他们正在为不同的事情尝试不同的基础模式。”

基础模型可能会发生一些变化，或者更好的模型可能会出现在特定的用例中。

“如果你不够灵活和敏捷，你的客户就会离开。”他说。

科技咨询公司Omdia应用智能首席分析师Lian Jye Su表示，目前有200多种基础模型。

“供应商必须对合适的基础模型的能力和技术有深刻的理解，”他说，“而且基础模型容易产生幻觉，因此它们必须接地并与外部矢量数据库链接。”

他说，现在有20多个不同的托管载体数据库可供选择，每个数据库都有自己的优势，而且，不只是供应商需要灵活选择他们使用的基础模型。Gartner的Chandrasekaran表示，企业微调或培训自己的GenAI系统，也应该尽其所能成为模型不可知的人。

“他们今天使用的模式将不会是他们12个月后使用的模式，”他说，“他们需要有能力换掉那些型号。”

对于直接使用基础模型的企业，他们可以构建自己的系统，以便将API层与应用程序的其余部分隔离开来，然后，他们可以将API调用到任务的最佳模型，或者在出现更好或更便宜的模型时完全替换模型。

一些企业正在考虑的另一种方法是创建可以跨越多个系统的AI编排层，可以挂钩到不同的云提供商、不同的数据源、不同的基础模型，甚至不同的企业软件平台。

系统集成商TEKSystems的首席技术官Ram Palaniappan说：“当你看业务流程时，你需要端到端地看它，它可能从Salesforce开始，最终进入Oracle，但它需要从用户体验开始，端到端的使用案例将推动你如何将这些东西捆绑在一起。”

他说，有多家供应商提供这些AI超级应用程序，超级巨头也在推出自己的选择。

LangChain是该领域最知名的开源选择，Palaniappan说，NVIDIA有一个解决方案，Meta有LlamaIndex，它也在企业中获得吸引力。

“一些平台供应商，如谷歌，正在构建自己的应用层，”他说，“它们允许多种基础模式，还与LangChain进行了集成。”他补充说，微软和AWS也有自己的应用程序构建器。

对于致力于单一云平台的企业来说，这是一个很好的选择。他说：“如果你想整合到应用程序层，第三方超级应用程序将是一个很好的选择，像LangChain这样的东西，可以在所有三个云平台上移植，但如果你的大部分需求可以通过一个超级缩放器来满足，那么你就不需要这样做。”