当前位置:AIGC资讯 > AIGC > 正文

Claude 3 横空出世,亚马逊云科技携手Anthropic引领企业级生成式 AI 新纪元​

2024 年 3 月,OpenAI 的主要竞争对手之一 Anthropic 推出最新的 Claude 3 大语言模型系列:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。自从 GPT-3.5 推出以来,业界对标 OpenAI 的企业很多,但 Claude 3 一经推出便得到了社会广泛的关注,因为 Claude 3 在多项测评中都展现出优秀的水平,交付了“高分答卷”。 同时,亚马逊对 Anthropic 进行高达 40 亿美元投资也引发了社会关注和讨论。

不过,亚马逊对 Anthropic 的支持不止于此。亚马逊云科技还为 Anthropic 提供了强大的云服务能力以及 Amazon Trainium 和 Amazon Inferentia 芯片能力,帮助 Anthropic 建构 Claude 3 模型

近日,亚马逊云科技举办了以“亚马逊云科技携手 Anthropic 推进生成式 AI 创新”为主题的媒体沟通会。在会上,亚马逊云科技大中华区产品部总经理陈晓建详细介绍了 Claude 3 的优势、应用场景,以及 Amazon Bedrock 如何将大模型的能力提供给企业。

Claude 3 强在哪里?为何能得到亚马逊的大力支持?

首先从客观、权威的多项 AI 系统评估基准测试结果来看,Claude 3 表现出了高超的水平,尤其是 Claude 3 Opus在本科生水平专业知识(MMLU)、研究生水平专业推理(GPQA)、基础数学(GSM8K)等测试中表现优异,模型智能水平的新纪录——在数学问题、编程练习和科学推理等标准评估中超越了所有现有模型。不仅如此,Claude 3 Opus 能够在复杂任务中表现出优秀的理解能力和流畅性,走在通用智能的最前沿。

在大模型价格高昂的时代,性能高也意味着价格高。但 Claude 3 不仅做到了性能优越,还做到了价格实惠。Claude 3 并不只有一个模型,而是系列模型,一共有三种

  • 具有几乎即时响应能力的 Claude 3 Haiku;
  • 在技能与速度之间达到理想平衡的 Claude 3 Sonnet;
  • 为处理高度复杂任务设计的最智能模型 Claude 3 Opus。

户可以根据自己的商业需求,从中选择最合适的功能、速度和价格组合。其中 Claude 3 Haiku 和 Claude 3 Sonnet 的价格低于业界同等智能模型,且并非一倍或两倍的差别

除了价格、推理、数学方面的优势,Claude 3 在理解内容方面也有了很大的突破。

Claude 3 可以接收基于图像的输入,能力与其他前沿模型大致相同,但 Claude 3 更加擅长理解图片、图表、图形、技术图解及光学字符识别 (OCR)理解速度优于业界其他多模态模型的同时,延迟更低根据评估显示,Claude 3 Haiku的速度优于所有同一水平的前沿模型。

除了擅长理解图形、图表,Claude 3 在理解文字内容时也展现出惊人的准确性。Claude 3 系列模型均提供 200K 超长上下文准确召回针对某些特殊场景,Claude 3 开放支持 1M token 的上下文窗口。并且 Claude 3 在“大海捞针(Needle In A Haystack, NIAH)中的召回率表现优异。“大海捞针”是一种测试,能够反映大模型长文本理解能力。在媒体沟通会的现场,亚马逊云科技技术专家为大家演示了这一能力——在《流浪地球》的节选内容中插入一句《三体》的内容,Claude 3 Sonnet 精准地找到了《三体》的内容。

而在大家比较关心的 AI 幻觉方面,Claude 3 目前能够有效降低幻觉,尤其是在处理挑战性开放问题 (100Q Hard)准确性明显提升,减少错误答案。

以上都是 Claude 3 在理论层面上的优势,而在实际的场景应用中,Claude 3 也更加贴近人类的思考方式。比如 Claude 3 的代码辅助能力会更加贴近程序员的编写习惯Claude 3 不仅能够提供建议的代码,还能给出详细的步骤,使程序员可以按照建议进行操作的同时轻松掌握该项代码技能。

除此之外,Claude 3 能够模仿指定作者的风格进行内容续写;可以为根据电商商品的模特展示图精准捕捉产品细节生成更准确的产品描述;还可以根据提供的相关服务文档,准确回答该服务在不同区域的价格且信息提取更完整。

1+1>2, Amazon Bedrock + Claude 3 为企业提供超强 AI 能力

Claude 3 模型一经问世,亚马逊云科技便在第一时间 Claude 3 集成在 Amazon Bedrock,从而帮助企业更好地利用生成式 AI 进行业务创新。既然 Claude 3如此强大,为什么集成在 Amazon Bedrock原因也很简单,Amazon Bedrock + Claude 3 可以为企业提供更强大的 AI 能力。

首先,亚马逊云科技认为“没有一个模型可以适用于所有业务场景”所以亚马逊云科技在生成式 AI 领域提供三层技术栈,从最层的高性能基础设施,到中间层提供最广泛的基础模型选择,再到上层应用 GenAI 技术的开箱即用的云服务,全方位帮助企业更好地使用 AI 能力而 Amazon Bedrock 处于中间层,被视为云计算时代的AI 操作系统集成多种先进的大模型和工具链,企业可以在此基础上定制模型,同时保持数据私有和安全,并与其他在亚马逊云科技上的工作负载无缝集成。

其次,模型能力与实际运营生产之间需要更多的辅助能力。Amazon Bedrock 能够提供除了大模型以外的能力,比如 Provisioned Throughput (预置吞吐量),企业可以独享大模型能力的后台资源,并在业务需要支持时享受稳定的服务保障。还有模型微调(fine-tunning)。企业要想产生业务差异化价值,则不能只是简单使用完全标准化的大模型,而是要将自身的业务数据与大模型结合,因此需要模型微调的能力来实现。除此之外,Guardrails 能够全面监管大模型使用情况,不仅能够通过适当的配置降低幻觉,还能提供全方位日志。

最后企业使用大模型的目的是与自身业务结合产生更大的价值,这就意味着企业需要将自己的知识库与大模型结合。目前,业界通常使用向量数据库,也就是通过向量的方式存储知识库,这就需要非常强的数据底座来支撑。亚马逊云科技能够帮企业管理自身的业务数据,并建立坚实的数据基石——Data Foundation。除此之外,亚马逊云科技还能为企业大量提供针对构建数据库的服务,通过 zero-ETL 帮助企业无缝打通 OLTP 数据和 OLAP 数据。

在当今快速发展的 AI 时代,大模型技术无疑是推动企业创新和转型的关键力量。然而,企业面临的挑战远不止于简单地引入和应用的大模型,还需要如何正确、合理、安全、高效地使用大模型。亚马逊云科技通过自身综合的产品和服务,为企业提供了一个坚实的技术基础,使得企业不仅能够引入大模型,还能确保模型在企业实际业务中发挥最大的效用。而 Claude 3 Amazon Bedrock 的结合,无疑将进一步推动企业级AI技术的发展,为企业带来前所未有的价值和机遇。

更新时间 2024-04-10