当前位置:AIGC资讯 > AIGC > 正文

Next ’24 - 踏上云端新旅程​

作者 | Google Cloud CEO, Thomas Kurian

去年,全世界才开始想象生成式 AI 将为企业带来怎样的转变,如今这些转变正在逐步展开。 而 Google 一直遵循着相同的原则:打造人人都能受益的 AI 技术,尽力为更多人带来更美好的生活。

一个连接云端、由 AI 驱动的 Agent 世界

借助我们丰富多样的 AI 产品组合,比如基础架构、Gemini、多种模型与 Vertex AI 等,客户与合作伙伴可以打造日渐精密的 AI Agent,用来服务客户、支持员工和创造内容等。

出色的客服 Agent 可以协助您的客户通过包含web、移动设备、呼叫中心及销售点在内的多种渠道,灵活运用文本、语音等方式,让您的企业与用户的互动更为顺畅。

  1. 洲际酒店集团将推出由生成式 AI 驱动的旅行规划功能,协助客户轻松规划下一趟度假行程。
  1. Target 正在优化其 Target 应用程序和 Target.com 上的优惠和路边取货(curbside pickup)功能。

员工 Agent 可帮助所有员工提高工作效率,更好地协同工作。例如:

  1. Etsy 使用 Vertex AI 训练技术来优化搜索建议与广告模型,为买家提供更好的商品推荐,并提升销售额。
  2. 巴西企业 Dasa 协助医生更快地侦测出检测结果的相关发现。

创意 Agent 能成为您强大的设计师与制作团队,与您一同进行图片与幻灯片的浏览和创作,并探索各种创意想法。我们提供强大的平台与技术栈协助您打造创意 Agent。 例如:

  1. Canva 采用 Vertex AI 为其产品 Magic Design for Video 提供动力,协助使用者在短短几秒钟内制作出引人入胜的视频。
  2. 家乐福使用 Vertex AI 开创营销新方法,使他们能够在数周而不是数月内在不同社交网络上创建动态活动。

以下是我们在 Cloud Next ’24 大会上宣布的一系列产品创新,协助各种规模的组织在 AI 时代向前迈进。

利用 AI 优化的基础架构实现规模化

生成式 AI 需要强大的基础架构来加以支持,才可迅速推动转型。为了能支持各种技术需求层次的客户,我们进行了多项重要更新:


  1. A3 mega:我们与 NVIDIA 合作,使用 H100 GPU 开发的全新 GPU 实例现已正式推出,其带宽为 A3 实例的两倍,能支持要求最严苛的工作负载。此外,我们也同步推出 Confidential A3,客户能够在训练和推理过程中更进一步保护敏感数据,并确保 AI 工作负载的机密性和完整性。
  2. NVIDIA HGX B200 与 NVIDIA GB200 NVL72:Google Cloud 将于 2025 年初采用最新的 NVIDIA Blackwell 平台晶片,并提供 HGX B200 和 GB200 两种选项。 B200 专为主流模型的训练与服务而设计,而 GB200 NVL72 则可为万亿参数规模的模型提供实时大语言模型推理和大规模训练。
  3. TPU v5p:我们宣布正式推出 TPU v5p,这是我们最强大、可拓展且最灵活的 AI 加速器,可用于训练和推理,且每个 Pod 的计算能力是上一代的 4 倍。我们还宣布为 TPU v5p 提供 Google Kubernetes Engine (GKE) 支持;过去一年,在 GKE 上运行的 GPU 和 TPU 使用量增长了 900% 以上。
  1. AI 优化的存储选项:我们通过 Cloud Storage FUSE 和 Parallelstore 全新的缓存功能提升训练速度,这些功能可以将数据存储更接近客户的 TPU 或 GPU 。 我们也推出 Hyperdisk ML(预览版),这是新一代块储存服务,与常见的替代方案相比,其模型加载时间加速了 3.7 倍。
  1. 动态负载调度(Dynamic Workload Scheduler):日历模式可以协助并确保工作负载在指定时间开始执行,而弹性启动模式可提供最佳的经济效益,协助客户为复杂的训练与推理任务有效管理资源。

我们正致力于将 AI 带到更接近数据生成与运用的位置,包括边缘、实体隔离(air-gapped)环境、Google 主权云和跨云环境。通过 Google Distributed Cloud(GDC),我们可以在任何地方启用 AI,让您可以选择最符合组织特定需求的环境、配置与控制选项。

我们也宣布多项 GDC 的新功能,包括:

  1. 在 GDC 上提供 NVIDIA GPUs:我们将为采用网络互联与物理隔离配置的两种 GDC 提供 NVIDIA GPU,这两种配置都将支持新的 GPU 实例,以高效运行 AI 模型。
  2. 在 GDC 上提供 GKE 服务:领先的 AI 公司在 Google Cloud 使用的 GKE 服务 ,也将在 GDC 上提供。
  3. 支持 AI 模型:我们在 GDC 中支持多种开放 AI 模型,包含 Gemma、Llama 等,为这些模型提供可在物理隔离与网络互联的环境中执行。
  4. 在 GDC 上提供 Vector Search:我们也将在 GDC 引入 Vector Search 的强大功能,您可以在 GDC 上以极低的延迟对您的私人和敏感数据进行搜索和信息检索。
  5. 主权云(Sovereign Cloud):为符合最严格的监管要求,我们提供采用完全物理隔离配置的 GDC。 这个产品能在本地操作并具备完整的存续能力(survivability),可由 Google 或您选择的合作伙伴代管,您拥有完全的控制权,并且在法规变更时,我们也可以灵活反应,协助您快速应对。

虽然并非所有工作负载都属于 AI 工作负载,但您在云中运行的每个工作负载都需要进行优化,且每个应用都有独特的技术需求。因此,我们推出全新的通用计算服务,协助客户获得最佳性能、确保应用程序之间的互通性,满足可持续发展目标,同时降低成本。

  1. Google Axion:是我们专为数据中心设计的首个 ARMⓇ 架构 CPU,与当前基于 x86 的同类实例相比,性能最多可提升 50%,能效最多可提升 60%。
  2. 我们的通用 VM 系列也将推出两个全新的机器系列:N4 与 C4。C3 机器系列将推出原生裸机机器类型。 此外,我们也将正式推出 Hyperdisk Advanced Storage Pools,以及更多新的产品。我们也将 Vertex AI 上的生成式 AI 静态存储数据的数据驻留(data residency)服务范围扩展到 11 个新的国家和地区,包扩澳洲、巴西、芬兰、香港、印度、以色列、意大利、波兰 、西班牙、瑞士和台湾。
  1. 此外,客户现在使用 Gemini 1.0 Pro 和 Imagen 时,可以将机器学习的操作限制在美国或欧盟境内。
  2. 与去年我们宣布开始服务的其他 10 个国家和地区一样,我们协助这些新开放的国家和地区的客户控制其数据的存储位置和访问方式,让客户更能符合世界各地的监管及安全要求。

利用 Vertex AI 创建 Agents
Google Cloud 在 Vertex AI 上提供超过 130 种第一方与第三方模型,我们正在扩大对各种模型的访问,为客户提供更丰富的模型选择:

  1. Gemini 1.5 Pro:Gemini 1.5 Pro 提供两种大小的上下文窗口:128K token 与一百万 token,目前在公开预览版阶段。 客户现可以在单个数据流中处理大量信息,包含 1 小时的视频、11 小时的音频、超过 30,000 行的代码,或 700,000 个以上的字词。
  2. Claude 3:Anthropic 全新系列的先进模型,现已在 Vertex AI 上向客户开放使用。
  3. CodeGemma:Gemma 是先进的轻量级开放模型系列,采用与创建 Gemini 模型相同的研究和技术而构建。而 CodeGemma,一款 Gemma 全新微调、针对代码生成与代码辅助等编码使用场景而设计的模型,现已在 Vertex AI 开放使用。
  4. Imagen 2:这是我们最先进的文生图技术,具备多种图像生成功能,协助企业打造符合品牌需求的定制化图像。全新的文生图功能让营销与创意团队能轻松生成例如 GIF 等动图,并且配备安全筛选与数字水印。 此外,我们也宣布推出高级照片编辑功能,包含图像修复、图像扩展,以及其他更多功能。
  5. 数字水印:由 Google DeepMind 的 SynthID 技术提供支持,此功能现在起正式应用于 Imagen 2 生成的 AI 图像中。

当客户利用企业数据对模型进行增强和Grounding时,可以发挥模型最大功效并获取更多价值。今天,我们用两种方式加强 Vertex AI 的Grounding能力,使其功能更加完善:

  1. Google 搜索:以 Google 搜索作为模型的信息来源,能结合 Google 最新基础模型的强大功能,以及访问最新、高质量信息的能力,从而显著提高响应的完整性与准确性。
  2. 你的数据:运用企业应用程序,如 Workday 或 Salesforce 中的数据作为模型基础,并轻松连接 AlloyDB 和 BigQuery 等 Google 数据库。

当您选择了合适的模型、加以 finetune 并 Grounding 后,Vertex 还可以协助您部署、管理和监控模型。今天,我们宣布推出更多 MLOps 功能:

  1. Prompt 管理工具:这些工具让您可以在内置 Prompt 上进行协作,附上备注和状态、追踪变更纪录,以及比较不同 Prompt 的响应质量。
  2. 自动并排比对:Auto SxS 功能现已正式推出,它可以说明为何某个响应优于另一个,并提供确定性分数,有助于使用者了解评估的准确性。
  3. 快速评估功能:此功能现已推出预览版,可协助客户在迭代 Prompt 设计时,运用较小的数据集来快速评估模型。

最后,Vertex AI Agent Builder 集成了基础模型、Google 搜索和其他开发者工具,使您可以轻松建构和部署 Agent。 它提供了无代码 Agent 生成器控制台的便利性,以及强大的联结、编排与增强功能,使用 Vertex AI Agent Builder,您现在可以利用 Google 搜索和您组织的数据快速创建一系列生成式 AI Agent。

缩短开发时间

Gemini Code Assist 是 Google 专为企业打造的 AI 代码辅助解决方案。 为支持开发人员,我们宣布推出以下项目:

  1. Gemini 1.5 Pro in Gemini Code Assist:此次升级带来了高达 1 百万 token 的上下文窗口,甚至可为最大型的项目带来革命性编码方式。Gemini Code Assist 现在可以提供更准确的代码建议、更深入的洞察,以及精简的工作流程。
  2. Gemini Cloud Assist:此功能可在应用程序生命周期各阶段提供 AI 辅助功能,让使用者更轻松地设计、保护、操作、故障排除,以及优化应用的性能与成本效益。


我们为 Google 内部的一组开发人员部署了 Gemini Code Assist,发现完成一般开发任务所需的时间缩短了 40% 以上,编写新代码的时间缩短了 55%。事实上,Gemini Code Assist 支持位于任何位置的私人代码集,无论是本地部署、GitHub、GitLab、Bitbucket,甚至是多个位置。

结合数据,释放庞大 AI 潜能

Google Cloud 可让您将 AI 技术与您的企业数据相结合,同时维持数据的隐私性和安全性。我们现在宣布推出全新增强功能,协助组织构建出色的数据 Agent:

  1. Gemini in BigQuery:Gemini in BigQuery 运用 AI 技术来协助数据团队准备、发现、分析和治理数据。 此外,您将能通过新的 BigQuery Data Canvas 构建与执行数据管道,它结合自然语言与嵌入式可视化功能,提供了与Notebook类似的全新使用体验,两种目前皆提供预览版。
  2. Gemini in Database:您可轻松安全地将数据从旧系统中迁出,例如将数据库转成 AlloyDB 等现代云数据库。
  3. Gemini in Looker:我们将推出数项预览版的新功能,这些功能可轻松地将您的数据 Agent 集成到您的工作流中。 我们还新增与 Google Workspace 集成的全新生成式 AI 功能,可让您与业务数据进行对话。

运用 AI 技术提升网络安全

安全 Agent 可在安全生命周期的每个阶段提供帮助,因此生成式 AI 有潜力扭转局势,让抵御攻击的一方占上风。Google Cloud 安全产品组合中的创新功能可以提供更强大的安全成果,并使每个组织都能让 Google Cloud 成为他们安全团队的一部分,这些功能包括:

  1. Gemini in Threat Intelligence:使用自然语言技术,可以针对威胁发动者的行为提供深入的洞察。通过 Gemini,我们能够分析数量庞大的潜在威胁恶意代码样本。Gemini 拥有更大的上下文窗口,能分析模块之间的交互,针对代码的真正意图提供全新洞察。
  2. Gemini in Security Operations:全新辅助调查功能可以将自然语言转换为启动检测、总结事件数据、建议应采取的行动,并通过对话式聊天引导使用者在平台上操作。

利用 Google Workspace 提升工作效率

通过Gemini for Workspace,企业可直接在 Gmail、文档和表格等产品中,使用内置的 AI Agent。 今天,我们宣布推出 Gemini for Workspace 的下一波创新与增强功能,包含:


  1. Google Vids:这个由 AI 驱动的视频创作应用程序,结合视频创作、制作及编辑助理于一身,它可以自动生成一个分镜图(storyboard)让您轻松编辑,当您选择好风格后,它会将您的草稿与素材库中的视频片段、图片和背景音乐拼凑在一起。 它还可以帮助您找到合适的旁白来传递信息,可以选择我们预设的旁白或是使用您自己的录音。 Vids 将加入我们其他的生产力工具的行列,例如:文档、表格和幻灯片等。它拥有简单易用的界面,让您能安全地通过浏览器协作和共享工作项目。 Vids 将于六月于 Workspace Labs 发布。
  2. AI Meetings and Messaging 插件:这款协作工具提供 “帮我记录”(Take notes for me)与聊天摘要功能,支持 69 种语言(相当于 4,600 种语言组合)的实时翻译功能。
  3. 全新的 AI Security 插件:Workspace 管理员现在可以使用专为其组织训练、可保护隐私的 AI 模型与数据外泄防护控件,来自动分类与保护机密档案与数据。

回顾过去这一年,看到我们的使用者从最初抱着热衷尝试和实验的心态,一路进展到实际运用 AI 工具并推出早期产品,这确实令人惊叹,也使我们更加期待他们未来更广泛的应用。

更新时间 2024-04-12