声明:本文来自微信公众号“白鲸出海”(ID:baijingapp),作者:张凯然,授权站长之家转载发布。
仅在2024年3月一个月,就有三个华人创立的 AI 视频生成创企获得了融资,而且融资额都过了千万美金。
1、3月7日,总部位于英国伦敦的Haiper宣布产品上线,并已经完成1380万美金融资。Haiper 由两位曾供职于 Google 旗下 DeepMind 团队的华人工程师建立,提供免费的视频生成功能,最长可以生成2秒的高清视频,和最长4秒的标清视频。
2、3月13日,由前字节跳动视觉技术负责人创立的爱诗科技,完成一亿元人民币(约合1380万美金)左右的 A1轮融资,而其视频生成产品 Pixverse 已在海外上线,生成视频的时长为4秒,2月份的网站流量已经达到120万。
3、3月24日,据 The Information 报道,去年下半年,凭借让霉霉说中文视频火起来的 AI 数字人产品 HeyGen 正在进行一轮6000万美元的融资,由曾经投资过 Uber 和 Snap 的知名 VC Benchmark 领投,完成此次融资后,HeyGen 的总估值将达到4.4亿美元。
再加上之前估值已达2-3亿美金的 Pika Labs。由华人建立的创企们纷纷入局 AI 视频赛道。
而其实,“AI 视频融资热潮里华人密度尤其大”这个命题可以拆开去看,一个是 AI 视频的融资热,另一个是创业者里面的华人密度。
不赚钱、还烧钱,AI 视频为什么
还会融资热,又为什么是3月份?
AI 这一波的创业潮,给已经有点冷清的市场注入了活力。但一圈看下来,除了大模型驱动的 Chatbot,基本上就没有新的产品形态了,AI 只是在“赋能”各个领域,文字、图片、视频。
a16z Top50AI 产品中的视频
生成(蓝)和视频编辑产品(红)
而在上述几个领域中,AI 视频生成产品的用户接受度最低。在 a16z 刚刚发布的2023下半年 Top50AI 产品榜单中,上榜的5款 AI 视频产品中,只有 runway 一款是以视频生成为核心功能的,其他都是刚需属性更强的视频编辑产品。
runway 的流量走势图(23.9-24.2)
而就算 runway 也在2023年12月网站流量达到峰值后,出现了明显下滑。
这说明 AI 生成视频没市场吗,显然不是。按照赋能逻辑,AI 在某个领域落地,其潜在机会和规模,应该参考其服务的赛道。
显然,视频的市场规模不小,简单粗暴点,就互联网头部的产品来看,视频产品,也比图片和文字产品“值钱”。而当前这种流量的下滑,是因为产品确实拉胯。
截至2023年年底的 AI 视频生成产品|图片来源:a16z
根据 a16z 的统计,绝大多数产品都只能生成5秒钟以内的视频,而像 Kaiber 和 Deforum 虽然可以生成十几秒的视频,但只限于动画风格。
,时长00:52
Runway、Pika、Pixverse 的对比视频 | 视频来源:微博
而虽然,像 Runway、Pika,和后续切入市场的 Pixverse 生成的视频看上去很真实,也很酷炫。但是短短几秒钟时间+简单的镜头移动,对于绝大多数用户来说,除了体验一下之外,很难有使用场景。即便和一些创作者交流下来,他们也很难把这些 AI 产品融入工作流里面。在新鲜感过去后,访问量下滑也属合理。
就网上的信息和与 AI 视频产品创始人的对话内容来看,大家普遍认为,目前的 AI 视频生成大概在 GPT-2时代,也就是说,有一定技术突破,但是视频生成的时长和质量,还没有到能够落地应用和商业化的程度。
市面上几款常见模型的推理运算量估算,注:横坐标是输出内容的量,纵坐标是所需运算量,采用对数形式作图 | 图片来源:知乎
没落地,更别提商业化了,但硬币的另一面,“烧钱”却是实打实的。
从成本来看,Sora 的算力需求就比 GPT-4高出了好几个数量级。有网友根据 Sora 的公开数据做出了保守估算,训练 Sora 需要1.4万张 NVIDIA H100GPU 运行一个月,光这些芯片的价值就高达4.4亿美金......
其他产品虽然可能不像 Sora 一样走“大力出奇迹”的路径,但是算力成本远超其他类别 AI 模型是肯定的。
即便如此,赚不了钱、又烧钱的AI视频赛道仍受到了资本们的特别关注,2024年仅过了3个多月就有多达7款产品获得融资,总融资额达到2.18亿美金。
背后的原因,也刚好如上所述。有市场、但供给都不太行,有心气的 VC 们还是愿意搏一把的,而3月份资本的密集出手,还多亏于 Sora 这样头部产品带来的“清晰信号”。
具体来看的话,有市场,不只是上面说的 AI 落地到的视频赛道规模更大,还有 AI 视频模型更接近于 AGI 的一层逻辑。
而很多从业者认为,AGI 如果真正实现,则很多细分领域的应用层机会就消失了,也就是谁先做出来,可能会形成比较强的流量聚集效应,从风险投资的角度,资本肯定愿意搏一下,也就出现了 AI 视频融资热。
视频生成任务流程示意图,注:AI 在生成视频的过程中,一是要生成视频画面,这涉及 AI 视觉领域;二是需要理解并遵守 Prompt,这涉及自然语言处理;三是要保持视频的一致性、连贯性、合理性,这要求 AI 理解视频中的元素如何随时间变化及现实世界的物理规律,这考验 AI 综合学习及理解能力。此外,目前 Pika、Sora 等产品已经可以加入了声音生成的功能,AI 还需要保证画面、音频和文本描述的协调性。|图片由 ChatGPT 生成
而这个热潮出现在3月份,则是因为技术路径相较于之前清晰了不少。
技术路径收敛,AI 视频生成
已走过了从0到1的探索阶段
2024年 AI 视频生成产品融资情况|数据来源:AI产品榜(aicpb.com),红色为创始人为华人的AI视频产品
AI 这一波的融资,其实集中出现在3月前后,这与 Sora 这样通过摸索技术路径、实现了远高于之前同类产品的惊艳效果强关联。
根据对前谷歌 VideoPoet 项目负责人蒋路的一篇采访,AI 视频生成有两个主要的技术路径 Diffusion 和 Transformer,前者是 AI 生图的主要技术路径,而后者则是 GPT 等大语言模型(LLM)的主要技术路径。
在 Sora 出现前,在视频生成赛道中,两者被认为是泾渭分明的两条路径。90% 的研究者都在进行 Diffusion 路径的研究,但也有少量的研究者在做 Transformer 路径的研究,但基本上逃不出这两个方向。
Sora 的技术示意图|图片来源:知乎
而 Sora 的出现则让技术路线基本确定。Sora 是 Diffusion-Transformer 模型,等于把上述两种技术路径整合起来了。其中 Diffusion 的作用是细化和完善视频画面,而 Transformer 则用来处理和解析复杂的文本输入,并控制视频的逻辑连贯性。通过这种技术架构,Sora 可以按图像帧的时间序列来处理视频画面,就像 ChatGPT 按文字逻辑顺序处理文本一样。
有创业者说,看过 Sora 的论文后发现,原来泾渭分明的两种路线完成了交汇。而 Pixverse 的创始人王长虎则说:“Sora 让我们坚定了前进的方向。”
由于 AI 视频赛道目前的技术路径已经日趋清晰,免去了选错技术路径带来满盘皆输的风险。VC 虽然考虑收益,但更关注风险。
又为什么是华人?
AI 视频产品华人创业者的履历|信息来源:谷歌、领英
看几位创始人的履历,在创业之前就专注于 AI 或视觉相关技术,都有海外名校学习或国际化大厂供职的经验,拥有开阔的国际视野。
除了这两项“基础素质”,作为华人的他们对视频赛道,也有着自己的理解。
在上一波互联网创业大潮中,视频,尤其是短视频赛道,是中国互联网企业优势所在,TikTok 已经成长为全球主流媒体之一,引得 Google、Meta 等社交巨头们竞相模仿。
随着短视频占据了人们越来越多的注意力,互联网变现的2个印钞机也随之转动,广告和电商。根据2023年的数据,字节的广告收入折合553亿美元,排在国内主要互联网企业的第一位,总营收1200亿美元,排名第三。
而在电商方面,2023年抖音电商的 GMV 在2.3万亿人民币左右(折合3220亿美元),在国内大概排在第四,海外的 TikTok Shop 有200亿美元。
作为华人,对于此要更敏感一些。纵观几款三月份获得融资的几款华人 AI 视频产品,虽然发展阶段不太相同,但是都针对短视频相关的广告营销和电商生态进行了探索。
Haiper 与京东合作的海报,
合作宣布时间|图片来源:Haiper
Haiper 的产品于3月7日上线,而在产品还未正式上线时,Haiper 就开始了应用场景的探索。首先,在1月24日,Haiper 宣布与伦敦艺术大学时装学院展开合作,用 AI 的能力将时装草图转化为动态视频,在成衣制成之前预览上身效果。而在2月9日 Haiper 宣布和京东展开合作,探索电商方向的应用场景。作为一款新生产品,Haiper 已经在为技术找应用场景了。
而对视频、尤其是短视频商业化路径更清晰的认知,让 AI 视频赛道华人创业者们的发展路径看起来更接地气。
以其中融资金额最高的 HeyGen 为例。
HeyGen0-100W ARR数据和
主要成就|图片来源:HeyGen
HeyGen 在众多“形而上学”的视频模型创业公司里面,商业化能力是非常强的。收入数据来看,从2022年7月底上线算起,ARR 从0到100万美金,仅用时178天,而最近一次融资放出的消息,HeyGen2024年2月的预期 ARR 已经达到2000万美元了。
回头去看,HeyGen 除了迭代技术之外,在场景上的探索也非常积极和接地气。
HeyGen生成的AI演讲者|图片来源:HeyGen
HeyGen 的主要功能是 AI 数字人生成和视频翻译,服务的是 AI 演讲视频场景。
在上线之前,HeyGen 首先在线上协作平台 Fiverr 上提供演讲者视频制作服务来验证市场需求,在这个平台上,HeyGen 提供的数字人演讲服务比真人服务价格降低了90%,交付时间从1天缩短为了10分钟。通过这样的方式,HeyGen 找到了为服务买单的群体,电商卖家和内容创作者那样的小 B 用户。
YouTuber 小薇Official channel教电商卖家
如何使用HeyGen的视频|图片来源:Google
HeyGen SaaS服务的合作伙伴|图片来源:SaaS genius
而后,HeyGen 应该是想进一步去探索场景,锚定在企业宣传、内部管理和培训等能够用到 AI 视频的地方,来获取大客户。在2022年底,HeyGen 开始建立大客户团队,根据官网显示,Salesforce、amazon、NVIDIA 现都与 HeyGen 达成了合作。
在验证需求并有小范围内传播后,而后才有我们看到的 HeyGen 在社媒上曝光(“让霉霉说中文”),进一步再引发媒体曝光,打响知名度。
,时长00:51
HeyGen 产品介绍视频的案例|视频来源:HeyGen官网
在发展的过程中,HeyGen 将各项技术(Avatar、声音、视频翻译)设计成一个个模块,然后组合应用到不同场景里,而场景的探索也偏多样化,例如一些个性化的外联视频、教育类会用到比较多的相关视频、商品展示和宣传视频等等。
“URL to UGC”功能海报(左),笔者生成的产品
推广视频截图(右)|图片来源:X,HeyGen
但从第一开始的市场验证到后期的场景探索,电商和推广也都被作为重点探索领域。例如,HeyGen 在4月17日推出了基于商品页面生成商品介绍视频的功能。用户只需上传一个商品或 App 的网站链接,HeyGen 就可以基于页面上的文字和图片,自行生成幻灯片和对应的视频脚本,在用户确认后,生成产品介绍视频,进一步简化工作流程。
HeyGen 订阅页面,注:免费版 HeyGen
只能生成1个视频,基本无法满足使用需求
你还知道,华人创业者们在哪些 AI 相关赛道更活跃吗?欢迎大家在评论区和我们互动,我们也会视情况继续发布相关选题。