近日,快手发布了一款名为「可灵」的视频生成大模型,该模型效果对标了之前发布的 Sora,同时已在快手旗下的快影 App 开放邀测体验。
可灵大模型具有多项优势,包括能够生成大幅度的合理运动、模拟物理世界特性、具备强大的概念组合能力和想象力,以及支持高分辨率视频生成和自由的宽高比设置。
该模型使用了3D 时空联合注意力机制,能更好地建模视频中的复杂时空运动,从而生成更符合客观运动规律的视频。此外,可灵大模型还展示了强大的概念组合能力和想象力,可以将用户的丰富想象力转化为具体的画面。该模型能够生成高分辨率、高帧率的视频,并支持自由的输出视频宽高比。在研发过程中,可灵大模型配套了高效的大规模自动化数据解决方案,保障了模型效果的快速提升。
快影 App 已正式开放邀测体验可灵大模型的文生视频功能,未来还将推出图生视频功能。
此外,基于可灵大模型,快手还计划推出更多应用方向,如 AI 舞王和 AI 唱跳功能,以提供更多多元的 AI 创作与互动体验。