视频预测 - AIGC资讯

端到端大一统前夕？GenAD：LLM和轨迹规划全搞定

今天汽车人和大家分享一篇自动驾驶领域中第一个大规模视频预测模型。为了消除高成本数据收集的限制，并增强模型的泛化能力，从网络获取了大量数据，并将其与多样化和高质量的文本描述配对。由此产生的数据集累积了超过2000小时的驾驶视频，涵盖了世界各地具有多样化天气...

大数据 2024-03-20 人工智能

898阅读

AtomoVideo是一个新颖的高保真图像到视频（I2V）生成框架，可以从输入图像生成高保真视频。与现有工作相比，它实现了更好的运动强度和一致性，并且无需特定调整即可与各种个性化T2I模型兼容。点击前往AtomoVideo官网体验入口谁可以从Atom...

AIGC 2024-03-06 人工智能

1107阅读

前言真没想到，距离视频生成上一轮的集中爆发(详见《Sora之前的视频生成发展史：从Gen2、Emu Video到PixelDance、SVD、Pika 1.0》才过去三个月，没想OpenAI一出手，该领域又直接变天了自打2.16日OpenAI发...

AIGC 2024-02-29 人工智能

1186阅读

2 月 16 日，OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构，和市面上大部分主流方法（由 2D Stable Diffusion 扩展）并不相同。为什么 Sora...

人工智能 2024-02-26 人工智能

741阅读

目录一. 项目概述二. 方法详解三. 应用结果四.个人思考由于扩散模型生成空间的不确定性，仅仅通过文本生成视频时，会导致模糊的视频帧生成。今天解析的SparseCtrl，是一种有效解决上述问题的方案，通过带有附加编码器的时间稀疏条...

生成式AI 2024-02-17 人工智能

1043阅读

A Survey on Generative Diffusion Model Abstract 由于深度潜在表示，深度学习在生成任务中显示出良好的潜力。生成模型是一类可以根据某些隐含参数随机生成观测值的模型。近年来，扩散模型以其强大的生成能力成...

生成式AI 2024-02-07 人工智能

1474阅读

根据图灵奖得主、Meta 首席 AI 科学家在世界经济论坛上的讲话，生成模型不适合处理视频，AI得在抽象空间中进行预测。在互联网文本数据即将枯竭之际，很多 AI 研究者将目光转向了视频。但如何让 AI 理解视频数据成了新的难题。斯坦福大学教授指出了理解因...

AIGC 2024-01-23 人工智能

778阅读

在互联网文本数据即将枯竭之际，很多 AI 研究者将目光转向了视频。但如何让 AI 理解视频数据成了新的难题。在 2024 世界经济论坛的一次会谈中，图灵奖得主、Meta 首席 AI 科学家 Yann LeCun 被问到了这个问题。他认为，虽然这个问题还...

AIGC 2024-01-23 人工智能

733阅读

最近 GPT 模型在 NLP 领域取得了巨大成功。GPT 模型首先在大规模的数据上预训练，然后在特定的下游任务的数据上微调。大规模的预训练能够帮助模型学习可泛化的特征，进而让其轻松迁移到下游的任务上。但相比自然语言数据，机器人数据是十分稀缺的。而且机器...

人工智能 2023-12-29 人工智能

818阅读

目录 1.GAN是什么？ 2.GAN的计算 3.编写GAN的小小示例 4.GAN的发展与应用 5.AI作画体验-Disco Diffusion 1.GAN是什么？ 2014年，因为朋友邀请协助一个计算机生成图像的项目，lanGoodd...

人工智能 2023-12-18 人工智能

990阅读

AI 生成内容已经成为当前人工智能领域的最热门话题之一，也代表着该领域的前沿技术。近年来，随着 Stable Diffusion、DALL-E3、ControlNet 等新技术的发布，AI 图像生成和编辑领域实现了令人惊艳的视觉效果，并且在学术界和工业界...

人工智能 2023-10-24 人工智能

996阅读