图像学习 - AIGC资讯

从OpenAI出走的华人团队，将如何创造物理世界的ChatGPT时刻？

撰文丨伊风出品 | 51CTO技术栈（微信号：blog51cto）辛苦工作一天后，你躺在沙发上，有一个能为你递上香蕉的机器人怎么样？这听起来就像拥有一只会叼拖鞋的狗狗一样酷！ RFM-1 可以！他可以听懂你的指令，在一堆食物中准确的识别香蕉并进行...

AIGC 2024-03-27 人工智能

976阅读

Lumiere是一个文本到视频扩散模型，旨在合成展现真实、多样和连贯运动的视频，解决视频合成中的关键挑战。我们引入了一种空时U-Net架构，可以一次性生成整个视频的时间持续，通过模型的单次传递。这与现有的视频模型形成对比，后者合成远距离的关键帧，然后进行时...

AIGC 2024-01-25 人工智能

885阅读

人类有两只眼睛来估计视觉环境的深度信息，但机器人和 VR 头社等设备却往往没有这样的「配置」，往往只能靠单个摄像头或单张图像来估计深度。这个任务也被称为单目深度估计（MDE）。近日，一种可有效利用大规模无标注图像的新 MDE 模型 Depth Any...

人工智能 2024-01-23 人工智能

868阅读

论文"NeuRAD: Neural Rendering for Autonomous Driving"，来自Zenseact，Chalmers科技大学，Linkoping大学和Lund大学。神经辐射场（NeRF）在自动驾驶（AD）社区中越来越受欢迎。最...

AIGC 2023-12-05 人工智能

922阅读

神经辐射场（Neural Radiance Fields）自2020年被提出以来，相关论文数量呈指数增长，不但成为了三维重建的重要分支方向，也逐渐作为自动驾驶重要工具活跃在研究前沿。 NeRF这两年异军突起，主要因为它跳过了传统CV重建pipeline的...

生成式AI 2023-11-14 人工智能

1001阅读