当前位置:AIGC资讯 > 图像学习
-
从OpenAI出走的华人团队,将如何创造物理世界的ChatGPT时刻?
撰文丨伊风 出品 | 51CTO技术栈(微信号:blog51cto) 辛苦工作一天后,你躺在沙发上,有一个能为你递上香蕉的机器人怎么样?这听起来就像拥有一只会叼拖鞋的狗狗一样酷! RFM-1 可以!他可以听懂你的指令,在一堆食物中准确的识别香蕉并进行...
-
Lumiere文生视频模型怎么使用 AI生成视频Lumiere官网地址入口
Lumiere是一个文本到视频扩散模型,旨在合成展现真实、多样和连贯运动的视频,解决视频合成中的关键挑战。我们引入了一种空时U-Net架构,可以一次性生成整个视频的时间持续,通过模型的单次传递。这与现有的视频模型形成对比,后者合成远距离的关键帧,然后进行时...
-
纪念碑谷式错觉图像都被「看穿」,港大、TikTok的Depth Anything火了
人类有两只眼睛来估计视觉环境的深度信息,但机器人和 VR 头社等设备却往往没有这样的「配置」,往往只能靠单个摄像头或单张图像来估计深度。这个任务也被称为单目深度估计(MDE)。 近日,一种可有效利用大规模无标注图像的新 MDE 模型 Depth Any...
-
NeuRAD: 用于自动驾驶的神经渲染(多数据集SOTA)
论文"NeuRAD: Neural Rendering for Autonomous Driving",来自Zenseact,Chalmers科技大学,Linkoping大学和Lund大学。 神经辐射场(NeRF)在自动驾驶(AD)社区中越来越受欢迎。最...
-
NeRF与自动驾驶的前世今生,近10篇论文汇总!
神经辐射场(Neural Radiance Fields)自2020年被提出以来,相关论文数量呈指数增长,不但成为了三维重建的重要分支方向,也逐渐作为自动驾驶重要工具活跃在研究前沿。 NeRF这两年异军突起,主要因为它跳过了传统CV重建pipeline的...
第一页
1
没有了