-
阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!
继AnimateAnyone之后,阿里又一项“舞蹈整活儿”论文火了—— 这一次,只需一张脸部照片、一句话描述,就能让你在任何地方跳舞! 例如下面这段《擦玻璃》的舞蹈视频: 图片 你所需要做的就是“投喂”一张人像,以及一段prompt: 一个女孩,微笑着,...
-
后期狂喜!一张照片丝滑替换视频主角,动作幅度再大也OK|Meta&新加坡国立大学
后期狂喜了家人们~ 现在,只需一张图片就能替换视频主角,效果还是如此的丝滑! 且看这个叫做“VideoSwap”的新视频编辑模型—— 小猫一键变小狗,基操~ 如果原物体本身扭动幅度大一些?也完全没问题: 细看俩者之间的运动轨迹,给你保持得是一毛一样:...
-
AI文生视频,会在明年迎来“GPT时刻”
在当下的AI赛道上,AI生文、生图的应用,早已层出不穷,相关的技术,也在不断日新月异。 而与之相比,AI文生视频,却是一个迟迟未被“攻下”的阵地。 抖动、闪现、时长太短,这一系列缺陷,让AI生成的视频只能停留在“图一乐”的层面,很难拿来使用,更不要说提供商...
-
BlurOn软件官方体验入口 AI自动马赛克软件哪个好
BlurOn是一款使用NTT Data的AI技术的插件,能够在视频中自动识别脸部、头部、全身、车牌等元素,并以高达99.7%的精度自动添加马赛克和模糊效果。该插件操作简便,安装后即可使用,即使是新手也可以轻松上手。这一功能在电视节目制作、自动驾驶开发、医疗...
-
视频版ContorlNet来了!SparseCtrl增强AI生成视频可控性
在文本到视频(T2V)领域的最新研究中,SparseCtrl技术通过引入时间稀疏信号实现了对视频结构的灵活控制。传统的文本提示在空间不确定性方面存在问题,容易导致模糊的帧组合。 为了提高可控性,SparseCtrl采用了密集结构信号,如逐帧深度/边缘序列,...
-
Stable Diffusion实操示例
目录 一、负向提示词 二、高清修复(Hi-Res Fix 三、局部重绘inPaint 1、“让眼睛闭起来”的特效 2、“将花朵替换为蝴蝶”的特效 3、更换背景 四、涂鸦重绘 1、与局部重绘的区别 2、修复手指 五、Control...
-
使用 stable diffusion 将视频动漫化
利用 controlnet 的 SoftEdge 算法和 Open Pose,再加 ebsynth 插件将一段真人的跳舞视频动漫化,具体步骤: 1、使用 ebsynth 设置好输出目录(不能有中文,否则会报错,已经试过了),选择原视频,运行抽取序列帧并...
-
GPT-4V在自动驾驶上应用前景如何?面向真实场景的全面测评来了
GPT-4V 的发布让许多计算机视觉(CV)应用看到了新的可能。一些研究人员开始探索 GPT-4V 的实际应用潜力。 最近,一篇题为《On the Road with GPT-4V (ision : Early Explorations of Visua...
-
抖音AI丝滑变装视频教程 comfyUI+animatediff=王炸!
还记得抖音博主“娜乌斯嘉AI”之前爆火的40秒AI丝滑变装视频吗?很多人可能好奇,AI视频是如何做到如此丝滑的。 这不,娜乌斯嘉无私地就跟大家分享了她制作这个AI丝滑变装视频的完整教程,你准备好上车了吗? 据了解,此次,娜娜使用的的工具不再是Web用户界面...
-
Stable Diffusion +EbSynth应用实践和经验分享
Ebsynth应用 1.安装ffmpeg 2.安装pip install transparent-background,下载模型https://www.mediafire.com/file/gjvux7ys4to9b4v/latest.pth/file 放...
-
NeRF与自动驾驶的前世今生,近10篇论文汇总!
神经辐射场(Neural Radiance Fields)自2020年被提出以来,相关论文数量呈指数增长,不但成为了三维重建的重要分支方向,也逐渐作为自动驾驶重要工具活跃在研究前沿。 NeRF这两年异军突起,主要因为它跳过了传统CV重建pipeline的...
-
语言作“纽带”,拳打脚踢各模态,超越Imagebind
北大联合腾讯打造了一个多模态15边形战士! 以语言为中心,“拳打脚踢”视频、音频、深度、红外理解等各模态。 具体来说,研究人员提出了一个叫做LanguageBind的多模态预训练框架。 用语言作为与其它模态之间的纽带,冻结语言编码器,然后用对比学习方法...
-
Stable Diffusion AI绘图使用记录
1、下载安装使用 官方网站https://github.com/AUTOMATIC1111/stable-diffusion-webui 跟着一步步安装就行(英文版的) 2、真人转二次元 下载控制插件Contro lnetGitHub - M...
-
自动驾驶系统中相机相对地面的在线标定
本文经自动驾驶之心公众号授权转载,转载请联系出处。 文章:Online Camera-to-ground Calibration for Autonomous Driving 作者:Binbin Li, Xinyu Du, Yao Hu, Hao Yu...
-
首个多视角自动驾驶场景视频生成世界模型 | DrivingDiffusion: BEV数据和仿真新思路
笔者的一些个人思考 在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面: 不同维度上的长尾场景:如障碍物数据中近距离的车辆以及切车过程中...