关键帧第2页 - AIGC资讯

W.A.L.T官网体验入口 AI视频图像生成软件app免费下载地址

《W.A.L.T》是一个基于transformer的实景视频生成方法，它通过联合压缩图像和视频到一个统一的潜在空间，实现跨模态的训练和生成。使用了窗注意力机制来提高内存和训练效率，该方法在多个视频和图像生成基准测试上取得了最先进的性能。《W.A.L.T》在...

大数据 2023-12-12 人工智能

871阅读

阿里又整活儿：一张人脸一句话就能跳《擦玻璃》，服装背景随意换！

继AnimateAnyone之后，阿里又一项“舞蹈整活儿”论文火了—— 这一次，只需一张脸部照片、一句话描述，就能让你在任何地方跳舞！例如下面这段《擦玻璃》的舞蹈视频：图片你所需要做的就是“投喂”一张人像，以及一段prompt：一个女孩，微笑着，...

大数据 2023-12-12 人工智能

864阅读

后期狂喜！一张照片丝滑替换视频主角，动作幅度再大也OK｜Meta&新加坡国立大学

后期狂喜了家人们～现在，只需一张图片就能替换视频主角，效果还是如此的丝滑！且看这个叫做“VideoSwap”的新视频编辑模型—— 小猫一键变小狗，基操～如果原物体本身扭动幅度大一些？也完全没问题：细看俩者之间的运动轨迹，给你保持得是一毛一样：...

AIGC 2023-12-07 人工智能

747阅读

AI文生视频，会在明年迎来“GPT时刻”

在当下的AI赛道上，AI生文、生图的应用，早已层出不穷，相关的技术，也在不断日新月异。而与之相比，AI文生视频，却是一个迟迟未被“攻下”的阵地。抖动、闪现、时长太短，这一系列缺陷，让AI生成的视频只能停留在“图一乐”的层面，很难拿来使用，更不要说提供商...

AIGC 2023-12-06 人工智能

828阅读

BlurOn软件官方体验入口 AI自动马赛克软件哪个好

BlurOn是一款使用NTT Data的AI技术的插件，能够在视频中自动识别脸部、头部、全身、车牌等元素，并以高达99.7%的精度自动添加马赛克和模糊效果。该插件操作简便，安装后即可使用，即使是新手也可以轻松上手。这一功能在电视节目制作、自动驾驶开发、医疗...

生成式AI 2023-12-05 人工智能

1072阅读

视频版ContorlNet来了！SparseCtrl增强AI生成视频可控性

在文本到视频（T2V）领域的最新研究中，SparseCtrl技术通过引入时间稀疏信号实现了对视频结构的灵活控制。传统的文本提示在空间不确定性方面存在问题，容易导致模糊的帧组合。为了提高可控性，SparseCtrl采用了密集结构信号，如逐帧深度/边缘序列，...

大数据 2023-11-30 人工智能

810阅读

Stable Diffusion实操示例

目录一、负向提示词二、高清修复(Hi-Res Fix 三、局部重绘inPaint 1、“让眼睛闭起来”的特效 2、“将花朵替换为蝴蝶”的特效 3、更换背景四、涂鸦重绘 1、与局部重绘的区别 2、修复手指五、Control...

AIGC 2023-11-30 人工智能

1121阅读

使用 stable diffusion 将视频动漫化

利用 controlnet 的 SoftEdge 算法和 Open Pose，再加 ebsynth 插件将一段真人的跳舞视频动漫化，具体步骤： 1、使用 ebsynth 设置好输出目录（不能有中文，否则会报错，已经试过了），选择原视频，运行抽取序列帧并...

AIGC 2023-11-24 人工智能

2107阅读

GPT-4V在自动驾驶上应用前景如何？面向真实场景的全面测评来了

GPT-4V 的发布让许多计算机视觉（CV）应用看到了新的可能。一些研究人员开始探索 GPT-4V 的实际应用潜力。最近，一篇题为《On the Road with GPT-4V (ision : Early Explorations of Visua...

人工智能 2023-11-20 人工智能

805阅读

抖音AI丝滑变装视频教程 comfyUI+animatediff=王炸！

还记得抖音博主“娜乌斯嘉AI”之前爆火的40秒AI丝滑变装视频吗?很多人可能好奇，AI视频是如何做到如此丝滑的。这不，娜乌斯嘉无私地就跟大家分享了她制作这个AI丝滑变装视频的完整教程，你准备好上车了吗? 据了解，此次，娜娜使用的的工具不再是Web用户界面...

大数据 2023-11-16 人工智能

1923阅读

Stable Diffusion +EbSynth应用实践和经验分享

Ebsynth应用 1.安装ffmpeg 2.安装pip install transparent-background，下载模型https://www.mediafire.com/file/gjvux7ys4to9b4v/latest.pth/file 放...

AIGC 2023-11-14 人工智能

911阅读

NeRF与自动驾驶的前世今生，近10篇论文汇总！

神经辐射场（Neural Radiance Fields）自2020年被提出以来，相关论文数量呈指数增长，不但成为了三维重建的重要分支方向，也逐渐作为自动驾驶重要工具活跃在研究前沿。 NeRF这两年异军突起，主要因为它跳过了传统CV重建pipeline的...

生成式AI 2023-11-14 人工智能

996阅读

语言作“纽带”，拳打脚踢各模态，超越Imagebind

北大联合腾讯打造了一个多模态15边形战士！以语言为中心，“拳打脚踢”视频、音频、深度、红外理解等各模态。具体来说，研究人员提出了一个叫做LanguageBind的多模态预训练框架。用语言作为与其它模态之间的纽带，冻结语言编码器，然后用对比学习方法...

生成式AI 2023-11-13 人工智能

837阅读

Stable Diffusion AI绘图使用记录

1、下载安装使用官方网站https://github.com/AUTOMATIC1111/stable-diffusion-webui 跟着一步步安装就行（英文版的） 2、真人转二次元下载控制插件Contro lnetGitHub - M...

生成式AI 2023-11-12 人工智能

962阅读

自动驾驶系统中相机相对地面的在线标定

本文经自动驾驶之心公众号授权转载，转载请联系出处。文章：Online Camera-to-ground Calibration for Autonomous Driving 作者：Binbin Li, Xinyu Du, Yao Hu, Hao Yu...

AIGC 2023-11-07 人工智能

890阅读

首个多视角自动驾驶场景视频生成世界模型 | DrivingDiffusion: BEV数据和仿真新思路

笔者的一些个人思考在自动驾驶领域，随着BEV-based子任务/端到端方案的发展，高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点，“高质量”可以解耦成三个方面：不同维度上的长尾场景：如障碍物数据中近距离的车辆以及切车过程中...

人工智能 2023-10-24 人工智能

1479阅读