-
【AIGC数字人】EchoMimic:基于可编辑关键点条件的类人音频驱动肖像动画
GitHub:https://github.com/BadToBest/EchoMimic 论文: https://arxiv.org/pdf/2407.08136 comfyui: https://github.com/smthemex/ComfyU...
-
MidJourney 产品拆解调研报告
目录 1.产品概述 2. 目标用户与市场定位 3. 产品核心功能拆解 功能列表 功能使用流程 交互体验 4.用户体验评估 1. 用户视角 2. 情感设计 3. 使用场景 5.数据和技术分析 1. 技术架构 2. 性能评估 3....
-
5个Midjourney实用技巧,让你的图片更自然真实,摆脱“AI味”
一个不错的AI插件:https://ilingban.com/browser_extension/?from=zbr 在当前的视觉创作领域,AI生成图片已经成为了一种热门趋势,尤其是像Midjourney这样的工具,它可以让你轻松生成各种风格的图像。然而...
-
在MidJourney上创建一致的多个角色——使用这个简单的技巧!
如果你喜欢MidJourney,你可能已经在尝试MidJourney最新发布的“角色参考”功能。这个强大的新功能允许你使用一个角色的图像作为参考,使MidJourney能够在你的新创作中复制该角色,并在你的图像中实现角色的一致性。然而,存在一个问题…?...
-
【AI绘画】ControlNet:一文搞懂Stable Diffusion最重要的插件
大家好,我是SD教程菌。 当你使用 Stable diffusion 生成图像时,是否有过这种经历?提示词内容在生成结果中似乎都体现出来了,但又总不是自己想要的样子,于是陷入到无限生成(抽卡)的状态,耗费大量时间,逐渐消磨兴趣、耐性及对SD的信任。 同...
-
07 Midjourney从零到商用·基础篇:参数合集详解
在使用 Midjourney 生成图片时,除了 Prompt(提示词)要写好之外,Parameters(后缀参数)也是非常重要的一部分。它可以帮助我们更加精确地控制图像生成的方式,例如:图像的宽高比、风格化程度、完成度等等,是提高 AI 绘画能力必须...
-
深度剖析Google黑科技RB-Modulation:告别繁琐训练,拥抱无限创意生成和风格迁移!
给定单个参考图像,RB-Modulation提供了一个无需训练的即插即用解决方案,用于(a 风格化和(b 具有各种提示的内容样式组合,同时保持样本多样性和提示对齐。例如,给定参考样式图像(例如“熔化的黄金3d渲染样式” 和内容图像(例如(a “狗” ,RB...
-
ComfyUI插件:ComfyUI layer style 节点(三)
前言: 学习ComfyUI是一场持久战,而ComfyUI layer style 是一组专为图片设计制作且集成了Photoshop功能的强大节点。该节点几乎将PhotoShop的全部功能迁移到ComfyUI,诸如提供仿照Adobe Photoshop的图...
-
Datawhale X 魔塔AI夏令营 ——从零入门AI生图原理&实践_task 1
一. 基础知识 1.1 文生图发展历史 1.2 文生图基础知识 文生图主要以SD系列基础模型为主,以及在其基础上微调的lora模型和人物基础模型等。 1.2.1 文生图流程图 1. 输入提示词 ...
-
一键音频驱动图片数字人项目——EchoMimic(附整合包)
大家好,今天要给大家带来一个数字人相关项目——EchoMimic。该项目是由蚂蚁集团支付宝终端技术部出品,只需要一段音频和一个参考图片,EchoMimic就能让图片中的人物“活”起来。 我已制作好一键启动整合包和云端一键部署镜像方便大家快速上手体验!...
-
AI日报:GPT-4o新版本上线;面壁智能开源手机版“GPT-4V”;华为推3D数字人新框架EmoTalk3D;阿里上线奥运时刻海报工作流
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、开发者狂喜!GPT-4o新版本...
-
每日AIGC最新进展(48):腾讯提出Rich-Contextual Conditional Diffusion Models、OPPO提出自动生成复杂字形海报模型、南京大学提出基于Mamba插帧模型
Diffusion Models专栏文章汇总:入门与实战 Boosting Consistency in Story Visualization with Rich-Contextual Conditional Diffusion Models...
-
Gaussian Splatting+Stable Diffusion进行3D场景编辑!腾讯提出TIP-Editor新框架!
Gaussian Splatting+Stable Diffusion进行3D场景编辑!腾讯提出TIP-Editor新框架! 原创 小源 数源AI 2024-01-29 20:19 浙江 数源AI 知识星球 数源AI论文推荐知识星球(每日最新论文及资...
-
WD1.4标签器:Stable Diffusion的提示词反推神器
引言 在AI绘画领域,Stable Diffusion(SD)因其强大的生成能力而备受关注。然而,如何精准地控制和优化生成效果,常常是许多用户面临的问题。今天,我们将详细介绍一款实用的插件——WD1.4标签器,它可以帮助我们反推出图片背后的提示词,从而...
-
3 种华丽的Midjourney 风格参考
1. 参考风格: 70s – 70 年代 (灰色和青色 下面的图片可以作为你的 Midjourney 70s 风格参考图。 用法: --serf urlA urlB urlC 案例1: 70 年代产品的编辑摄影 + 复古美学...
-
【AI绘画教程】Stable Diffusion 1.5 vs 2
在本文中,我们将总结稳定扩散 1 与稳定扩散 2 辩论中的所有要点。我们将在第一部分中查看这些差异存在的实际原因,但如果您想直接了解实际差异,您可以跳下否定提示部分。让我们开始吧! Stable Diffusion 2.1 发布与1.5相比,2.1旨...
-
京东广告研发——AIGC在京东广告创意的技术应用
一、前言 电商广告图片不仅能够抓住消费者的眼球,还可以传递品牌核心价值和故事,建立起与消费者之间的情感联系。然而现有的广告图片大多依赖人工制作,存在效率和成本的限制。尽管最近AIGC技术取得了卓越的进展,但其在广告图片的应用还存在缺乏卖点信息、难以规模...
-
普通人怎么通过AI绘画赚钱?6种方法,简单好上手,一学就会
当下网络热点中,AI 绘画备受瞩目。其应用广泛,如何将之转化为实际收益?让我们一同探索赚钱之道 一、什么是AI绘画 AI绘画技术让你无需掌握任何绘画基础和软件技能,人人都能轻松上手。用户通过输入关键词、描述或参考图像等信息,AI 便能创作出风格多样、富...
-
如何使用 Midjourney换脸,将一个人面部复制并粘贴到任意人身上
嘿,想不想将一个人的面部随意粘贴到任意人身上?现在开始教学如何使用 Discord 中的Midjourney Bot 实现,这就是“COPY A FACE”这个超酷的功能,它能帮你一键把脸贴到任何图片上。用到的是一个叫“InsightFace”的开源Dis...
-
霉霉开口唱碧昂丝的歌,又是AI!口型不出戏,五官姿态也自然,复旦百度等出品|GitHub揽星1k+
一张人像、一段音频参考,就能让霉霉在你面前唱碧昂丝的《Halo》。 一种名为Hallo的研究火了,GitHub已揽星1k+。 话不多说,来看更多效果: 不论是说话还是唱歌,都能和各种风格的人像相匹配。从口型到眉毛眼睛动作,各种五官细节都很自然。 单独...
-
吴恩达老师开源翻译工作流Agent;阿里巴巴开源无需训练即可使用参考图像编辑图像的工具;Whisper Web 浏览器字幕生成
✨ 1: Translation Agent Translation Agent 吴恩达老师开源翻译工作流Agent Translation Agent 是一个基于反思工作流程的机器翻译系统的Python示范。其主要步骤包括: 使用大语...
-
每日AIGC最新进展(11):角色脸妆生成、防止微调Stable Diffusion过拟合的方法、通过 3D Gaussian Splatting 进行特定于说话者的头部说话合成
Diffusion Models专栏文章汇总:入门与实战 Gorgeous: Create Your Desired Character Facial Makeup from Any Ideas https://arxiv.org/abs/2404...
-
阿里图片编辑项目MimicBrush 可通过AI技术完美融合两张图片(附MimicBrush产品地址)
MimicBrush 是阿里巴巴推出的一款创新的图片编辑项目,它通过先进的AI技术,能够将一张图片的某一部分融合到另一张图片上。这项技术在电商商品展示、图片编辑和内容迁移等多个领域具有广泛的应用潜力。 核心特点: 模仿式编辑:用户可以直接从野外参考图像...
-
5个Midjourney技巧,让你的图片更自然真实,没有“AI味”
您是否觉得有些AI生成的图像看起来过于完美?有股AI味?MidJourney 可以创建非常高质量的逼真图像,然而画面完美无瑕、栩栩如生,让人感觉完美得令人不安,几乎不真实。 比如这个,有点夸张: 大多数人一眼就能看出,这种完美是 "人工智能生成 "的。...
-
AI绘画SD入门教程:图生图基础用法,我不允许你还不会!
大家好,我是程序员晓晓 在上一篇中,我们学会了文生图的基础用法以及参数设置,这一篇我们继续讲解图生图。图生图就是给出一张参考图,由AI在参考图上做修改。简单来说,就是用原图和提示词进行图片二创。图生图的出现是为了弥补文生图的不足,因为文生图有个无法避免...
-
从商品图到海报生成 京东广告AIGC创意技术应用
一、前言 电商广告图片不仅能够抓住消费者的眼球,还可以传递品牌核心价值和故事,建立起与消费者之间的情感联系。然而现有的广告图片大多依赖人工制作,存在效率和成本的限制。尽管最近 AIGC 技术取得了卓越的进展,但其在广告图片的应用还存在缺乏卖点信息、难以规...
-
ai绘画免费图生图!这4款画图ai软件好用到爆!
日常想用一张精美的图片来装点工作项目,多数时候会遇到这么一种情况,想下载的图片需要付费,且图库的价格又高到飞起,辛辛苦苦找到的图片最终没法使用,很让人受伤。 但还好我们现在已步入 AI 时代,有了 ai 绘画免费图生图工具的加持,这些问题将不...
-
Midjourney新功能:角色参照指南
基本概念 角色参照(Character Reference):这个功能允许用户在不同的图像生成中保持给定参照角色的一致性。 适用模型:适用于Midjourney V6和Niji6型号。 功能亮点 跨风格一致性:可以在不同风格(如动漫风、写实...
-
Novita AI开源Animate Anyone项目 上传一张照片即可合成动画
阿里巴巴的一个项目,利用一张图片和提取视频中的人物姿势合成角色动画,现在被Novita AI开源并提供了API。用户只需提供一张照片和一个参考视频,即可通过API接入合成动画。该项目名为Animate Anyone,灵感来源于MooreThreads/Mo...
-
CVPR 2024 | 风格迁移和人像生成汇总!扩散模型diffusion用于经典AIGC方向
风格迁移 1、DEADiff: An Efficient Stylization Diffusion Model with Disentangled Representations 基于文本到图像扩散模型在迁移参考风格方面具有巨大潜力。然而,...
-
AI日报:阿里对口型视频项目EMO开启内测;苹果官宣端侧小模型OpenELM;Open-Sora偷偷升级;微信发布AI工具小微助手
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、阿里对口型项目EMO开启内测...
-
AI视频生成工具ID-Animator:可保持角色一致生成视频动画
近年来,生成具有指定身份的高保真人类视频引起了广泛关注。然而,现有技术在训练效率和身份保持之间往往难以取得平衡,要么需要繁琐的逐案微调,要么在视频生成过程中通常会丢失身份细节。研究提出了一种名为 ID-Animator 的零样本人类视频生成方法,可以在无需...
-
AI电影制作平台Morph Studio正式向候补用户开放访问权限
今日起,备受期待的AI电影制作平台Morph Studio开始向候补用户开放访问权限。这一消息一出,立即引发了广大用户的热烈反响。 Morph Studio官方表示,该平台将很快加入视频生成角色一致性和配音生成功能。这两个功能的加入,无疑将为平台的用户体验...
-
硬控设计人一分钟,加持大模型的Adobe,PS起来更香了
图像编辑这一块,还得看 Adobe。 刚刚,Adobe 正式宣布推出新的图像生成模型 Firefly Image 3,即日起在 Firefly Web 应用程序、Adobe Photoshop 和 Adobe InDesign 中提供测试版,并在「今年晚...
-
IPAdapter FaceID Plus下载地址 AI图像生成编辑工具使用入口
ComfyUI-IPAdapter-Plus是一个强大的图像生成和编辑工具,专门用于基于一个或多个参考图像进行图像到图像的条件生成。通过文本提示、控制网络和掩码,您可以轻松生成增强图像的各种变体。这款工具类似于单张图像的 Lora。ComfyUI-IPAd...
-
CVPR 2024满分论文,英伟达开源BOP排行榜6D物体姿态第一名方法
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 物体姿态估计对于各种应用至关重要,例如机器人操纵和混合现实。实例级方法通常需要纹理 CAD 模型来生成训练数据,并且不能应用于测试时未...
-
腾讯开源视频生成新工具,论文还没发先上代码的那种
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 先上代码再发论文,腾讯新开源文生视频工具火了。 名为MuseV,主打基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成。 老规矩,先看...
-
MuseV官网体验入口 虚拟人AI视频生成软件使用地址
MuseV是一个基于扩散模型的虚拟人视频生成框架,支持无限长度视频生成,采用了新颖的视觉条件并行去噪方案。它提供了预训练的虚拟人视频生成模型,支持Image2Video、Text2Image2Video、Video2Video等功能,兼容Stable Di...
-
快速理解AIGC图像控制利器ControlNet和Lora的架构原理
作者公众号 大数据与AI杂谈 (TalkCheap),转载请标明出处 ControlNet以及Lora是什么,玩过stable diffusion AI图像生成的同学应该都不陌生。 一般来说,如果你用以SD 或 SDXL为基础的模型来生成图像,产出的图...
-
Midjourney能让角色保持一致了
Midjourney发布新功能,网友直呼“不可思议”! 现在你可以让生成的图像几乎保持角色一致,belike: 所有超级英雄长一个模样盯着你。 甚至动漫风、写实风等跨风格生成也同样适用: 保持同一风格,感jio配上文字可以讲一个故事...
-
Midjourney 重大更新!深度解析「角色一致性」命令
Midjourney 重大更新!深度解析「角色一致性」命令 大家期待已久的 MJ 角色一致性功能终于来啦!全新的命令“–cref”现已推出,与之前的样式参考“–sref”功能相似,但不同的是,它不是匹配参考样式,而是试图让角色与“角色参考”图像相匹...
-
【AIGC】Animate Anyone阿里全民舞王背后的科技,基于图片高可控动画生成
在11月底,阿里巴巴集团智能计算研究院发布了一款AI动画项目:Animate Anyone。只需要一张人物静态图片,结合人物的骨骼动画(姿势控制),就能生成一段人物动画视频。 我们先通过官网放出的动画效果直观感受一下。 一. Anima...
-
Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩
近日,由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作 Champ 火爆全网。该模型仅开源 5 天 GitHub 即收获 1k 星,在 Twitter 更是「火出圈」,吸引了大量博主二创,浏览量总量达到 300K。 目前 Champ 已经开源...
-
一张图即出AI视频!谷歌全新扩散模型,让人物动起来
只需一张照片,和一段音频,就能直接生成人物说话的视频! 近日,来自谷歌的研究人员发布了多模态扩散模型VLOGGER,让我们朝着虚拟数字人又迈进了一步。 论文地址:https://enriccorona.github.io/vlogger/paper.p...
-
Stable Diffusion~自注意力替换技术
在这篇文章中,作者展示了一个较为复杂的基于 Diffusers 开发的自注意力替换示例项目,用于提升 SD 视频生成的一致性。在这个过程中,作者讲述了 AttentionProcessor 相关接口函数的使用,并了解了如何基于全局管理类实现一个代码可维护性...
-
深度估计SOTA!自动驾驶单目与环视深度的自适应融合
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&个人理解 多视图深度估计在各种基准测试中都取得了较高性能。然而,目前几乎所有的多视图系统都依赖于给定的理想相机姿态,而这在许多现实世界的场景中是不可用的,例如自动驾驶。本工作提出了一...
-
不只是高清放大!Magnific AI照片风格化功能上线
Magnific AI的照片风格化功能已经正式上线。这项全新的功能可以将你的任何照片转换成你所期望的任何风格。无论你想变换任何图像,都可以控制传输的样式数量和结构完整性,这为3D、视频游戏、室内设计、娱乐等领域提供了无限的用例。 产品入口:https:/...
-
Midjourney能让角色保持一致了!网友连夜实测:改变游戏规则
Midjourney发布新功能,网友直呼“不可思议”! 现在你可以让生成的图像几乎保持角色一致,belike: 所有超级英雄长一个模样盯着你。 甚至动漫风、写实风等跨风格生成也同样适用: 保持同一风格,感jio配上文字可以讲一个故事了: 面部、着装...
-
Midjourney风格一致功能解读及使用方法
Midjourneys再次迎来更新,本次新增“风格一致”功能!用户期待已久的风格模仿功能终于实现了! --sref 虽然目前只是测试功能,但已经相当强大了,这篇文章我将带大家先睹为快! 别忘了,这个功能目前只能在v6和niji 6中使用哦! 下面...
-
一文看尽297篇文献!中科院领衔发表首篇「基于扩散模型的图像编辑」综述
本文全面研究图像编辑前沿方法,并根据技术路线精炼地划分为3个大类、14个子类,通过表格列明每个方法的类型、条件、可执行任务等信息。 此外,本文提出了一个全新benchmark以及LMM Score指标来对代表性方法进行实验评估,为研究者提供了便捷的学习参...