-
Midjourney如何实现多人物一致性(简易版)
做AIGC相关领域实习的一个多月里,接触到了很多AI工具。AI工具高效而聪明,但囿于技术的限制,在使用过程中仍然存在一些问题。 作为ai绘本制作者,使用Midjourney绘图时如何保持人物一致性就是一个困扰我许久的难点。经过反复尝试,或许有一些小办法可...
-
百变背景:万相实验室AIGC电商图片可控生成技术
✍🏻 本文作者:云芑、因尘、岁星、也鹿 1. 背景 随着AI生成内容(AIGC)技术如Diffusion的飞速进展,现如今,大家已能够轻易地使用Stable Diffusion(SD)[1]等文生图的模型或工具,将心中所想仅凭语言描述(...
-
他用仨AI,10天“肝”出全网刷屏AI短剧,还说你上你也行?
仅概念片就获得 60 万全网浏览量、刚刚播出 3 集快手单平台播放量破 1000 万、首播登上院线大屏幕...... 这并不是某一个明星大咖出演的大制作电影,而是国内第一部由AI生成的原创玄幻短剧《山海奇镜》。 上周末,《山海奇镜》在快手星芒短剧正式上线,...
-
[AIGC] ClickHouse分布式表与本地表的区别及如何查询所有本地表记录
在大规模数据处理和分析场景中,ClickHouse是一种高性能的列式数据库管理系统。ClickHouse支持分布式表和本地表两种表类型,本文将介绍这两种表类型的区别,并探讨如何建表以查询所有本地表的记录。 文章目录 一、ClickH...
-
Stable Diffusion【进阶篇】:Inpainting完整指南(上)
注:文章使用的AI绘画SD整合包、各种模型插件、提示词、AI人工智能学习资料都已经打包好放在网盘中了,无需自行查找,有需要的小伙伴文末扫码自行获取。 个人觉得对大家理解局部重绘(Inpainting)非常有用,所以这里整理出来,希望能帮助到大家。由于原文...
-
山东大学项目实训(十六):基于LLaMA-Factory的微调模型评估和测试
在LLaMA-Factory的Evaluate & Predict界面进行评测 原始模型评测 微调后模型评测 可以看到,微调之后的模型在各个指标上有了显著提升 在完成大型语言模型(如 ChatGLM)的微调后,对模型进行全面评估...
-
每日AIGC最新进展(35):字节跳动提出人物肖像动画X-Portrait、字节跳动提出组合式视频编辑Edit3K、东华大学提出基于GCN的草图建模方法DC-gra2seq
Diffusion Models专栏文章汇总:入门与实战 X-Portrait: Expressive Portrait Animation with Hierarchical Motion Attention X-Portrait是由字节跳动...
-
【AIGC-图片生成视频系列-7】MoonShot:实现多模态条件下的可控视频生成和编辑
目录 一. 贡献概述 二. 方法详解编辑 三. Zero-Shot主题定制视频生成 四. 文本到视频生成 五. 直接使用图像ControlNet 六. 图像动画比较 七. 视频编辑 八. 针对视频生成中多模态 Cross-Attn的消融实...
-
Diffusion【1】:SDSeg——基于Stable Diffusion的单步扩散分割!
文章目录 前言 Abstract Introduction Methods Latent Estimation Concatenate Latent Fusion Trainable Vision Encoder Experiment D...
-
探索AI写作的深度奥秘:从困惑度到爆发度的挑战与机遇
大家好,今天来聊聊探索AI写作的深度奥秘:从困惑度到爆发度的挑战与机遇,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 探索AI写作的深度奥秘:从困惑度到爆发度的挑战与机遇 在AI技术飞速发展...
-
AIGC短剧卷起来了!没有演员全AI生成 快手抖音领衔竞速
7月13日,国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》上线快手,可灵大模型提供深度技术支持。 五天前,抖音和博纳合作的首部AIGC科幻短剧《三星堆:未来启示录》上线,抖音视频大模型即梦提供技术支持。 一周之内,抖音、快手相继上线AIGC短剧作品,...
-
AI战火烧至短剧!抖音快手抢先开打,带来哪些启示?
AI再度“爆改”短剧。 近日,抖音、快手纷纷上线了各自的AI短剧,凭借堪比大片的画面和质感,在行业内引发热议。两大平台背后的AI视频生成产品——即梦和可灵,也成为了焦点。 AI究竟会如何影响短剧行业?对于短剧从业者而言,AI是蜜糖还是砒霜? 抖音快手瞄准A...
-
新书速览|解密AI绘画与修图: Stable Diffusion+Photoshop
《解密AI绘画与修图: Stable Diffusion+Photoshop》 本书内容 《解密AI绘画与修图:Stable Diffusion+Photoshop》全面介绍了Photoshop和Stable Diffusion的交互方式,...
-
AI绘画Stable Diffusion:ControlNet插件inpaint_only一键扩图,竖屏变横屏大图教程!
大家好,我是程序员晓晓 大家常常讨论Photoshop beta版中的创造性填充扩图功能,已经不能用了,但是否存在替代方案呢?答案是肯定的。今天,分析如何使用Stable Diffusion来实现类似的图像扩展效果。 1、安装和升级必要插件 1、更新...
-
Recraft.AI完全指南:人工智能设计工具使用方法教程与免费使用入口
探索Recraft.AI能为你带来哪些改变 为什么选择Recraft.AI? Recraft.AI不仅仅是一款产品——它是一项革命性的技术,致力于利用先进的人工智能技术为用户提供从文本或视觉输入到复杂设计的快速转化。致力于提供AI设计工具,让创意无限,R...
-
中国首个AI厨王诞生,苦练7吨菜通过「图灵测试」!网友:机器人都比我会做饭
最近,一位AI炒菜机器人不仅向人类大厨发起了PK,而且还通过了「图灵测试」:根本吃不出来是AI机器人炒的!而在这背后,竟然是1.5个亿的投入和近7吨菜的训练。 你敢相信么?机器人,正式和湘菜大厨「叫板」了! 最近,这位名叫「美膳狮」的AI炒菜机器人,向湘菜...
-
达摩院发布一站式AI视频创作平台“寻光”,打造全新AI工作流
今年是 AI 视频生成爆发的元年,以 Sora 为代表的算法模型和产品应用不断涌现。短短几个月内,我们目睹了几十种视频生成工具的问世,基于 AI 的视频创作方式开始流行起来。 但新技术也引发更多的挑战与质疑,除了大家熟知的 “开盲盒”现象,AI 所生成的视...
-
用 stable diffusion 做图文女装号,开启你的带货之旅!!
对于很多入门级的新人来说,很想做副业,但是会遇见各种各样的问题,比如不会写文案,不会拍摄视频,不会剪辑视频,不会二次创作,导致没有原创的作品,直接搬运没有流量等,基于这些原因,很多人都只是观望,过段时间后又该干啥干啥了。 图文带货目前在各大平台都很火,不...
-
国产动漫视频AI火了!二次元老婆随意捏,哥特、梦幻、机甲一键get
【新智元导读】视频生成赛道又起新秀,而且还是二次元定制版!稳定产出电影级画面,一键文/图生成视频,即使是「手残党」也能复刻自己喜欢的动漫作品了。 现在,各位二次元萌新们,不用再等「太太」出图啦! 我们不仅可以自己产粮,而且还是会动的那种。 如今,AI视频生...
-
央视点赞国产AI复活召唤术,兵马俑竟与宝石老舅对唱Rap?
沉睡了两千多年的兵马俑,苏醒了? 一句秦腔开场,将我们带到了黄土高原。如果不是亲眼所见,很多观众可能难以想象,有生之年还能看到兵马俑和宝石 Gem 同台对唱《从军行》。 「青海长云暗雪山,孤城遥望玉门关。」古调虽存音乐变,声音依旧动人情: 这场表演背后的...
-
AIGC-CVPR2024best paper-Rich Human Feedback for Text-to-Image Generation-论文精读
Rich Human Feedback for Text-to-Image Generation斩获CVPR2024最佳论文!受大模型中的RLHF技术启发,团队用人类反馈来改进Stable Diffusion等文生图模型。这项研究来自UCSD、谷歌等。 在...
-
智能写作时代:探索5款AI工具,提升你的写作技能
写作这件事一直让我们从小学生头痛到打工人,初高中时期800字的作文让我们焦头烂额,一篇作文里用尽了口水话,拼拼凑凑才勉强完成。 大学时期以为可以轻松顺利毕业,结果毕业前的最后一道坎拦住我们的是毕业论文,苦战几个通宵勉强通过,艰难毕业。 以为成为打工人后...
-
我测了12个小时的RunwayGen3,发现这就是AI视频的No.1
昨天,众多AI视频创作者翘首以盼的Runway的Gen3,终于面向部分超级合作者开放了。 我的好基友@闲人一坤也是第一时间拿到了内测资格,我就直接把号要来了。 我从中午到凌晨,跑了12个小时,几百个Case。 发现我之前开的香槟,没开早。 先放几个我觉得还...
-
AIGC专栏11——EasyAnimateV2结构详解与Lora训练 最大支持768x768 144帧视频生成
AIGC专栏11——EasyAnimateV2结构详解与Lora训练 最大支持768x768 144帧视频生成 学习前言 源码下载地址 EasyAnimate V2简介 技术储备 Diffusion Transformer (DiT Mo...
-
【进阶篇】Midjourney如何最大限度精准控图,做到收放自如?
和朋友们一起玩MJ也已经快两个月了,从一开始的惊喜,到现在的平淡,大家都开始思考这个到底我们应该怎么用?而不是仅仅是为了满足自己对MJ本身的好奇心,以及生出一张美图时的那种喜悦感。 目前大家最多的疑问就是,怎样更精准的控制图片输出,然后又怎样让图片更富有...
-
用AI制作历史解说视频:GPT + MidJourney + PiKa + FunSound + 剪映
1. 项目介绍 最近某站看到一个看到利用AI创作视频解说,成品画面很酷炫。对此以初学者视角进行复现,创意来源:用AI制作历史解说视频 2. 开始创作 我们参照原作者展示的内容,对古代人物屈原来生成解说视频。 2.1 故事脚本+分镜 【由GP...
-
如何让Stable Diffusion在不同场景保持人物形象的一致性
我们知道Stable Diffusion生成图像的随机性导致很难控制生成同样的人物形象或动作。这种问题会出现在绘本创作,小说配图等场景中,因为在这些场景,人物的衣着打扮、人物动作、表情都不一样,但是要求始终是同一个人。这个基本要求很重要,如果你仔细看过 幼...
-
每日AIGC最新进展(29):复旦大学提出通过人类反馈来优化语音生成模型SpeechAlign、浙江大学提出跟踪3D空间中的任何2D像素SpatialTracker、西安交大提出动态场景的语义流
Diffusion Models专栏文章汇总:入门与实战 SpeechAlign: Aligning Speech Generation to Human Preferences 本文介绍了一种名为SpeechAlign的方法,旨在通过人类反馈...
-
每日AIGC最新进展(27):用于视频生成的ControlNets Ctrl-Adapter、无缝循环视频生成LoopAnimate、高分辨率大型视觉-语言模型InternLM-XComposer2
Diffusion Models专栏文章汇总:入门与实战 Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusio...
-
跟AI做搭子,还是这届年轻人会玩儿
这届年轻人越来越喜欢跟AI做搭子。 比如跟AI做生活搭子,让它帮自己挑水果,X平台网友“Cydiar”前不久发文,说自己用GPT-4o选出了水果店里薄皮沙瓤的一个甜西瓜。 对此,有超70万网友在线围观,还有不少人在评论区用AI选起了各种水果。 除了让...
-
[AIGC] 事务的四大特性是怎么实现的
文章目录 原子性是通过 `undo log`实现的。 一致性是通过 `redo log`实现的。 隔离性的实现 (分事务的隔离级别讨论) 持久性是利用 redo log 实现的 写入过程 原子性是通过 undo log实现的。...
-
如何使用 Midjourney换脸,将一个人面部复制并粘贴到任意人身上
嘿,想不想将一个人的面部随意粘贴到任意人身上?现在开始教学如何使用 Discord 中的Midjourney Bot 实现,这就是“COPY A FACE”这个超酷的功能,它能帮你一键把脸贴到任何图片上。用到的是一个叫“InsightFace”的开源Dis...
-
AI日报:新王诞生!Runway重磅发布Gen-3 Alpha;Luma AI发布Extend功能;DeepSeek又开源了一个模型;ElevenLabs可为视频自动配音
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、AI视频王者回归!Runway...
-
Gen-3 Alpha有哪些功能免费吗?Runway视频生成AI模型怎么使用方法详细教程指南
Gen-3 Alpha 是什么? Gen-3 Alpha 是 Runway 训练的一系列模型中的首个,它在新的基础设施上训练,专为大规模多模态训练而建。它在保真度、一致性和动作方面相较于 Gen-2 有重大改进,并朝着构建通用世界模型迈进了一步。该模型能够...
-
Runway正式发布全新Gen3模型,AI视频的王,它回来了。
在AI视频被一众新秀,比如Sora、Luma、可灵等等占据注意力的时候,已经有人忘了AI视频领域统治了N久的王者,他叫Runway。 去年的11月份更新了一次Gen2模型模型,然后宣布他们要开始组团队开始进军世界模型之后。 他们就再无动静了。 一晃眼,将...
-
霉霉开口唱碧昂丝的歌,又是AI!口型不出戏,五官姿态也自然,复旦百度等出品|GitHub揽星1k+
一张人像、一段音频参考,就能让霉霉在你面前唱碧昂丝的《Halo》。 一种名为Hallo的研究火了,GitHub已揽星1k+。 话不多说,来看更多效果: 不论是说话还是唱歌,都能和各种风格的人像相匹配。从口型到眉毛眼睛动作,各种五官细节都很自然。 单独...
-
Gen-3 Alpha完全指南:Runway AI视频生成模型使用方法教程与免费体验地址入口
探索Gen-3 Alpha能为你带来哪些改变 为什么选择Gen-3 Alpha? Gen-3 Alpha不仅仅是一款产品——它是一项革命性的技术,致力于在新的基础设施上进行大规模多模态训练,专为创意专业人士、视频制作者和艺术家打造。致力于提供高保真度、一致...
-
图像生成新篇章:Stable Diffusion 3 Medium开源评析
摘要 在数字艺术与人工智能的交汇点上,Stable Diffusion 3(SD3)的开源无疑是一场技术革新的盛宴。就在3月份,我撰写了一篇博文,深入探讨了SD3的技术报告内容与介绍,文章发表在CSDN博客上,https://blog.c...
-
Midjourney绘画参数设置详解
在数字艺术和设计领域,Midjourney是一款强大的绘画工具,它允许艺术家和设计师以数字方式创作出精美的图像。为了充分发挥Midjourney的潜力,正确设置其绘画参数至关重要。本文将深入探讨Midjourney的绘画参数设置,帮助用户更好地掌握这一工具...
-
Midjourney 零基础控图七大参数
1. 微调细节参数「 --chaos」 chaos 参数意为混乱,在 MJ 中使用 chaos 参数可以影响生成结果的变化程度。在提示词后添加 --chaos 或 --c 启用该功能,其数值选范围为 0-100,默认值为 0。chaos 数值越低,生成的...
-
AI画连环画角色更一致了!人物之间的复杂互动也能处理|中山大学&联想团队出品
让AI画漫画角色保持一致的新研究来了! 创作的连环画效果belike: 频繁切换主体、人物之间复杂的互动也能保持角色一致性: 上述效果来自AutoStudio,是一个由中山大学和联想团队联合提出的无需训练的多智能体协同框架。 AutoStudio采用基...
-
揭秘AI精准输出:如何构建完美的AIGC提示词?
揭秘AI精准输出:如何构建完美的AIGC提示词?🤖 文章目录 揭秘AI精准输出:如何构建完美的AIGC提示词?🤖 摘要 引言 正文 📘 提示词的基本概念 1. 什么是提示词? 2. 提示词的作用 📘 如何编写有效的提示词? 理...
-
[AIGC] 了解消息队列事务:保证数据一致性的关键
在分布式系统中,消息队列是一种常见的解耦手段,可以帮助我们简化复杂系统的架构设计,提高系统的可靠性和可扩展性。但是,在使用消息队列时,我们需要注意一个重要的问题:保证数据的一致性。在这篇文章中,我们将介绍如何使用消息队列的事务机制来保证数据的一致性。...
-
每日AIGC最新进展(23):魁北克人工智能研究所提出扩展注意力机制视频编辑、浙江大学提出video-to-Audio生成算法Frieren、清华大学提出扩散模型参数高效迁移学习Diff-Tuning
Diffusion Models专栏文章汇总:入门与实战 Temporally Consistent Object Editing in Videos using Extended Attention 本文提出了一种用于视频编辑的新方法,旨在通过...
-
AI绘画专栏之换脸在SDXL中使用保持人脸一致性INSTANTID FACEID XADAPTER,comfyui
大家都知道腾讯AILab出的ipadapter系列带来的faceid,photomaker非常火,顺便分享一下instantid,跟faceid一样用来保持人脸一致性,孰强孰弱不好说,我只能说我觉得faceid更强,但现在又出来了一个Xadapter是什么...
-
从注册到订阅,Midjourney使用指南,你想知道的都有
Midjourney简介 Midjourney官网:https://www.midjourney.com/home 是一个独立的研究实验室,专注于探索新的思维方式和扩展人类的想象力。它由一个小型的自筹资金团队组成,该团队专注于设计、人类基础设施和人...
-
Stable Diffusion及Fooocus图片放大方法(超分辨率)体会与比较
简单地聊一下图像超分辨率的几种手段与优劣。 由SD或Fooocus等AIGC应用生成的图片一般分辨率(大小)都受到限制,基本是1024左右。 为了将小图放大到4k,或8k,出现了很多图片放大的手段(这里强调以图像超分辨率为目的,要放大,也要合理地增加细节,...
-
Dream Machine有哪些功能免费吗?Luma AI视频生成怎么使用方法详细教程指南
Dream Machine有哪些功能? 它是一款AI模型,能够直接从文本和图像快速生成高质量的逼真视频。它是一个高度可扩展且高效的transformer模型,专门针对视频进行训练,能够生成物理上准确、一致且充满事件的镜头。Dream Machine是构建通...
-
超5万人排队内测!海内外爆火的“中国版Sora”惊艳全场,真这么好用?| AI评测
谁能想到,现在外网最抢手的AI视频生成模型,不是Sora,也不是Runway或Pika,而是国产大模型“Kling(可灵)”。 可灵视频合集在X平台上获得数百万浏览量 由于生成视频效果惊艳,可灵在国外获得了“中国版Sora”“Sora杀手”等称号。 除了...
-
LumaLabsAI视频生成介绍 Dream Machine使用教程指南体验地址入口
Dream Machine简介 Dream Machine 是一款专注于视频生成的AI模型,能够根据文本和图像快速生成高质量逼真视频。它为电影制作人、广告创意者、游戏设计师等创意专业人士提供了快速高效的视频制作工具。 Dream Machine功能亮点...