-
3秒让AI变乖,生成风险图片减少30%!复旦新研究拿下扩散模型概念移除新SOTA|ECCV 2024
让AI绘画模型变“乖”,现在仅需3秒调整模型参数。 效果be like:生成的风险图片比以往最佳方法减少30%! 像这样,在充分移除梵高绘画风格的同时,对非目标艺术风格几乎没有影响。 在移除裸露内容上,效果达到“只穿衣服,不改结构”。 这就是复旦大学提...
-
Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测
AI圈,再次开卷图像生成。 一连串进展扎堆: 8月21日,Ideogram正式推出2.0版本,声称文本渲染能力更强。 没错,就是那个成立于去年8月,由谷歌AI绘画4大牛集体离职创业的项目,曾获得过一众AI大佬投资。 此番Ideogram还公开叫板Flux,...
-
CVPR2024|Diffusion模型轻量化与计算效率优化
前言 做算法应该都有顶会梦吧,发不了顶会只能刷一刷顶会了哈哈,向顶会大佬学习 扩散模型的训练和推理都需要巨大的计算成本(显卡不足做DDPM的下游任务实在是太难受了),所以本文整理汇总了部分CVPR2024中关于扩散模型的轻量化与计算效率优化 的相关论文...
-
图像检索在ImageNet分类任务中的优势:超越扩散模型生成图像
?在之前AIGC助力ResNet分类任务:跃升10个百分点-CSDN博客文章中,提到使用Textual Inversion对COCO、PascalVOC、少样本数据集进行数据增强,再进行分类任务,精度上升。 ?而今天要聊到的这篇论文更全面地探究了扩散模型...
-
DALL·E 2 模型实现与运行指南
DALL·E 2 模型实现与运行指南 DALLE2-pytorchImplementation of DALL-E 2, OpenAI's updated text-to-image synthesis neural network, in Pytor...
-
AIGC从入门到实战:涌现:人工智能的应用
AIGC从入门到实战:涌现:人工智能的应用 作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 关键词:AI生成内容、涌现现象、应用案例、技术挑战、未来展望 1. 背景介绍 1.1 问题...
-
Datawhale X 魔搭 AI夏令营(AIGC Task3)学习笔记
目录 认识ComfyUI 1. 什么是 ComfyUI 2. ComfyUI 核心部件 3. ComfyUI 图片生成流程 4. ComfyUI 的优势 使用ComfyUI 下载ComfyUI: 运行ComfyUI: 自我学习: LOR...
-
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【新智元导读】就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,语言模型和图像大一统,又近了一步。也就是说,真正的多模态AI模型,可能很快就要来了! Transformer...
-
【扩散模型】DDPM论文理解
DDPM(Denoising Diffusion Probabilistic Models) 更详细解读可以参考(这几个视频看完基本对DDPM的原理就能够把握了) 李宏毅大白话AIb站公式推导1b站公式推导2 基本过程...
-
Datawhale X 魔塔 AI夏令营 AIGC方向Task1
小白学习笔记,如有错误请各位大佬指正 一、跑通baseline教程 Datawhale 教程链接Datawhale 二、baseline代码分析 1.安装库 !pip install simple-aesthetics-predictor !p...
-
MSRA古纾旸:2024年,视觉生成领域最重要的问题有哪些?
文章链接: https://arxiv.org/pdf/2407.18290 亮点直击 概述了视觉生成领域中的各种问题。 这些问题的核心在于如何分解视觉信号,其他所有问题都与这一核心问题密切相关,并源于不适当的信号分解方法。 本文旨...
-
ECCV2024中有哪些值得关注的扩散模型相关的工作?
Diffusion Models专栏文章汇总:入门与实战 The Fabrication of Reality and Fantasy: Scene Generation with LLM-Assisted Prompt Interpretation...
-
stable diffusion--小白学习步骤
1.看一下Unet网络的讲解_哔哩哔哩_bilibili,了解Unet网络 2.看一下【生成式AI】Diffusion Model 原理剖析 (1/4 _哔哩哔哩_bilibili,起码要看前3/6个视频 3.看一下超详细的扩散模型(Diffusion...
-
大白话讲透AI画图:Stable Diffusion
Stable Diffusion 是一种从文本生成 AI 图像的潜空间扩散模型,它不是在高维图像空间中操作,而是首先将图像压缩到潜在空间(latent space)中。 我们将深入了解它的工作机制。知道工作机制有什么用?除了其本身就是个非常值得了解的内容...
-
Datawhale X 魔塔AI夏令营 ——从零入门AI生图原理&实践_task 1
一. 基础知识 1.1 文生图发展历史 1.2 文生图基础知识 文生图主要以SD系列基础模型为主,以及在其基础上微调的lora模型和人物基础模型等。 1.2.1 文生图流程图 1. 输入提示词 ...
-
干货!Stable Diffusion 从入门到精通之提示词手册
前言 超级干货来了,我们耗费大量时间精力整理编写的Stable Diffusion提示词手册正式公开!Stable Diffusion 和提示词介绍 Stable Diffusion 是一种开源的基于文本的图像生成模型,可以根据任何文本输入生成逼...
-
人类还在怕鬼,AI已经开始害怕自己了。
昨天中元节,我本来一直打算做一个关于中式恐怖的视频,来呼应一下这个节日氛围。 带着这个想法,我开始在网上搜寻灵感。 然而,我在B站上看到的一个视频彻底改变了我的计划。 这个视频,是这样的,来自B站UP主@明天的心声-,名字叫做:《随手拍的一张医院走廊的照片...
-
面完 AIGC 大模型算法岗,心态崩了。。。
大家好,今天我们继续聊聊 AI 科技圈发生的那些事。 内容包括:AI 科技圈最新动态和最新面试题总结。 Meta 推新一代 SAM 2 图像识别再进化!Meta 推新一代SAM 2 官方链接:https://ai.meta.com/blog/se...
-
magic-animate_pytorch AIGC使图像中人物按照给定动作动起来
magic-animate 论文 MagicAnimate: Temporally Consistent Human Image Animation using Diffusion Model https://arxiv.org/pdf/2311.1...
-
超逼真AI生成电影来了!《泰坦尼克号》AI重生!浙大&阿里发布MovieDreamer,纯AI生成电影引爆热议!
视频生成领域的最新进展主要利用了短时内容的扩散模型。然而,这些方法往往无法对复杂的叙事进行建模,也无法在较长时间内保持角色的一致性,而这对于电影等长篇视频制作至关重要。 对此,浙大&阿里发布了一种新颖的分层框架MovieDreamer,它将自回归...
-
【论文+中文文生图】Kolors:快手可图绘画模型实测(24.07.06开源)
代码:https://github.com/Kwai-Kolors/Kolors | 权重 论文原文:Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Imag...
-
ComfyUI系列教程(1)--Stable Diffusion基本原理
1.Stable Diffusion文生图基本原理 1.1Stable Diffusion原理介绍 文生图主要基于Stable Diffusion大模型进行。SD的基本结构图如下图所示,主要包括3个部分。其中1是CLIP图像文本对,将图...
-
Stable Diffusion是什么?
目录 一、Stable Diffusion是什么? 二、Stable Diffusion的基本原理 三、Stable Diffusion有哪些运用领域? 一、Stable Diffusion是什么? Stable Diff...
-
Datawhale X 魔搭 AI夏令营第四期 AIGC方向 Task01笔记
第一次任务比较简单,只需要配置好环境,简单运行一次 项目背景 赛题任务 可图Kolors-LoRA风格故事挑战赛 1.参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格........
-
FLUX | 超越SD3、媲美Midjourney的顶级AI绘图模型
本文包含大量AI干货 阅读完大约需要8分钟 1.引言 在过去的两年中,第一个公开发布且功能齐全的图像合成模型 Stable Diffusion 完全占据了主导地位,一大批竞争对手(PixArt Alpha/Sigma/AuraFlow)试图效仿S...
-
AI绘画:艺术与科技融合的新篇章
随着人工智能(AI)技术的飞速发展,AI绘画作为一种新兴的艺术形式,正逐步改变着传统艺术创作的格局。从早期的简单模仿到如今的个性化创作,AI绘画不仅提升了艺术创作的效率和质量,还开辟了全新的应用场景和商业模式。本文将深入探讨AI绘画的发展历程和现状、技术...
-
AIGC-ToonCrafter: Generative Cartoon Interpolation-CVPR2024
论文:https://arxiv.org/pdf/2405.17933 代码:https://doubiiu.github.io/projects/ToonCrafter 给定首尾帧,生成逼真生动的动画,动画插值生成 MOTIVATION T...
-
【SD3】发布,送你3个ComfyUI工作流,轻松搞定AI绘画
这几天AI绘画界最轰动的消息莫过于Stable Diffusion 3(简称SD3)的发布。SD3是一个多模态的 Diffusion Transformer 模型,其在图像质量、排版、复杂提示理解和资源效率方面具有显著提升。 废话不多说,先给大家看看我使...
-
Datawhale X 魔搭 AI夏令营-AIGC方向 task01笔记
目录 文生图技术的相关知识储备 SD结构图 种子 提示词 生成过程简单介绍 接下来开始随教程操作 Ⅰ开通阿里云PAI-DSW试用 Ⅱ在魔搭社区进行授权 Ⅲ报名“可图Kolors-LoRA风格故事挑战赛 Ⅳ在魔搭社区创建PAI实例编辑...
-
Datawhale X 魔搭 AI夏令营第四期AIGC文生图方向Task1笔记
目录 前置知识 生成对抗网络(GAN) 大规模预训练模型 LoRA baseline一站式实现过程 下载baseline文件 安装环境,然后重启kernel 调整prompt 总结 前置知识 指导手册里写得很详细,这里写一...
-
Stable Diffusion系列课程二:ControlNet
AUTOMATIC1111/stable-diffusion-webui 参考B站Nenly视频《零基础学会Stable Diffusion》、视频课件 推荐网站:stable-diffusion-art、Civitai(魔法) 、libilibi、AI...
-
超算互联网-Stable Diffusion 2.1文生图教程
一、名词简介 1. 超算互联网 超算互联网是一种基于云计算的高性能计算平台,用户可以通过互联网接入超级计算资源。它集成了大量的计算节点,提供强大的计算能力,适用于科学计算、深度学习、人工智能等领域。用户可以利用超算互联网平台运行复杂的模型和算法,显...
-
【Datawhale AI夏令营第四期】魔搭-AIGC方向 Task01笔记
报名参加了和鲸的AI夏令营,出于任务要求,也出于我一贯的学习习惯,写篇笔记记录一下自己学习过程中遇到的困难,和积累的资源、经验等。 课程链接: https://space.bilibili.com/1069874770/channel/collect...
-
AIGC前沿 | LivePortrait
0. 资源链接 论文超链接: LivePortrait 项目: https://github.com/KwaiVGI/LivePortrait 1. 背景动机 现有AIGC存在的问题 随着智能手机和其他录制设备的普及,人们越来越频繁地...
-
SD原班人马发布FLUX.1:打开AI绘画新世界
Black Forest Labs 旗下产品 AI 绘画工具如雨后春笋般涌现,让我们对创作的理解不断刷新。就在大家以为已经见识了 AI 绘画的天花板时,FLUX.1 出现了!这款由 Black Forest Labs 推出的 AI 绘画...
-
Datawhale AI夏令营第四期魔搭- AIGC文生图方向 task01笔记
目录 分任务1:跑通baseline 第一步——搭建代码环境 第二步——报名赛事 第三步——在魔搭社区创建PAI实例 分任务2:相关知识学习以及赛题理解 赛题理解: 文生图基本认识: 1. Diffusion Model(扩散模型 2...
-
LLM大模型从入门到精通(6)--Stable Diffusion超详细讲解
本文详细讲解Stable Diffusion的原理与工作流程 一、Stable Diffusion简介 二、Stable Diffusion原理解析 三、Stable Diffusion处理流程 四、结语 一、Stable Diffusi...
-
Datawhale X 魔搭 AI夏令营 第四期魔搭-AIGC文生图方向Task1笔记
(赛题链接:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛) (学习链接:从零入门AI生图原理&实践) 速通指南 ...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 task01笔记
目录 赛题内容 可图Kolors-LoRA风格故事挑战赛 baseline要点讲解(请配合Datawhale速通教程食用 Step1 设置算例及比赛账号的报名和授权 Step2 进行赛事报名并创建PAI实例 Step3 执行basel...
-
没想到我还要求着AI动起来(Stable Diffusion进阶篇:ComfyUI SVD图片转视频)
前言 在上一篇文章中讲到了如何下载安装ComfyUI,目的就是为了今天的图片转视频,毕竟上次的Gen2让我的钱包不是很满意。 当然如果完全没接触过ComfyUI或者WebUI看这期视频跟着操作也是可以的,前提是得先下载安装好 本文涉及的工作流和插件...
-
Stable Diffusion提示词只看这一篇就够了
一、Stable Diffusion概述 Stable Diffusion是一种基于扩散模型的图像生成技术,广泛应用于AI绘画领域。通过合理使用提示词,用户可以精确控制生成图像的内容和风格。 本文将详细讲解Stable Diffusion的提示词语...
-
AI绘画工具哪个最好用?
在探讨哪个AI绘画工具“最好用”这一问题时,我们不得不深入剖析当前市场上多款主流AI绘画工具的特点、功能、用户反馈以及它们在不同应用场景中的表现。由于这是一个相对主观的问题,因为“最好用”往往取决于用户的个人需求、技术熟练度、预算以及对特定功能和风格的偏好...
-
每日AIGC最新进展(48):腾讯提出Rich-Contextual Conditional Diffusion Models、OPPO提出自动生成复杂字形海报模型、南京大学提出基于Mamba插帧模型
Diffusion Models专栏文章汇总:入门与实战 Boosting Consistency in Story Visualization with Rich-Contextual Conditional Diffusion Models...
-
Stable Diffusion 使用详解(2)---- 图生图原理,操作,参数
目录 背景 图生图原理 基本原理 1. 扩散模型基础 2. 图生图的具体流程 3. 关键技术点 4. 应用实例 CLIP 原理 1.基本概念 2. 核心特点 使用及参数 随机种子 重绘幅度 图像宽高 采样方法 1. DPM(...
-
AIGC——ControlNet模型的原理
简介 ControlNet旨在控制预训练的大型扩散模型,以支持额外的输入条件。ControlNet能够以端到端的方式学习特定任务的条件,即使在训练数据集很小的情况下(<50k),也能保持稳健性。此外,训练ControlNet的速度与微调扩散模型一...
-
探索Stable Diffusion:AI在艺术创作中的无限可能
探索Stable Diffusion:AI在艺术创作中的无限可能 引言 一、Stable Diffusion简介 定义与历史 技术原理概述 二、工作原理深入解析 扩散模型基础 逆向扩散过程详解 潜空间与变分自编码器(VAE U-Net架...
-
Stable Diffusion的常用命令行介绍及示例
Stable Diffusion是一种基于扩散模型的深度学习技术,它特别适用于生成高质量的图像。通过命令行操作,用户可以灵活配置Stable Diffusion模型,以满足不同的图像生成需求。本文将详细介绍Stable Diffusion的常用命令行参数,...
-
Stable Diffusion【基础篇】:提示词引导系数(CFG Scale)
大家好,我是极客菌 CFG(Classifier-Free Guidance) 用于控制Stable Diffusion在采样期间应遵循提示词的严格程度。几乎所有稳定扩散 AI 图像生成器都提供了此参数设置。今天我们重点来看看在Stable Diffus...
-
【扩散模型】LCM LoRA:一个通用的Stable Diffusion加速模块
潜在一致性模型:[2310.04378] Latent Consistency Models: Synthesizing High-Resolution Images with Few-Step Inference (arxiv.org 原文:Pape...
-
爆“卷”的AI视频,大厂向左,创企向右
“生成的人物一转身就变成老外,怎么解决呢?” “没有办法,10s中动作大的,人物一致性有问题,只能抽卡,多刷几个,选择一个变化不大的。” 在一个以Ruanway学院为主题的群中,不断有各种针对AI视频生成的问题产生,而群内有AI视频生成使用经验的,则也在积...