-
Stable Diffusion零基础学习
Stable Diffusion学习笔记TOP03 提示:SD的通用基本参数详解 1、Stable Diffusion模型(ckpt 。 全称:checkpoint检查点,是AI生图的重要依据。 别称:是AI生图的基础模型,文件比较大,文件通...
-
【AI绘画】ControlNet:一文搞懂Stable Diffusion最重要的插件
大家好,我是SD教程菌。 当你使用 Stable diffusion 生成图像时,是否有过这种经历?提示词内容在生成结果中似乎都体现出来了,但又总不是自己想要的样子,于是陷入到无限生成(抽卡)的状态,耗费大量时间,逐渐消磨兴趣、耐性及对SD的信任。 同...
-
AI绘画【ComfyUI】爽玩必备!6大插件汇总推荐
工欲善其事必先利其器,今天来给大家介绍6款ComfyUI中必备的插件,有了它们,你才能真正的享受到连连看的快乐!排名分先后,越往后越重要! 插件安装管理器 SDXL风格样式 ComfyUI界面汉化 中文提示词输入 蟒蛇八卦工具箱...
-
AIGC时代,仅用合成数据训练模型到底行不行?来一探究竟 | CVPR 2024
首个针对使用合成数据训练的模型在不同稳健性指标上进行详细分析的研究,展示了如SynCLIP和SynCLR等合成克隆模型,其性能在可接受的范围内接近于在真实图像上训练的对应模型。这一结论适用于所有稳健性指标,除了常见的图像损坏和OOD(域外分布)检测。另一方...
-
【AI绘画】零基础入门ComfyUI(二)快手可图Kolors大模型
大家好,我是写编程的木木。 7月6日,快手在世界人工智能大会(WAIC)上宣布,快手旗下的文生图大模型可图(Kolors)将全面开源。可图(Kolors)支持中英文双语,生成效果比肩 Midjourney-v6水平,支持长达256字符的文本输入,具备英文...
-
AIGC实战——多模态模型Flamingo
AIGC实战——多模态模型Flamingo 0. 前言 1. Flamingo 架构 2. 视觉编码器 3. Perceiver 重采样器 4. 语言模型 5. FIamingo 应用 小结 系列链接 0. 前言 我们已经学习了文...
-
webui automatic1111上可以跑stable diffusion 3的方法
stable diffusion 3 可以简单句子生成高质量图形,可以生成准确的文字,甚至可以支持中文。 stable diffusion 3 最初只支持API调用,最后把模型也完全开放了。Comfyui因为天生架构优势,第一时间跑起来了。既支持远程AP...
-
OpenBayes 教程上新 | FLUX ComfyUI 现已上线 ,让 SD 和 Midjourney 颤抖的文生图黑马!
横空出世的黑马 FLUX ,以其强大的图像生成能力,让 Stable Diffusion 和 Midjourney 这 2 个「昔日顶流」倍感压力。 FLUX 与 Stable Diffusion 渊源颇深,其研发公司 Black Forest Labs...
-
Stable Diffusion训练LoRA模型参数详细说明(阿里巴巴堆友AI)
工具:线上模型训练堆友AI 一、训练参数 批量大小 (Batch Size 作用:每次训练中使用的样本数量。 参考值:可以从 8 到 64,取决于显存大小。 训练轮数 (Epochs 作用:完整遍历训练数据的次数。 参考值:通...
-
《文末福利:黑神话悟空豪华版》借助Stable Diffusion实现人物自我控制的AI艺术突破
文章目录 引言 人物生成 操作过程 图像调整步骤 二郎神 孙悟空 八戒 场景渲染 技术原理: 好易智算平台 引言 提示词:solo,red eyes,water,male focus,1boy,standing,furry...
-
AI绘画:Stable Diffusion WebUI详细使用指南,新手小白必看
大家好,我是爱绘画的彤姐。 Stable Diffusion WebUI(AUTOMATIC1111,简称A1111)是一个为高级用户设计的图形用户界面(GUI),它提供了丰富的功能和灵活性,以满足复杂和高级的图像生成需求。由于其强大的功能和社区的活跃参...
-
Stable Diffusion 3「精神续作」FLUX.1 源码深度前瞻解读
前言 前几个月,推出了著名文生图模型 Stable Diffusion 的 Stability AI 公司曝出了核心团队集体离职的消息。一时间,AI 从业者们议论纷纷,不知道这究竟是团队出现了矛盾,还是这些员工觉得文生图模型做下去没有前途了。而近期,该...
-
Stable Diffusion ControlNet教程 :IP-Adapter 图片风格迁移
注:AI工具SD整合包、各种模型插件、提示词、AI人工智能学习资料都已经打包好放在网盘中了,有需要的小伙伴文末扫码自行获取。 前段时间腾讯发布的ControlNet新模型叫“IP-Adapter”,它的作用就是把上传的图像转化为图像提示词,简单的来说就是...
-
免费体验!快速生成超逼真真人美图的Stable Diffusion模型!
环境安装 1、安装Python 下载地址:https://www.python.org/ftp/python/3.10.6/python-3.10.6-amd64.exe。 备注:把安装目录加入环境变量! 2、安装git 下载地址:h...
-
DatawhaleX魔搭-AI夏令营AIGC-task2
一、了解AI生图技术 1,为什么了解生图技术 AIGC(AI-Generated Content 是通过人工智能技术自动生成内容的生产方式,很早就有专家指出,AIGC将是未来人工智能的重点方向,也将改造相关行业和领域生产内容的方式。 应用广泛...
-
新手必看!目前最强的AI绘画5款 Flux 实用基础工作流(附资源包)
大家好,我是程序员晓晓 之前为大家梳理了 Flux 开源模型的一些简单用法,今天我们继续了解一些 Flux 基础工作流,如图生图、高清放大、局部重绘等相关用法。最强AI绘画大模型 Flux【基础篇】:ComfyUI Flux.1工作流的本地部署安装教程...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task03笔记
在task02中,我们对baseline有了深度了解,我们学会了用AI工具来帮助我们学习。另外,我们制作了话剧连环画。 我们今天的任务是了解微调的基本原理,然后我们会对微调的各种参数有一个更加清楚的了解,来实现一个更好的效果,并且在这个Task中会给大家...
-
最强AI绘画大模型 Flux【基础篇】:ComfyUI Flux.1工作流的本地部署安装教程
大家好,我是程序员晓晓 上个月AI绘画界发生了一件大事,那就是前StabilityAI(也就是StableDIffusion的母公司)员工组成的新团队发布了目前为止AI绘画最强的大模型——Flux.1模型。 今天我们来分享一下如何在本地部署ComfyU...
-
【AIGC】ComfyUI 入门教程(3):图生图工作流|AI 生成图片
前言 对 AIGC 技术感兴趣,加个关注,保持联系: ComfyUI 是 Stable Diffusion 的一个基于节点组装绘图流程的图形用户界面(GUI)。通过将不同的节点连接在一起,你可以在 ComfyUI 中构建图像生成工作流。一个完整的工作...
-
24最新Stable Diffusion 本地部署,超详细教程(手动+自动+整合包三种方式)总有一种适合你!
前言 一、 Stable Diffusion简介 2022年作为AIGC(Artificial Intelligence Generated Content)时代的元年,各个领域的AIGC技术都有一个迅猛的发展,给工业界、学术界、投资界甚至...
-
AI终于会画手了!AI绘画最强开源工具FLUX测试与安装
大家好,我是SD教程菌 此前发布的Stable Diffusion 3模型,因为过度审核,导致人体结构的生成能力“退步”,被喷得不轻。 现在一款优秀的平替出现了,那就是黑森林实验室的FLUX模型,该团队由Stability AI前核心成员组成。FLUX...
-
AI绘画:让STABLE DIFFUISON ComfyUI 在 Blender 里面飞(把AI绘画整合到blender的方法)
前言 了解过Blender的朋友一定都知道B站UP主“只剩一瓶辣椒酱”,他在blender界就是和秋叶大佬一样的存在,属于祖师级别的人物。最近,他和幻之境开发小组联合开发的一款基于 STABLE DIFFUISON ComfyUI 核心的 B...
-
在纯净的虚拟机上安装及使用Stable Diffusion WebUI
一、环境准备 1、创建一台纯净的虚拟机 2、安装驱动 3、下载安装Anaconda 二、部署stable-diffusion-webui 1、Linux 上的自动安装 2、导航到您想要安装 webui 的目录并执行以下命令: 3、执行...
-
记一次:Datawhale AI夏令营-第四期-魔搭-AIGC-Task02
前言:上一篇我们按步骤跑了一遍Baseline也生成了8张故事图片,但是原理啥的都是一头雾水,因为是初学者,所以只能一点点的分析来理解消化。这篇咱们就深入的来了解一下相关的内容。根据内容自己总结理解和查询相关的一些资料。不正确的地方提出来我修改一下。 学...
-
#Datawhale X 魔搭 AI 夏令营# AIGC文生图 Task2
1. 什么是AI生图 一般来说,AI生图模型属于多模态机器学习模型,通过海量的图库和文本描述的深度神经网络学习,最终的目标是可以根据输入的指示(不管是文本还是图片还是任何 生成符合语义的图片。 通俗来说,AI生图模型获得图片生成能力主要是通过 学习 图...
-
Datawhale X 魔搭AI夏令营 第四期 AIGC文生图方向 Task2笔记
这次的笔记主要是结合了AI来辅助学习和生成提示词,和上次Task1的笔记一样,笔者会先过一遍流程,在文末再补充相应的理论知识。 通义千问(如果已经有习惯的大语言模型可以跳过这一段) 通义千问是由阿里云开发的人工智能助手,这里给出链接,大家可以自行体验...
-
AIGC绘画入门教学之stablediffusion教程
在大模型开启的 AIGC 时代,由明星 AI 初创公司 Stability AI打造的文本到图像生成模型 Stable Diffusion 可谓风靡全球。 虽然从文本到图像的生成模型并不少,但Stable Diffusion 是最受欢迎的开源模型。各路开...
-
[AI绘画] 简明原生 ComfyUI 三重超细节放大教程(附工作流)
本教程将从0构建 ComfyUI 三重细节填充放大工作流,人有多大胆,图有多大产 **(建议横屏)**鬼灭之刃 · 堕姬 & 甘露寺蜜璃 · 三重细节填充放大 · 16K(15488×8832 「四种放大」 ”潜空间“和”像素空间”,图像放...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task01笔记
赛题内容 参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格...... 基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度...
-
最新口型同步技术EchoMimic部署
EchoMimic是由蚂蚁集团推出的一个 AI 驱动的口型同步技术项目,能够通过人像面部特征和音频来帮助人物“对口型”,生成逼真的动态肖像视频。 EchoMimic的技术亮点在于其创新的动画生成方法,它不仅能够通过音频和面部关键点单独驱动图像动画,还能结...
-
Datawhale X 魔搭 第四期 AIGC文生图方向-Task03笔记
Hello,各位小伙伴们,继上一次我们精读并跑通了baseline2后,我们对AIGC文生图方向又有了更进一步的了解。今天呢我们实现AIGC方向的进阶上分,还在犹豫什么,还不快快行动起来~ 好,话不多说,今天我们就来聊聊ComfyUI和Lora微调吧~...
-
Stable Diffusion majicMIX_realistic模型的介绍及使用
一、简介 majicMIX_realistic模型是一种能够渲染出具有神秘或幻想色彩的真实场景的AI模型。这个模型的特点是在现实场景的基础上,通过加入一些魔法与奇幻元素来营造出极具画面效果和吸引力的图像。传统意义的现实场景虽然真实,但通常情况下缺乏奇幻...
-
【AI绘画】掌握AI创作神器:10分钟搞定ComfyUI和Flux大模型,零基础也能学会
大家好,我是SD教程菌。 最近大火的Flux 1.0模型,大家都去体验过没? 此模型是由SD的前员工创立的黑森林实验室推出,一经推出,业界掀起了非常大的反响,相关从业人员都感叹模型可以媲美甚至赶超SD了;现象级的成为了现在很多AI从业者的首选作图模型;...
-
Datawhale X魔搭 AI夏令营
Datawhale X魔搭AI夏令营 AIGC方向Task01学习笔记 (本人水平有限,文章中引用了一些大佬写的内容,引用的图片上已注明出处) 1.活动简介 从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期...
-
stable diffusion的安装
stable diffusion的安装 一、前言 二、安装python环境 1、已经安装python环境,但非3.10.6版本(可以不看) 三、安装stable diffusion 四、运行 五、启动报错 1、Torch is not abl...
-
Datawhale AI夏令营第四期 AIGC文生图方向 Task3学习笔记
经过前两个task的学习,对于文生图的基本原理,技术支持,模型微调,工作流程等有了一定的了解,尤其是在prompt工程上面,提示词的质量决定着生成图像的流畅性和观赏性,AI大模型在这一方面为学习者们提供了非常大的帮助,通过大模型生成和优化提示词,能实现学习...
-
AI绘画又有好玩的了,玩转FLUX,手和文字不再是问题了!
Prompt: Extreme close-up of a single tiger eye, direct frontal view. Detailed iris and pupil. Sharp focus on eye texture and col...
-
stable Diffusion 网页用户界面 github
稳定的 Diffusion 网页用户界面 使用 Gradio 库实现的稳定扩散的 Web 界面。 特征 带有图片的详细功能展示: 原始的 txt2img 和 img2img 模式 一键安装并运行脚本(但您仍然必须安装 pyth...
-
AI绘画:从零开始教你玩转ComfyUI-保姆级部署教程-手把手带你ComfyUI工作流搭建!
前言 第一节:认识ComfyUI并安装 本教程专为初学者设计,详细介绍了 2024 年最新版的SD ComfyUI的使用方法。通过逐步指导,让你无需任何基础,快速学会并使用这一强大的AI绘图工具。 1、什么是comfyui ComfyUI就像...
-
CoralStyleCLIP(图像编辑的协同优化区域)个人理解
一、CoralStyleCLIP介绍 论文:CoralStyleCLIP: Co-optimized Region and Layer Selection for Image Editing 论文内容:本文提出了CoralStyleCLIP,它在Sty...
-
ootdiffusion_pytorch AIGC虚拟衣物试穿算法模型
OOTDiffusion 论文 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on https://arxiv.org/pdf/...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 -task-02
一、AI生图的发展历程 随着人工智能(AI)技术的不断演进,特别是AIGC(AI-Generated Content,人工智能生成内容)的兴起,AI生图技术——即利用AI算法自动生成图像的技术,已经从一个遥远的梦想转变为现实应用中不可或缺...
-
【保姆级讲解下AI绘画自动生成器有哪些?】
?博主:程序员不想YY啊 ?CSDN优质创作者,CSDN实力新星,CSDN博客专家 ?点赞?收藏⭐再看?养成习惯 ✨希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共同学习、交流进步! ?AI绘画自动生成器 ?人工智能(AI 绘...
-
DataWhale夏令营第四期魔搭- AIGC方向 task02笔记#Datawhale AI夏令营
Task2:精读代码,实战进阶 聊聊相关:虽然现在很多的AI绘图都能被大家说“一眼鉴AI”,但随着技术日新月异的变化,我们也需要掌握辨识和判别他的能力。 Deepfake是一种使用人工智能技术生成的伪造媒体,特别是视频和音频,它们看起来或听起来非常真实...
-
DIFFUSION 系列笔记| Latent Diffusion Model、Stable Diffusion基础概念、数学原理、代码分析、案例展示
目录 Latent Diffusion Model LDM 主要思想 LDM使用示例 LDM Pipeline LDM 中的 UNET 准备时间步 time steps 预处理阶段 pre-process 下采样过程 down sampl...
-
【扩散模型(六)】Stable Diffusion 3 diffusers 源码详解1-推理代码-文本处理部分
系列文章目录 【扩散模型(一)】中介绍了 Stable Diffusion 可以被理解为重建分支(reconstruction branch)和条件分支(condition branch) 【扩散模型(二)】IP-Adapter 从条件分支的视角,快...
-
Datawhale X 魔搭 AI夏令营 第四期AIGC_task03笔记
工具初探一ComfyUI 认识ComfyUI ComfyUI 是"Graphical User Interface"(图形用户界面)的缩写,简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。ComfyUI 是GUI的一种,是...
-
Stable-Diffusion1.5
SD1.5权重:https://huggingface.co/runwayml/stable-diffusion-v1-5/tree/main SDXL权重:https://huggingface.co/stabilityai/stable-diffus...
-
Datawhale X 魔搭 AI夏令营第四期(AIGC学习笔记)
Datawhale X 魔搭 AI夏令营第四期(AIGC学习笔记) 00. Diffusion 扩散模型 去噪扩散模型(Denoising diffusion probabilistic models,DDPM) 正向扩散过程 逆向去噪过程...
-
Datawhale X 魔搭 AI夏令营第四期AIGC方向笔记task3
part1:工具初探一ComfyUI应用场景探索 初识ComfyUI 什么是ComfyUI GUI 是 "Graphical User Interface"(图形用户界面)的缩写。简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的...