-
Stable Diffusion | Gradio界面设计及ComfyUI API调用
本文基于ComfyUI API编写了类似于webUI的Gradio交互式界面,支持文生图/图生图(SD1.x,SD2.x,SDXL,Stable Cascade),Lora,ControlNet,图生视频(SVD_xt_1_1),图像修复(FaceDeta...
-
【Xiao.Lei】- Copilot插件完全指南:提高开发效率的利器
引言 GitHub Copilot插件是由OpenAI开发的一款基于人工智能技术的开发助手,它能够理解你的代码上下文并为你提供实时的代码建议。本文将深入介绍Copilot插件的安装、配置以及详细使用,帮助你更好地利用这一强大工具提高开发效率。 第一...
-
[从0开始AIGC][Transformer相关]:一文看懂Transformer中的位置编码:绝对位置、相对位置、旋转位置编码
[从0开始AIGC][Transformer相关]:一文看懂Transformer中的位置编码 文章目录 [从0开始AIGC][Transformer相关]:一文看懂Transformer中的位置编码 1. 位置编码 1.1 绝对位...
-
02:从文生图初窥Stable Diffusion,一键玩转AI绘画
前言 Stable Diffusion是一个什么架构呢,或者说是由哪些部分构成,各自发挥着怎么样的作用。我们就先从文生图开始探索 文生图 我们打开Stable Diffusion的webui,然后选择Stable Diffusion模型,然后选择...
-
一文解读:Stable Diffusion 3究竟厉害在哪里?
知乎原文:叫我Alonzo就好了 前言 最近一段时间,正当所有人都在为OpenAI发布Sora狂欢时,Stability AI更是推出了Stable Diffusion 3的技术报告。**这两项技术不约而同都采用了Diffusion Transf...
-
一键生成透明底图像!教你用AI绘画开源 SD 插件实现素材自由!
大家好,这里是和你们一起探索 AI 的程序员晓晓~ AI 绘画自出现以来一直都在不断发展完善,实现了很多我们在实际应用中迫切需要的功能,比如生成正确的手指、指定的姿势、准确的文本内容等。上周,又一个重磅新功能在开源的 SD 生态内实现了——直接通过文本直...
-
Stable Diffusion webUI 最全且简单配置指南
Stable Diffusion webUI 配置指南 本博客主要介绍部署Stable Diffusion到本地,生成想要的风格图片。 文章目录 Stable Diffusion webUI 配置指南 1、配置环境 (1)pip环境[...
-
AIGC学习(SD、LoRA和ControlNet)
目录 Stable Diffusion(稳定扩散模型) 为什么叫扩散模型? 网络结构 VAE(Variational Auto-Encoder) UNet模型 CLIP Text Encoder LoRA(低秩适应矩阵 什么是LoRA?...
-
五一 Llama 3 超级课堂 | XTuner 微调 Llama3 图片理解多模态 实践笔记
基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。 课程文档:Llama3-Tutorial/docs/llava.md at main · Smart...
-
Stable diffusion文生图大模型——隐扩散模型原理解析
1、前言 本篇文章,我们将讲这些年非常流行的文生图大模型——Stable Diffusion。该模型也不难,甚至说很简单。创新点也相对较少,如果你学会了我以前的文章讲过的模型,学习这个也自然水到渠成! 参考论文:High-Resolution Ima...
-
AI绘画SD入门教程:图生图基础用法,我不允许你还不会!
大家好,我是程序员晓晓 在上一篇中,我们学会了文生图的基础用法以及参数设置,这一篇我们继续讲解图生图。图生图就是给出一张参考图,由AI在参考图上做修改。简单来说,就是用原图和提示词进行图片二创。图生图的出现是为了弥补文生图的不足,因为文生图有个无法避免...
-
AIGC-Stable Diffusion进阶1(附代码)
在上篇文章中对Stable Diffusion进行了初步的认识,也给出了使用案例,这篇文章将进一步的去刨析一下SD模型。 SD模型的组成 在之前也讲过了,SD由CLIP、UNet、Schedule,VAE组成。再来回顾一下知识点: 1.CLIP Te...
-
AIGC你了解多少呢?
AIGC全面介绍 一、引言 随着人工智能技术的飞速发展,AIGC(Artificial Intelligence Generated Content)作为生成式人工智能的重要分支,正在逐渐改变我们的生产、生活和工作方式。AIGC是人工智能1.0时代进入...
-
【AIGC】PULID:对比对齐的ID定制化技术
论文链接:https://arxiv.org/pdf/2404.16022 github:https://github.com/ToTheBeginning/PuLID comfyui节点:GitHub - cubiq/PuLID_ComfyUI: P...
-
3分钟搞定线稿转3D,AI绘画SD在线版太强大了!!!
文末可领取资料~ 大家好,今天分享一个使用AI绘画SD在线版,将草图线稿一键转成3D效果图的方法,老规矩先上图: 从没学过绘画的我,几分钟就把线稿完成上色并转换成3D效果,搁以前还要学C4D渲染什么的,没个几天时间根本弄不出来,下面开始...
-
Stable Diffusion XL(未待完续)
模型介绍 Stable Diffusion XL 是一种基于人工智能的图像生成模型,由Stability AI开发。它是Stable Diffusion系列模型中的一员,专门设计用来生成更高质量的图像。这个模型在原有的Stable Diffusion模型...
-
为Stable Diffusion模型瘦身并达到SOTA!LAPTOP-Diff:剪枝蒸馏新高度(OPPO)
文章链接:https://arxiv.org/pdf/2404.11098 在AIGC时代,对低成本甚至设备端应用扩散模型的需求日益增加。在压缩Stable Diffusion模型(SDM)方面,提出了几种方法,其中大多数利用手工设计的层移除方法来获得更...
-
Stable Diffusion使用ControlNet:IP-Adapter实现图片风格迁移
IP-Adapter 全称是 Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models(文本到图像扩散模型的文本兼容图像提示适配器),是腾讯研究院出品的一个新的Contr...
-
Stable Diffusion 模型演进:LDM、SD 1.0, 1.5, 2.0、SDXL、SDXL-Turbo 等
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学。 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 合集: 持续火爆!!...
-
Diffusion Model, Stable Diffusion, Stable Diffusion XL 详解
文章目录 Diffusion Model 生成模型 DDPM概述 向前扩散过程 前向扩散的逐步过程 前向扩散的整体过程 反向去噪过程 网络结构 训练和推理过程 训练过程 推理过程 优化目标 详细数学推导 数学基础 向前扩散过程 反向...
-
Stable Diffusion之API接口调用
1、开启api调用模式 开启api模式,关闭可视化窗口,并且建议关闭登录权限(详细查看文章最后Stable Diffusion之Ubuntu下部署-CSDN博客) ./webui.sh --disable-safe-unpickle --ap...
-
【Diffusion实战】基于Stable Diffusion实现文本到图像的生成(Pytorch代码详解)
来试试强大的Stable Diffusion吧,基于Stable Diffusion的pipeline,进一步了解Stable Diffusion的结构~ Diffusion实战篇: 【Diffusion实战】训练一个diffusion模型生成...
-
Stable Diffusion XL之使用Stable Diffusion XL训练自己的AI绘画模型
文章目录 一 SDXL训练基本步骤 二 从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型 2.1 配置训练环境与训练文件 2.2 SDXL训练数据集制作 (1 数据筛选与清洗 (2 使用BLIP自动标注cap...
-
pipeline-stable-diffusion.py文件逐行解释
本文是对stabled-diffusion的pipeline文件的代码逐行解释。 60-71行 该函数对经过cfg重组出来的noise_pred,再重组。 def rescale_noise_cfg(noise_cfg, noise_pred_t...
-
Stable Diffusion教程|怎么写提示词prompt语法格式详解和实战
怎么画出高质量的AI图像? 不管使用Stable Diffusion的文生图或图生图进行AI绘画,都可以用提示词描述相关图像效果,通过尝试不同提示词组合和参数,从而达成更好的AI绘图效果和创意。与其天天在网上找别人的提示词,不如自己学会写好提示词,读懂本...
-
Midjourney原理与代码实例讲解
1. 背景介绍 1.1 人工智能生成内容的兴起 近年来,人工智能技术突飞猛进,其中一个引人注目的领域是人工智能生成内容 (AIGC 。AIGC 利用人工智能算法,自动生成各种形式的内容,例如文本、图像、音频和视频。AIGC 的兴起为创意产业带来了革命性...
-
无需搭建环境,零门槛带你体验Open-Sora文生视频应用
案例体验 ?* 本案例需使用 Pytorch-2.0.1 GPU-V100 及以上规格运行 ?* 点击Run in ModelArts,将会进入到ModelArts CodeLab中,这时需要你登录华为云账号,如果没有账号,则需要...
-
首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升
在过去的几年里,Transformer架构在自然语言处理(NLP)、图像处理和视觉计算领域的深度表征学习中取得了显著的成就,几乎成为了AI领域的主导技术。 然而,虽然Transformer架构及其众多变体在实践中取得了巨大成功,但其设计大多是基于经验的,...
-
CLIP当RNN用入选CVPR:无需训练即可分割无数概念|牛津大学&谷歌研究院
循环调用CLIP,无需额外训练就有效分割无数概念。 包括电影动漫人物,地标,品牌,和普通类别在内的任意短语。 牛津大学与谷歌研究院联合团队的这项新成果,已被CVPR 2024接收,并开源了代码。 团队提出名为CLIP as RNN(简称CaR)的新技...
-
有哪些好的 Stable Diffusion 提示词(Prompt)可以参考?
看完这八种“提示词”种类,你也会Ai高质量出图! 作为一个老法师,Prompt需要我们自己搜集,然后总结。很多人习惯于通过教程和模型来学习绘画,沿着别人预设的轨道前行,这样一开始没有错,但是长久缺乏自主思考和创造的能力,机械式的学习方式只会限制个人的表达...
-
LlamaFactory源码解析 PPO
class CustomPPOTrainer(PPOTrainer, Trainer : r""" Inherits PPOTrainer. """ def __init__( self,...
-
被作者删库的Llama 3-V原文再现!效果匹敌GPT4-V,训练费用暴降,区区不到500 美元,尺寸小100 倍,如何做到的
编译 | 言征 作者 | Aksh Garg 备注:发稿前作者已经删掉原文 出品 | 51CTO技术栈(微信号:blog51cto) 近日,一款Llama3V最近被“先红后黑”的出了圈。作为全球顶尖研究学府的团队,身陷“抄袭”中国大模型的泥潭后,火速删稿...
-
Stable Diffusion高级教程 - 图生图(img2img)模式
前言 现在终于可以介绍 Stable Diffusion 除了文生图 (txt2img 之外最重要的功能:图生图 (img2img 。顾名思义,除了根据正向和反向提示词之外,还需要基于一张图片生成图。这个模式下功能很多我们挨个说 img2img 图...
-
Stable Diffusion插件(翻译)
Agent Scheduler(代理调度器):一个用于排队和跟踪任务历史的工具,使得管理生成任务变得井井有条。 TemporalKit(时间稳定工具包):这是一个全能解决方案,通过一个自动化扩展,为Stable Diffusion渲染添加时间稳定性,保持...
-
stable diffusion常用的模型
一、Checkpoint模型 1.1、二次元模型 可以搭配负面提示词优化EasyNegative使用 1.1.1 counterfeitV30_v30.safetensors C站地址:https://civitai.com/models/4...
-
安装部署Stable Diffusion WebUI实现AI绘画
Stable Diffusion WebUI 安装部署 环境准备 下载代码 启动webu.sh 访问WebUI 其他异常 其他设置 开启VAE和CLIP 部分参数说明 安装插件 中文汉化插件 安装civitai插件 提示词插件 ol...
-
如何在Linux服务器上安装Stable Diffusion WebUI
如何在Linux服务器上安装Stable Diffusion WebUI 一、前提条件 1、硬件条件 2、软件条件 二、安装步骤 1、创建Python虚拟环境 2、安装必要的软件和库 3、克隆Stable Diffusion WebUI仓...
-
ControlNet作者搞起大模型:让天下没有难写的生图提示词,一句话变构图小作文
ControlNet作者新项目,居然也搞起大模型和Agent了。 当然还是和AI绘画相关:解决大伙不会写提示词的痛点。 现在只需一句超简单的提示词说明意图,Agent就会自己开始“构图”: 这就是ControlNet作者Lvmin Zhang的新玩具...
-
AI绘画Stable Diffusion学习指南【图生图篇】
大家好,我是程序员晓晓 今天的文章里我会为你详细介绍图生图的工作原理、工具解析和图像重绘的应用方向,如果没有看过【文生图篇】的朋友建议先去学习下,以便你更好的理解今天的内容。 01、图生图功能初识 1.1 传统意义上的喂参考图 我们都知道,模型在运...
-
stable diffusion的从安装到使用
stable-diffusion,一个免费开源的文生图软件,文章主要讲怎么从源码开始安装,以及使用的方式 git地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui 本人电脑环境win10...
-
DreamPose: Fashion Image-to-Video Synthesis via Stable Diffusion
UW&UCB&Google&NVIDIA ICCV23 https://github.com/johannakarras/DreamPose?tab=readme-ov-file 问题引入 输入参考图片...
-
Sora底层技术原理:Stable Diffusion运行原理
AIGC 热潮正猛烈地席卷开来,可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度,特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性,也在逐渐改变一部分行业的生产模式。惊...
-
Stable Diffusion 3.0技术论文解读
前几周 AI绘画领域扔出了一颗重磅炸弹 那就是Stability AI发布了备受期待的Stable Diffusion 3.0 简称SD3 一周后 官方放出了一篇详尽的技术论文 阐述了SD3实现突破性进展的底层原理 但是同时也引发了一连串疑问...
-
AI绘画SD入门教程:文生图基础用法(提示词)
大家好,我是程序员晓晓 今天我们来实践一下,通过提示词(prompt)的输入,让SD生成我们满意的图片。在生成图片前,我们先了解下提示词的基础原则,有了这些知识能迅速帮助各位同学构建出自己的提示词。 !基本原则! 首先,我来介绍下写提示词的基本原...
-
Llama3-Tutorial(Llama 3 超级课堂)作业
1.Llama 3 Web Demo 部署 cd ~ git clone https://github.com/SmartFlowAI/Llama3-Tutorial 安装 XTuner 时会自动安装其他依赖 cd ~ git clone -b...
-
Stable Diffusion文生图技术详解:从零基础到掌握CLIP模型、Unet训练和采样器迭代
文章目录 概要 Stable Diffusion 底层结构与原理 文本编码器(Text Encoder) 图片生成器(Image Generator) 那扩散过程发生了什么? stable diffusion 总体架构 主要模块分析 Un...
-
AI绘画:使用Stable Diffusion ComfyUI进行换脸:IPAdapter FaceID全面教程
在数字艺术和媒体编辑领域,换脸技术已经成为一种流行且强大的工具。它允许创作者将一个人物的面部特征无缝地转移到另一个人物上,创造出令人信服的视觉作品。Stable Diffusion ComfyUI提供了一个高效的平台,让用户能够轻松地实现换...
-
通俗易懂的Stable Diffusion模型结构介绍
目录 SD的发展历程 SD 模型的网络结构 ClipText 文本编码器 文本向量输入Unet VAE模型 总结图 SD的发展历程 Stab...
-
Stable Diffusion AI绘画:从提示词到模型出图的全景指南
? 个人网站:【 摸鱼游戏】【神级代码资源网站】【工具大全】 ? 一站式轻松构建小程序、Web网站、移动应用:?注册地址 ? 基于Web端打造的:?轻量化工具创作平台 ? 想寻找共同学习交流,摸鱼划水的小伙伴,请点击【全栈技术交流群】 Stable...
-
Stable Diffusion Web部署报错解决-Windows
项目地址:GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI 教程:GitHub-Automatic Installation on Windows 报错:...