-
Stable Diffusion原理说明
本文参考:深入浅出讲解Stable Diffusion原理,新手也能看明白 - 知乎 目录 1、Stable Diffusion能做什么? 2、扩散模型(Diffusion model) (1)前向扩散(Forward Diffusion)...
-
【AIGC数字人】EchoMimic:基于可编辑关键点条件的类人音频驱动肖像动画
GitHub:https://github.com/BadToBest/EchoMimic 论文: https://arxiv.org/pdf/2407.08136 comfyui: https://github.com/smthemex/ComfyU...
-
保姆级 Stable Diffusion 教程,看完这篇就够了!
在美国科罗拉多州举办了一场新兴数字艺术家竞赛,一幅名为《太空歌剧院》的作品获得“数字艺术/数字修饰照片”类别的一等奖,神奇的是,该作品的作者并没有绘画基础,这幅画是他用 AI 生成的。 这让人们充分见识到AI 在绘画领域惊人的创造力,AI 作品不仅可...
-
基于 ROS 的Terraform托管服务轻松部署Stable Diffusion
介绍 Stable Diffusion是文本到图像的潜在扩散模型,它可以根据文本提示词生成对应的图像。Stable Diffusion模型是扩散模型的变种,可以通过逐步对随机高斯噪声进行去噪以获得感兴趣的样本。与传统生成模型相比,Stable Diff...
-
Swift Diffusion: 在Swift中实现Stable Diffusion模型
Swift Diffusion: 将Stable Diffusion带到移动设备 Swift Diffusion是一个雄心勃勃的项目,旨在将强大的Stable Diffusion图像生成模型移植到Swift平台上。该项目由Liu Liu开发,目标是让St...
-
AIGC生成图像检测
AI生成图像技术的进展与影响 技术进步: 视觉质量与效率提升:近年来,AI生成图像在视觉质量、语义复杂度及运行时间效率上均实现了显著飞跃。 成本降低与普及:生成虚假图像所需的专业知识和成本大幅下降,促使在线图像生成平台(如Midjourney、DAL...
-
Stable Diffusion入门指南(看完必会)超全面
作者:SuMu 链接:https://zhuanlan.zhihu.com/p/703196651 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 今天写这个帖子是带大家了解一款强大的 AI 绘画工具——Stable...
-
AI绘画工具Stable Diffusion中的常用术语解析,一文搞懂关键术语,让你事半功倍!
对于很多初学者来说,会对Stable Diffusion中的很多术语感到困惑,当然你不是唯一的那个。 ===================================================== 在这篇文章中,我将会讲解几乎所有你在Sta...
-
stable-diffusion-3-medium (SD3)模型下载
由于huggingface.co下载速度不佳,放在夸克网盘上了: 夸克网盘分享 有条件的可以从huggingface下载: https://huggingface.co/stabilityai/stable-diffusion-3-medi...
-
使用Stable Diffusion生成的图像合成数据集
使用Stable Diffusion生成图像合成数据集 相关论文Stable DiffusionDALL-E seriesDALL-E seriesImagen 一、Stable Diffusion的原理 Stable Diffusion是一种基...
-
豆包视频生成大模型发布:首次突破多主体互动难关
快科技9月24日消息,据媒体报道,字节跳动正式宣告进军AI视频生成。发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型发布,面向企业市场开启邀测。 豆包视频生成”大模型凭借其卓越的语义理解能力、对复杂交互画面的精准捕捉以及多镜头...
-
火山引擎发布豆包视频生成PixelDance与Seaweed大模型功能介绍及免费使用指南 体验地址入口
豆包视频生成-PixelDance与Seaweed简介 豆包视频生成-PixelDance与Seaweed是火山引擎发布的两款大模型,专注于AI视频生成领域。该产品为企业市场提供了创新的视频生成解决方案,具有高度泛化能力和多镜头生成能力。 豆包视频生成...
-
24最新Stable Diffusion入门指南(看完必会)超全面
前言 今天写这个帖子是带大家了解一款强大的 AI 绘画工具——Stable Diffusion,可以帮你解决很多应用层面的[AI控图]问题。 关于 Stable Diffusion 的内容很多,在本篇教程里,我会先为你介绍 Stable Diffus...
-
Stable diffusion生图原理
简介 Stable diffusion 是一种基于扩散技术的深度学习模型,于2022年发布,是Stability AI公司推出的首要产品,它主要用于生成以文本描述为条件的详细图像,同时也可以进行补绘、外绘、重绘等任务,但原理都和文生图原理相似。 S...
-
单GPU一分钟生成16K高清图像!新加坡国立发布LinFusion:无缝兼容Stable Diffusion插件
论文链接:https://arxiv.org/pdf/2409.02097 Git链接:https://lv-linfusion.github.io/ 亮点直击 本文研究了Mamba的非因果和归一化感知版本,并提出了一种新颖的线性注意力机制...
-
Black Forest Labs 的 Flux——文本转图像模型的下一个飞跃,它比 Midjourney 更好吗?
一、前言 Black Forest Labs是开创性稳定扩散模型的团队,现已发布Flux——一套最先进的模型,有望重新定义 AI 生成图像的功能。但 Flux 是否真正代表了该领域的飞跃?它与 Midjourney 等行业领导者相比如何?让我们深入...
-
【前沿技术】扩散模型Stable Diffusion原理与应用
前言 久章智能 Stable Diffusion是一种基于扩散模型(Diffusion Models)的生成技术,近年来在图像生成和其他生成任务中取得了显著的进展。该技术以其高质量的生成效果、稳定的训练过程和广泛的应用前景,迅速在学术界和工业界引起了...
-
“Datawhale X 魔搭 AI夏令营”-AIGC文生图方向Task3跑通指南
前言 从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。 第四期学习接近尾声很感谢Datawhale给我提...
-
【笔记】扩散模型(七):Latent Diffusion Models(Stable Diffusion)论文解读与代码实现
论文链接:High-Resolution Image Synthesis with Latent Diffusion Models 官方实现:CompVis/latent-diffusion、CompVis/stable-diffusion 这一...
-
视频模型CogVideoX开源,全民AIGC时代到来了吗?
大家好,我是飞哥! 之前不少人都以为大模型只能处理文本。但自从今年 2 月 16 日 OpenAI 在其官网发布了基于文字生成视频的模型 Sora 后,让所有人都认识到了即使对对于复杂的视频信息,大模型仍然是具备对其进行理解,以及进行 AIGC...
-
【AIGC】InstructPixPix:基于文本引导的图像编辑技术
github:diffusers/examples/instruct_pix2pix/train_instruct_pix2pix_sdxl.py at main · huggingface/diffusers · GitHub 论文:https://a...
-
AI绘画——从扩散模型到创意无限
AI绘画魅力四射 如果在两年前我说这些图片是AI生成的,你或许会说我痴人说梦话,但经过了2023年AI绘画热潮后,大量精致而逼真的AI绘画在互联网上铺天盖地。AI绘画技术的快速发展,使得生成的图像质量大幅提升,很多作品已经达到了以假乱真的...
-
24全网最全stable diffusion模型讲解!快来!!新手必收藏!!
前言 手把手教你入门绘图超强的AI绘画程序Stable Diffusion,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新Stable Diffusion保姆级教程资料包(文末可获取) AI模型最新展现出的图像生成能力远远超出...
-
【大模型理论篇】生成式模型算法原理深入浅出(涉及Stable Diffusion、生成对抗网络、高斯混合模型、隐马尔可夫模型、朴素贝叶斯等算法原理分析及生成式模型解释)
1. 背景介绍 随着大模型的推出,“生成式AI”这个名词一夜之间席卷大江南北。甚至很多人的概念里,“生成式AI”等同于人工智能。但事实上,人工智能(Artificial Intelligence 涵盖的范围要广的多,生成式AI只是其中的...
-
【AIGC】MimicMotion:姿态引导的高质量人体运动视频生成技术
资源 论文:https://arxiv.org/pdf/2406.19680 github:https://github.com/Tencent/MimicMotion comfyui:https://github.com/kijai/ComfyUI...
-
Stable Diffusion 项目常见问题解决方案
Stable Diffusion 项目常见问题解决方案 stablediffusion High-Resolution Image Synthesis with Latent Diffusion Models 项目地址: https://git...
-
探索 Stable Diffusion Portable:轻量级的扩散模型实现
探索 Stable Diffusion Portable:轻量级的扩散模型实现 在AI领域,生成对抗网络(GANs)和扩散模型逐渐成为创造逼真图像的重要工具。其中, 是一个值得我们关注的开源项目,它提供了一个轻量化且易于部署的扩散模型实现。本文将深入解析...
-
【扩散模型(八)】Stable Diffusion 3 diffusers 源码详解2 - DiT 与 MMDiT 相关代码(下)
系列文章目录 【扩散模型(一)】中介绍了 Stable Diffusion 可以被理解为重建分支(reconstruction branch)和条件分支(condition branch) 【扩散模型(二)】IP-Adapter 从条件分支的视角,快...
-
Cog-Stable-Diffusion 开源项目指南
Cog-Stable-Diffusion 开源项目指南 cog-stable-diffusionDiffusers Stable Diffusion as a Cog model项目地址:https://gitcode.com/gh_mirrors/c...
-
无需训练的 Diffusion MoE 方案 (SegMoE): Segmind Mixture of Diffusion Experts
Paper name SegMoE: Segmind Mixture of Diffusion Experts Paper Reading Note Blog URL: https://blog.segmind.com/introducing-seg...
-
书单 | 大模型的书那么多,如何快速选到适合自己的那一本?来,教你!
大模型的书这么多,该怎么选呢? 本期书单就来教大家怎么快速地从众多大模型书中选到你想要的那一本! 大模型基础 大模型入门不可错过的一本书,就是这本大模型界的经典畅销书**《大规模语言模型》**!系统性强,内容适合初学者,如果你想知道如何构建一个大模型...
-
图像生成模型基础——Stable Diffusion模型介绍
随着人工智能技术的飞速发展,图像生成技术也取得了显著进步。扩散模型(Stable Diffusion)因其高效性和稳定性而得到广泛关注,目前的大多数生成模型都是以扩散模型为基础进行改进得到。首先简单介绍一下传统人工智能模型和生成模型的区别。 **传统人工...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task01笔记
赛题内容 参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格...... 基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度...
-
【AIGC从零开始】AIGC小白学习心得第二讲:3D生成模型
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、Stable Video 3D(sv3d) 二、TripoSR 三、LRM系列 1.LRM 2.GS-LRM 3.OpenLRM 四、CRM 五...
-
【diffusers极速入门(七)】Classifier-Free Guidance (CFG)直观理解以及对应代码
系列文章目录 【diffusers 极速入门(一)】pipeline 实际调用的是什么? call 方法! 【diffusers 极速入门(二)】如何得到扩散去噪的中间结果?Pipeline callbacks 管道回调函数 【diffusers极速...
-
每日AIGC最新进展(54):中科大提出Pose引导的图像生成模型、韩国科技学院提出发型控制模型、北大提出风格生成数据集CSGO
Diffusion Models专栏文章汇总:入门与实战 GRPose: Learning Graph Relations for Human Image Generation with Pose Priors 在过去的研究中,基于扩散模型的人...
-
深度剖析Google黑科技RB-Modulation:告别繁琐训练,拥抱无限创意生成和风格迁移!
给定单个参考图像,RB-Modulation提供了一个无需训练的即插即用解决方案,用于(a 风格化和(b 具有各种提示的内容样式组合,同时保持样本多样性和提示对齐。例如,给定参考样式图像(例如“熔化的黄金3d渲染样式” 和内容图像(例如(a “狗” ,RB...
-
AIGC入门(二)从零开始搭建Diffusion!(下)
上篇。https://blog.csdn.net/alxws/article/details/140058117?spm=1001.2014.3001.5502四、前向加噪过程(ForwardProcess.py) 当我们的去噪器设计完成后,接下来,就...
-
Stable-Diffusion-WebUI-Collab 在 Google Colab 上的使用教程
Stable-Diffusion-WebUI-Collab 在 Google Colab 上的使用教程 stable-diffusion-webui-colabstable diffusion webui colab项目地址:https://gitco...
-
DIFFUSION 系列笔记| Latent Diffusion Model、Stable Diffusion基础概念、数学原理、代码分析、案例展示
目录 Latent Diffusion Model LDM 主要思想 LDM使用示例 LDM Pipeline LDM 中的 UNET 准备时间步 time steps 预处理阶段 pre-process 下采样过程 down sampl...
-
【扩散模型(六)】Stable Diffusion 3 diffusers 源码详解1-推理代码-文本处理部分
系列文章目录 【扩散模型(一)】中介绍了 Stable Diffusion 可以被理解为重建分支(reconstruction branch)和条件分支(condition branch) 【扩散模型(二)】IP-Adapter 从条件分支的视角,快...
-
推荐开源项目:稳定扩散模型工具包(stable-diffusion-model-toolkit)
推荐开源项目:稳定扩散模型工具包(stable-diffusion-model-toolkit) stable-diffusion-webui-model-toolkit项目地址:https://gitcode.com/gh_mirrors/st/st...
-
Stable Diffusion Web UI基础入门之常用参数
在之前的文章中我们介绍了,Stable Diffusion的基础知识和使用工具———Stable Diffusion AI入门介绍。这篇文档带大家了解一下Stable Diffusion Web UI的常用参数,在日常绘图中如何使用。 我们知道在St...
-
Datawhale X 魔搭 AI夏令营第四期(AIGC学习笔记)
Datawhale X 魔搭 AI夏令营第四期(AIGC学习笔记) 00. Diffusion 扩散模型 去噪扩散模型(Denoising diffusion probabilistic models,DDPM) 正向扩散过程 逆向去噪过程...
-
在 iPhone 15 Pro 上运行 Llama-3.1 8B;使用扩散模型生成类人绘画过程的工具;使用ChatGPT自动生成思维导图
✨ 1: MLX Examples 在 iPhone 15 Pro 上运行 Llama-3.1 8B 基于 MLX 机器学习推理框架轻松将 「Llama-3.1 8B」在 iPhone 15 Pro 上运行? 代码已开源! 地址:http...
-
精通 Stable Diffusion 调优秘籍
一、Stable Diffusion 调优概览 Stable Diffusion 作为一款强大的 AI 绘画工具,其调优具有至关重要的意义。通过合理的调优,可以显著提升图像生成的质量、速度和准确性,满足用户更加多样化和精细化的需求。 调优主要涵盖了...
-
Stable Diffusion 开源项目教程
Stable Diffusion 开源项目教程 stablediffusionHigh-Resolution Image Synthesis with Latent Diffusion Models项目地址:https://gitcode.com/gh...
-
GameNGen有哪些功能?谷歌游戏引擎AI模型怎么使用方法详细教程指南
GameNGen 是什么? GameNGen 是一个由神经模型驱动的前沿游戏引擎,专注于实现与复杂环境的实时互动,并在长时间的模拟中保持高质量图像。它能够以每秒超过 20 帧的速度高效模拟经典游戏《DOOM》,并且其下一帧预测的峰值信噪比(PSNR)达到...
-
5分钟 Stable Diffusion 本地安装
5分钟 Stable Diffusion 本地安装 5分钟 Stable Diffusion 本地安装 1. 引言 1.1 什么是Stable Diffusion? 1.2 本地安装的优势 2. 准备工作 2.1 系统要求 2.2 推荐...
-
Datawhale X 魔搭 AI0夏令营 魔搭-AIGC文生图方向 Tsak 2 震惊!!!AI小白竟然用AI生成这种图片......
本文为AI方向小白记录暑期参加魔搭夏令营-AIGC文生图方向的Task 01 报名赛事链接:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 欢迎所有小白,大神前来交流学习。 一.问题的提...