-
阅读笔记——生成式人工智能AIGC的逻辑与应用读后感
阅读笔记——生成式人工智能AIGC的逻辑与应用读后感 我们不会被人工智能所取代,但极大可能会被善于使用人工智能的人所取代 时至今日,我都忘了我是怎么与这本书结缘的了。 是见猎心喜吧,当时看出版日期挺新的 大约是23年12月的时候,我...
-
一文解读:Stable Diffusion 3究竟厉害在哪里?
知乎原文:叫我Alonzo就好了 前言 最近一段时间,正当所有人都在为OpenAI发布Sora狂欢时,Stability AI更是推出了Stable Diffusion 3的技术报告。**这两项技术不约而同都采用了Diffusion Transf...
-
diffusers flask streamlit或gradio 简洁可视化AIGC文生图页面
参考: https://python-bloggers.com/2022/12/stable-diffusion-application-with-streamlit/ https://github.com/LowinLi/stable-diffusion...
-
AIGC学习(SD、LoRA和ControlNet)
目录 Stable Diffusion(稳定扩散模型) 为什么叫扩散模型? 网络结构 VAE(Variational Auto-Encoder) UNet模型 CLIP Text Encoder LoRA(低秩适应矩阵 什么是LoRA?...
-
Stable diffusion文生图大模型——隐扩散模型原理解析
1、前言 本篇文章,我们将讲这些年非常流行的文生图大模型——Stable Diffusion。该模型也不难,甚至说很简单。创新点也相对较少,如果你学会了我以前的文章讲过的模型,学习这个也自然水到渠成! 参考论文:High-Resolution Ima...
-
AIGC-Stable Diffusion进阶1(附代码)
在上篇文章中对Stable Diffusion进行了初步的认识,也给出了使用案例,这篇文章将进一步的去刨析一下SD模型。 SD模型的组成 在之前也讲过了,SD由CLIP、UNet、Schedule,VAE组成。再来回顾一下知识点: 1.CLIP Te...
-
存内计算与扩散模型:下一代视觉AIGC能力提升的关键
目录 前言 视觉AIGC的ChatGPT4.0时代 扩散模型的算力“饥渴症” 存内计算解救算力“饥渴症” 结语 前言 在这个AI技术日新月异的时代,我们正见证着前所未有的创新与变革。尤其是在视觉内容生成领域...
-
【AIGC】PULID:对比对齐的ID定制化技术
论文链接:https://arxiv.org/pdf/2404.16022 github:https://github.com/ToTheBeginning/PuLID comfyui节点:GitHub - cubiq/PuLID_ComfyUI: P...
-
2024年AIGC行业研究:多模态大模型与商业应用
2024年2月,OpenAI发布其首款视频生成模型Sora,用户仅需输入一段文字即可生成长达一分钟场景切换流畅、细节呈现清晰、情感表达准确的高清视频,与一年前的AI生成视频相比,在各维度均实现了质的提升。这一突破再次将AIGC推向大众视野。AIGC即通过大...
-
Stable Diffusion详细教程
目录 ?引言 ?Stable Diffusion基本概念 ?潜在扩散模型 ?图像生成原理 ?Stable Diffusion安装部署 ?环境要求 ?安装步骤 ?Stable Diffusion阶段 ?准备阶段 ?训练阶段 ?评估阶...
-
从商品图到海报生成 京东广告AIGC创意技术应用
一、前言 电商广告图片不仅能够抓住消费者的眼球,还可以传递品牌核心价值和故事,建立起与消费者之间的情感联系。然而现有的广告图片大多依赖人工制作,存在效率和成本的限制。尽管最近 AIGC 技术取得了卓越的进展,但其在广告图片的应用还存在缺乏卖点信息、难以规...
-
快速入门大模型技术与应用,推荐你从Stable Diffusion开始学起
ChatGPT狂飙160天,世界已经不是之前的样子。 新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注 世界是变化的,分子是...
-
Stable Diffusion XL(未待完续)
模型介绍 Stable Diffusion XL 是一种基于人工智能的图像生成模型,由Stability AI开发。它是Stable Diffusion系列模型中的一员,专门设计用来生成更高质量的图像。这个模型在原有的Stable Diffusion模型...
-
为Stable Diffusion模型瘦身并达到SOTA!LAPTOP-Diff:剪枝蒸馏新高度(OPPO)
文章链接:https://arxiv.org/pdf/2404.11098 在AIGC时代,对低成本甚至设备端应用扩散模型的需求日益增加。在压缩Stable Diffusion模型(SDM)方面,提出了几种方法,其中大多数利用手工设计的层移除方法来获得更...
-
Stable Diffusion EDM Sampler详细解释
EDM (Euler Discretization with Momentum : EDM代表了欧拉离散化并带有动量的方法,它通常是对连续时间扩散过程进行数值积分的一种变体,通过引入动量项来改进收敛性和稳定性。 在 EDMSam...
-
Stable Diffusion使用ControlNet:IP-Adapter实现图片风格迁移
IP-Adapter 全称是 Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models(文本到图像扩散模型的文本兼容图像提示适配器),是腾讯研究院出品的一个新的Contr...
-
Stable Diffusion 模型演进:LDM、SD 1.0, 1.5, 2.0、SDXL、SDXL-Turbo 等
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学。 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 合集: 持续火爆!!...
-
Diffusion Model, Stable Diffusion, Stable Diffusion XL 详解
文章目录 Diffusion Model 生成模型 DDPM概述 向前扩散过程 前向扩散的逐步过程 前向扩散的整体过程 反向去噪过程 网络结构 训练和推理过程 训练过程 推理过程 优化目标 详细数学推导 数学基础 向前扩散过程 反向...
-
【Diffusion实战】基于Stable Diffusion实现文本到图像的生成(Pytorch代码详解)
来试试强大的Stable Diffusion吧,基于Stable Diffusion的pipeline,进一步了解Stable Diffusion的结构~ Diffusion实战篇: 【Diffusion实战】训练一个diffusion模型生成...
-
每日AIGC最新进展(6):视觉一致插图序列生成、阿里巴巴电商人物产品互动图生成、Text-to-Vector生成、多视图扩散模型3D重建
Diffusion Models专栏文章汇总:入门与实战 Generating Coherent Sequences of Visual Illustrations for Real-World Manual Tasks http://arxiv....
-
Midjourney原理与代码实例讲解
1. 背景介绍 1.1 人工智能生成内容的兴起 近年来,人工智能技术突飞猛进,其中一个引人注目的领域是人工智能生成内容 (AIGC 。AIGC 利用人工智能算法,自动生成各种形式的内容,例如文本、图像、音频和视频。AIGC 的兴起为创意产业带来了革命性...
-
腾讯混元发布开源加速库,生图时间缩短75%
6月6日,腾讯发布针对腾讯混元文生图开源大模型(以下简称为混元DiT模型)的加速库,让推理效率大幅提升,生图时间缩短75%。 混元DiT模型的使用门槛也大幅降低。用户可以基于ComfyUI的图形化界面,使用腾讯混元文生图模型能力。同时,混元DiT模型已经...
-
快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
什么?疯狂动物城被国产AI搬进现实了? 与视频一同曝光的,是一款名为「可灵」全新国产视频生成大模型。 它采用了Sora相似的技术路线,结合多项自研技术创新,生成的视频不仅运动幅度大且合理,还能模拟物理世界特性,具备强大的概念组合能力和想象力。 数据上看...
-
如何在本地运行Stable Diffusion生成震撼图像
2022年AI的奇迹:如何在本地运行Stable Diffusion生成震撼图像 2022年是人工智能领域的奇迹之年。Stability.ai 开源的 Stable Diffusion 模型与 OpenAI 发布的 ChatGPT,像两颗耀眼的明星,点...
-
把整个地球装进神经网络,北航团队推出全球遥感图像生成模型
北航的研究团队,用扩散模型“复刻”了一个地球? 在全球的任意位置,模型都能生成多种分辨率的遥感图像,创造出丰富多样的“平行场景”。 而且地形、气候、植被等复杂的地理特征,也全都考虑到了。 受Google Earth启发,北航的研究团队从俯拍视角出发,将...
-
Stable Diffusion安装(非秋叶包一键部署)
Stable Diffusion安装与配置详细步骤 一 、下载前置资源 下载CUDA 1. 查看CUDA版本 通过以下命令查看CUDA版本: nvidia-smi 复制 确保CUDA版本符合要求。 2. 下载CUDA ...
-
人工智能 | 360自研可控布局AI绘画模型HiCo发布
龙年春意伊始,360人工智能研究院正式发布新的AI绘画模型:可控布局生成模型HiCo。与大家所熟悉的文生图模型相比,HiCo在普通的文本输入之上,提供了更为强大的画面布局控制能力:用户可以根据自己的构思,指定在画面不同的区域生成不同的指定内容,实现A...
-
扩散模型的技术原理和应用价值
引言 一、扩散模型的基本概念 扩散模型(Diffusion Models 是一种基于概率论的生成模型,最初源自物理学中的扩散过程理论,比如墨水在水中的扩散过程。在机器学习领域,这一概念被创造性地应用于数据生成任务,特别是图像和声音的合成。它们通过模拟一个...
-
生数科技完成数亿元 Pre-A 轮融资 加速布局多模态大模型
生数科技完成数亿元 Pre-A 轮融资,该轮融资由北京市人工智能产业投资基金、百度联合领投,中关村科学城公司等跟投,启明创投等数位老股东继续支持。此前,生数科技已经获得来自蚂蚁集团、BV百度风投、卓源亚洲、锦秋基金、达泰资本、智谱AI等机构的投资。 本轮融...
-
AI日报:智谱清言智能体中心上线AI老罗;英雄联盟现在可以用AI辅助了?面壁智能宣布MiniCPM 免费商用;英伟达推出对应Comfyui节点
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、智谱 AI 全模型矩阵降价 清...
-
CVPR 2024 | 前沿而相对小众!几个AIGC扩散模型diffusion应用一览
1、机器人规划/智能决策 SkillDiffuser: Interpretable Hierarchical Planning via Skill Abstractions in Diffusion-Based Task Execution 扩散...
-
每日AIGC最新进展(7):频域引导的超分扩散模型、同时生成自然的说话面孔和语音输出Text-to-Speaking Face、4D全景场景图生成、语义感知的协同语音手势合成
Diffusion Models专栏文章汇总:入门与实战 Frequency-Domain Refinement with Multiscale Diffusion for Super Resolution http://arxiv.org/abs...
-
Stable Diffusion扩散模型【详解】小白也能看懂!!
文章目录 1、Diffusion的整体过程 2、加噪过程 2.1 加噪的具体细节 2.2 加噪过程的公式推导 3、去噪过程 3.1 图像概率分布 4、损失函数 5、 伪代码过程 此文涉及公式推导,需要参考这篇文章: Stable...
-
Sora底层技术原理:Stable Diffusion运行原理
AIGC 热潮正猛烈地席卷开来,可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度,特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性,也在逐渐改变一部分行业的生产模式。惊...
-
Stable Diffusion教程|快速入门SD绘画原理与安装
什么是Stable Diffusion,什么是炼丹师?根据市场研究机构预测,到2025年全球AI绘画市场规模将达到100亿美元,其中Stable Diffusion(简称SD)作为一种先进的图像生成技术之一,市场份额也在不断增长,越来越多的人参与到AI掘金...
-
Stable Diffusion文生图技术详解:从零基础到掌握CLIP模型、Unet训练和采样器迭代
文章目录 概要 Stable Diffusion 底层结构与原理 文本编码器(Text Encoder) 图片生成器(Image Generator) 那扩散过程发生了什么? stable diffusion 总体架构 主要模块分析 Un...
-
Stable Diffusion教程|Controlnet插件详解和实战
不知道你是否发现,无论你再怎么精确使用文本提示词来指导SD模型,也无法描述清楚人物的四肢角度、背景中物体位置等等,因为文字的表达能力很有限。那么有没有一种通过图像特征来为扩散模型生成过程提供更加精细控制的方式,答案是肯定,那就是ControlNet! 目...
-
Stable Diffusion初级教程
一、入门篇 1. 理解基本概念 扩散模型(Diffusion Models):扩散模型是一种生成模型,通过逐步添加噪声到数据样本中,然后学习如何逐步去除这些噪声来恢复原始数据。 Latent Diffusion Model (LDM :LDM是...
-
通俗易懂的Stable Diffusion模型结构介绍
目录 SD的发展历程 SD 模型的网络结构 ClipText 文本编码器 文本向量输入Unet VAE模型 总结图 SD的发展历程 Stab...
-
AI绘画I保姆级 Stable Diffusion 教程,看完这篇就够了!
2022 年 8 月,在美国科罗拉多州举办了一场新兴数字艺术家竞赛,一幅名为《太空歌剧院》的作品获得“数字艺术/数字修饰照片”类别的一等奖,神奇的是,该作品的作者并没有绘画基础,这幅画是他用 AI 生成的。 什么是 AI 绘画呢?AI 绘画是指使用人工智...
-
AI大模型日报#0422:深扒「全球TOP 10大模型团队」、扎克伯格 Llama 3访谈
导读: 欢迎阅读《AI大模型日报》,内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了每条资讯的摘要。 标题: 文本生成8K、360度全景世界!Model 3重磅发布 摘要: Blockade Labs发布了新模型Model 3,...
-
众神听令,王者归位!Meta最强开源大模型 Llama 3 重磅来袭
整理 | 王轶群 责编 | 唐小引 出品丨AI 科技大本营(ID:rgznai100) 4月19日凌晨,Meta重磅发布了全球最大开源大模型Llama 3,一夜间重新坐稳王者之位。 模型下载链接:https://llama.meta.com/lla...
-
AIGC系列之:DDPM原理解读(简单易懂版)
目录 DDPM基本原理 DDPM中的Unet模块 Unet模块介绍 Unet流程示意图 DownBlock和UpBlock MiddleBlock 文生图模型的一般公式 总结 本文部分内容参考文章:https://ju...
-
【带文字的图像生成-附开源代码】AIGC 如何在图像中准确生成文字?字体篇(上)
文字图像生成是什么? “文字图像生成(Text-image generation)”即生成带有指定文字的图像。如下图所示,市面常见的通用文生图很难准确地生成带有指定文字的图像。文字图像生成也被称为文本渲染(Text rendering)。 为什么重要?...
-
DiffMap:首个利用LDM来增强高精地图构建的网络
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文标题: DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model 论文作者: Peijin Jia, Tuo...
-
CVPR 2024 | 图像超分、图像恢复汇总!用AIGC扩散模型diffusion来解决图像low-level任务的思路...
1、Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Decoder 超分辨率(SR)和图像生成是计算...
-
CVPR 2024 | 图像检测类(目标、deepfake、异常)!AIGC扩散模型diffusion解决detection任务...
目标跟踪 1、Delving into the Trajectory Long-tail Distribution for Muti-object Tracking 多目标跟踪(Multiple Object Tracking,MOT)是计算...
-
Stable Diffusion【ControlNet】:ControlNet的IP-Adapter预处理器:SD垫图实现
大家好,今天我们来详细介绍一下ControlNet的预处理器IP-Adapter。简单来说它就是一个垫图的功能,我们在ControlNet插件上传一张图片,然后经过这个预处理器,我们的图片就会在这张上传的图片的基础上进行生成。该预处理器提供的垫图功能,让S...
-
CVPR 2024 | 风格迁移和人像生成汇总!扩散模型diffusion用于经典AIGC方向
风格迁移 1、DEADiff: An Efficient Stylization Diffusion Model with Disentangled Representations 基于文本到图像扩散模型在迁移参考风格方面具有巨大潜力。然而,...
-
51-37 由浅入深理解 Stable Diffusion 3
2024年3月5日,Stability AI公开Stable Diffusion 3论文,Scaling Rectified Flow Transformers for High-Resolution Image Synthesis。公司像往常一样承诺后续...