扩散模型第11页

深入浅出完整解析Stable Diffusion（SD）核心基础知识

2022年，Stable Diffusion模型横空出世，其成为AI行业从传统深度学习时代走向AIGC时代的标志性模型之一，并为工业界，投资界，学术界以及竞赛界都注入了新的AI想象空间，让AI再次性感。 Stable Diffusion是计算机视觉领域的...

人工智能 2024-01-31 人工智能

2934阅读

多模态LLM多到看不过来？先看这26个SOTA模型吧

当前 AI 领域的关注重心正从大型语言模型（LLM）向多模态转移，于是乎，让 LLM 具备多模态能力的多模态大型语言模型（MM-LLM）就成了一个备受关注的研究主题。近日，腾讯 AI Lab、京都大学和穆罕默德・本・扎耶德人工智能大学的一个研究团队发布...

生成式AI 2024-01-31 人工智能

831阅读

Stable Diffusion学习

参考 Stable Diffusion原理详解_stable diffusion csdn-CSDN博客 Stable Diffusion是stability.ai开源的图像生成模型，可以说Stable Diffusion的发布将AI图像生成提高到了全新...

大数据 2024-01-31 人工智能

1007阅读

阿里Animate Anyone体验入口 AI生成动画视频怎么使用指南教程方法

Animate Anyone是一款专为角色动画而设计的先进扩散模型。通过驱动信号从静态图像生成角色视频，Animate Anyone引入了一系列创新性的技术，包括ReferenceNet、高效的姿势指导器以及有效的时间建模方法。这些设计保证了生成的视频在外...

生成式AI 2024-01-31 人工智能

1024阅读

基于参考物体的AIGC图像生成技术在家居导购领域的应用

本文深入探讨了基于参考物体的人工智能图像生成（AIGC）技术的最新进展。首先概述了该类技术如何发展至今，然后着重分析了两篇重要的相关学术论文。随后，文章针对家居导购领域的特殊应用场景，讨论了运用此项技术时遭遇的挑战和取得的最新效果。...

AIGC 2024-01-31 人工智能

887阅读

一文了解国外AIGC头部产品

AIGC是指通过人工智能技术生成的内容，包括文字、图片、音频和视频等。AIGC技术可以基于大量的数据和算法，自动地生成各种类型的内容，可以用于新闻报道、广告宣传、文学创作、游戏设计等各个领域。AIGC技术的优点在于可以大大提高内容生产的效率和质量，节省了人...

大数据 2024-01-30 人工智能

948阅读

stable-diffusion 安装和使用

安装：在电脑上安装环境依赖继续安装把下面这两个文件复制到stable-diffusion-webui 下面点击A...

生成式AI 2024-01-30 人工智能

1343阅读

【AIGC-文本/图片生成视频系列-9】MagicVideo-V2: 多阶段高美感视频生成

目录一. 项目概述与贡献二. 方法详解编辑三. 文本生成视频相关结果四. 与其他方法对比结果五. 个人感悟最近得益于扩散模型的快速发展，文本到视频（T2V）模型的激增。今天要介绍的是字节的MagicVideo-V2，一个新颖...

生成式AI 2024-01-30 人工智能

1228阅读

stable diffusion实践操作-大模型介绍-SDXL1大模型

系列文章目录大家移步下面链接中，里面详细介绍了stable diffusion的原理，操作等（本文只是下面系列文章的一个写作模板）。stable diffusion实践操作提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档...

人工智能 2024-01-30 人工智能

1229阅读

菜鸟初进stable diffusion

不知道是不是玩novelai被boss看到了，推荐了我学stable diffusion 扩散模型 DALL E Midjourney stable diffusion latent diffusion 说是改进点在于“给输入图片压缩降低维度，...

生成式AI 2024-01-30 人工智能

855阅读

无缝衔接Stable Diffusion，一张照片几秒钟就能生成个性化图片-InstantID

最近一段时间基于扩散模型的图像处理方法遍地开花，接下来为大家介绍一种风格化图像的方法InstantID，可以通过仅有一张人脸照片，几秒钟内生成不同风格的人物照片。与传统方法需要多张参考图像和复杂的微调过程不同，InstantID只需一张图像...

AIGC 2024-01-30 人工智能

1125阅读

萤火跑模型 | 高性能 Stable Diffusion 助力高质量 AI 绘图

Stable Diffusion AI 绘画最近成功破圈，成了炙手可热的热门话题。DALLE，GLIDE，Stable Diffusion 等基于扩散机制的生成模型让 AI 作图发生质变，让人们看到了“AI...

人工智能 2024-01-30 人工智能

917阅读

diffusion model（五）stable diffusion底层原理（latent diffusion model， LDM）

LDM: 在隐空间用diffusion model合成高质量的图片！ [论文地址] High-Resolution Image Synthesis with Latent Diffusion Models [github] https://githu...

人工智能 2024-01-30 人工智能

1473阅读

重塑3D生成核心理论：VAST、港大、清华用「零」训练数据生成了3D模型

无需任何训练数据，只需对着模型描述一句话，如「一个做作业的香蕉人」：或是「一只戴着 VR 眼镜的猫」：就能生成符合描述的带有高质量纹理贴图的 3D 场景。不仅如此，还能对已有的 3D 模型进行精细化贴图。这是港大与清华大学联合 3D 生成明星...

AIGC 2024-01-29 人工智能

854阅读

AI生成动画图像视频在线使用地址 Animate Anyone体验入口

Animate Anyone旨在通过驱动信号从静态图像生成角色视频，是一款专为角色动画量身定制的新框架。利用扩散模型的力量，该工具在角色动画方面表现出色。为了保持参考图像中复杂外观特征的一致性，设计了ReferenceNet来通过空间注意力合并详细特征。为...

大数据 2024-01-29 人工智能

1209阅读

Stable Diffusion XL总结

Stable Diffusion XL是一个二阶段的级联扩散模型，包括Base模型和Refiner模型。其中Base模型的主要工作和Stable Diffusion一致，具备文生图，图生图，图像inpainting等能力。在Base模型之后，级联了Refi...

AIGC 2024-01-29 人工智能

2647阅读

十分钟读懂Stable Diffusion运行原理

AIGC 热潮正猛烈地席卷开来，可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度，特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性，也在逐渐改变一部分行业的生产模式。惊...

生成式AI 2024-01-29 人工智能

975阅读

360度无死角！UC伯克利华人发布3DHM框架：一张图片即可模仿任意视频动作

输入一张任意姿势的照片，想让照片里的人跟随「指定视频」来进行动作模仿并不简单，除了肢体动作的模仿外，模型还需要对运动过程中衣服、人物外观的变化进行建模。如果输入图像是正面的，而模仿的视频动作包括转身的话，模型还需要「想象」出衣服的背面样子，以及衣...

生成式AI 2024-01-29 人工智能

907阅读

未来五年AI如何改变各学科？从LLM到AI蛋白设计、医疗保健......

五年前（2019 年 1 月），《Nature Machine Intelligence》创刊。当然，就人工智能（AI）而言，五年前似乎是一个不同的时代。 1 月 24 日，Nature Machine Intelligence 杂志在《Annivers...

AIGC 2024-01-29 人工智能

901阅读

AIGC笔记总结（一）：扩散模型简介

?个人主页: GoAI |? 公众号: GoAI的学习小屋 | ?交流群: 704932595 |?个人简介：掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等，专注大数...

人工智能 2024-01-29 人工智能

919阅读

从20亿数据中学习物理世界，基于Transformer的通用世界模型成功挑战视频生成

建立会做视频的世界模型，也能通过Transformer来实现了！来自清华和极佳科技的研究人员联手，推出了全新的视频生成通用世界模型——WorldDreamer。它可以完成自然场景和自动驾驶场景多种视频生成任务，例如文生视频、图生视频、视频编辑、动作序...

AIGC 2024-01-29 人工智能

852阅读

过去两周，六个最有可能改变AI进程的发布！

编译｜言征过去两周，新的人工智能更新不断涌现，异常疯狂。我们决定整理最近发布的六大框架和模型。 1、ActAnywhere：主题感知视频背景生成图片 Adobe Research和斯坦福大学推出了Act Anywhere，这是一种生成模型，解决了电...

人工智能 2024-01-29 人工智能

855阅读

Stable Diffusion 系列教程 - 6 Dreambooth及训练

Stable-Diffusion、Imagen等文生图大模型已经具备了强大的生成能力，假设我们的Prompt为 [Cyberpunk Style]，SD或许能很快画出赛博朋克风格的一幅画。但你作为一个不知名的人，不能奢求SD在训练的时候把你自己想要的风格也...

生成式AI 2024-01-28 人工智能

1267阅读

一文教会你使用AI绘画利器Stable Diffusion！这可能是CSDN最全的AI绘画使用教程，建议收藏！

大家好，我是程序员晓晓随着 stable-diffusion 的开源，让更多人有机会直接参与到 AI 绘画的创作中，相关的教程也如雨后春笋般的出现。可是目前我看到的教程同质性较高，通常只能称作为"使用流程讲解"，但是通常没有对其原理和逻辑进行深入说明。...

AIGC 2024-01-28 人工智能

1934阅读

stable diffusion 百宝书

文章目录 0. 环境搭建 0.1 Windows 0.1.1 git环境安装 0.1.2 python 环境搭建 0.1.2.1 配置pip国内镜像源 0.1.3 stable diffusion环境搭建 0.1.3.1 远程访问Stab...

人工智能 2024-01-26 人工智能

919阅读

一句话让小姐姐为我换了N套衣服，谷歌卷出视频生成新高度，网友：竞赛加码

谷歌一出手，又把AI视频生成卷上了新高度。一句话生成视频，现在在名为Lumiere的AI操刀下，可以是酱婶的： △“阳光明媚，帆船在湖中航行” 如此一致性和质量，再次点燃了网友们对AI视频生成的热情：谷歌加入战局，又有好戏可看了。不止是文生视频，...

人工智能 2024-01-26 人工智能

819阅读

零基础入门AI绘画神器Stable Diffusion保姆级别教程！！小白必收藏！！！

手把手教你入门绘图超强的AI绘画程序Stable Diffusion，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新Stable Diffusion保姆级教程资料包（文末可获取）一、本地部署 Stable diffusion...

人工智能 2024-01-26 人工智能

1660阅读

Stable-Diffusion-WebUI 搭建使用教程

Stable-Diffusion-Webui 是一个基于Gradio库的Stable Diffusion的浏览器界面，可以说是AI绘画集合体，支持目前主流的开源AI绘画模型，例如 NovelAi/Stable Diffusion，有了它，我们就可以很方便地...

大数据 2024-01-26 人工智能

1721阅读

AI绘图-StableDiffusion安装

AI绘图-StableDiffusion安装前言：StableDiffusion是一个基于Latent Diffusion Models(潜在扩散模型，LDMs 的文图生成(text-to-image 模型。它主要用于根据文字的描述产生详细图像，能...

生成式AI 2024-01-26 人工智能

1067阅读

一文读懂Stable Diffusion 论文原理+代码超详细解读

背景 Stable diffusion是一个基于Latent Diffusion Models（LDMs）实现的的文图生成（text-to-image）模型。 2022年8月，游戏设计师Jason Allen凭借AI绘画作品《太空歌剧院（Théâtre...

AIGC 2024-01-26 人工智能

3354阅读

AIGC：文生图模型Stable Diffusion

1 Stable Diffusion介绍 Stable Diffusion 是由CompVis、Stability AI和LAION共同开发的一个文本转图像模型，它通过LAION-5B子集大量的 512x512 图文模型进行训练，我们只要简单的输入一段文...

生成式AI 2024-01-26 人工智能

1021阅读

3DTopia官网体验入口 AI快速生成文本到3D模型软件在线使用地址

3DTopia是一款先进的文本到3D生成模型，通过两阶段的处理，能在短短 5 分钟内实现高质量的文本到3D模型的生成。这一创新工具的应用范围广泛，特别适合那些需要快速生成3D物体、进行文本图像转换、以及从事3D设计的用户。点击前往3DTopia官网体验...

AIGC 2024-01-25 人工智能

1134阅读

AI大模型开发架构设计（2）——AI绘画技术架构&应用实践

文章目录 AI绘画技术架构&应用实践 1 AI绘画整体流程 2 AI绘画技术架构文生图核心算法原理文生图工程架构 3 AI绘画的应用实践 AI绘画技术架构&应用实践 1 AI绘画整体流程第一步：...

人工智能 2024-01-25 人工智能

1043阅读

Lumiere文生视频模型怎么使用 AI生成视频Lumiere官网地址入口

Lumiere是一个文本到视频扩散模型，旨在合成展现真实、多样和连贯运动的视频，解决视频合成中的关键挑战。我们引入了一种空时U-Net架构，可以一次性生成整个视频的时间持续，通过模型的单次传递。这与现有的视频模型形成对比，后者合成远距离的关键帧，然后进行时...

AIGC 2024-01-25 人工智能

884阅读

AI4Science还是伪命题吗？两年后workshop组织者重新审视AI4Science

2021年，一群热血青年提出了要把AI4Science（AI for Science）带入机器学习顶会NeurIPS。什么？AI4Science是一门学科吗？是不是靠着AI蹭热点？各种质疑声接踵而来。这些质疑和不解也反映在了第一届AI4Science...

人工智能 2024-01-25 人工智能

940阅读

stable diffusion推理过程代码梳理

最近在看stable diffusion，想梳理一下代码流程，以便之后查阅从txt2img.py开始看 1.首先是对文本进行编码（1）调用的是 stable-diffusion/ldm/models/diffusion/ddpm.py的get...

人工智能 2024-01-25 人工智能

1073阅读

Stable Diffusion WebUI中COMMANDLINE_ARGS参数配置说明

Windows用户：在webui-user.bat文件的set COMMANDLINE_ARGS=后面配置 Linux用户：在webui-user.sh文件的export COMMANDLINE_ARGS=""引号中配置 COMMANDL...

生成式AI 2024-01-24 人工智能

851阅读

【扩散模型】12、Stable Diffusion | 使用 Diffusers 库来看看 Stable Diffusion 的结构

文章目录一、什么是 Stable Diffusion 二、Diffusers 库三、微调、引导、条件生成 3.1 微调 3.2 引导 3.3 条件生成四、Stable Diffusion 4.1 以文本为条件生成 4.2 无分类器的...

大数据 2024-01-24 人工智能

2240阅读

Lumiere官网体验入口 AI视频合成、图像到视频、修补和风格化生成工具在线使用地址

Lumiere是一款先进的视频合成工具，致力于解决视频合成中的关键挑战。采用空时U-Net架构，Lumiere能够一次性生成整个视频的时间持续，展现真实、多样和连贯的运动。与传统方法不同，它通过下采样和上采样以及预训练的文本到图像扩散模型，直接生成多个时空...

AIGC 2024-01-24 人工智能

1014阅读

AI视野：谷歌发布视频生成模型Lumiere； AI女友陪聊月入20+万元；谷歌浏览器新增生成式AI；《幻兽帕鲁》疑似用AI卷设计

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用谷歌发布视频生成模...

AIGC 2024-01-24 人工智能

890阅读

画个框、输入文字，面包即刻出现：AI开始在3D场景「无中生有」了

现在，通过文本提示和一个2D 边界框，我们就能在3D 场景中生成对象。看到下面这张图了没?一开始，盘子里是没有东西的，但当你在托盘上画个框，然后在文本框中输入文本「在托盘上添加意大利面包」，魔法就出现了:一个看起来美味可口的面包就出现在你的眼前。房间...

生成式AI 2024-01-24 人工智能

937阅读

扩散模型更懂复杂提示词！Pika北大斯坦福开源新框架，利用LLM提升理解力

Pika北大斯坦福联手，开源最新文本-图像生成/编辑框架！无需额外训练，即可让扩散模型拥有更强提示词理解能力。面对超长、超复杂提示词，准确性更高、细节把控更强，而且生成图片更加自然。效果超越最强图像生成模型Dall·E 3和SDXL。比如要求图片...

生成式AI 2024-01-24 人工智能

868阅读

万字总结 | 2023大模型与自动驾驶论文走马观花

本文经自动驾驶之心公众号授权转载，转载请联系出处。 2023年已经匆匆过去大半，不知各位自动驾驶小伙伴今年的工作生活情况是否顺利呢？高阶ADAS方案量产了吗？新的文章和实验进展又是否顺利呢？今天给大家总结了2023年前后的一些自动驾驶结合大模型的开创性...

生成式AI 2024-01-24 人工智能

1186阅读

stable diffusion模型评价框架

GhostReview:全球第一套AI绘画ckpt评测框架代码 - 知乎大家好，我是_GhostInShell_，是全球AI绘画模型网站Civitai的All Time Highest Rated (全球历史最高评价第二名的GhostMix的作者。在上...

AIGC 2024-01-24 人工智能

1594阅读

stable diffusion模型训练时数据量

文生图模型之Stable Diffusion - 知乎通向AGI之路码字真心不易，求点赞！ https://zhuanlan.zhihu.com/p/6424968622022年可谓是 AIGC（AI Generated Content）元年，上半年有文生...

大数据 2024-01-24 人工智能

2174阅读

AI作画的背后是怎么一步步实现的？一文详解AI作画算法原理+性能评测

前言 “AI作画依赖于多模态预训练，实际上各类作画AI模型早已存在，之所以近期作品质量提升很多，可能是因为以前预训练没有受到重视，还达不到媲美人类的程度，但随着数据量、训练量的增多，最终达到了现在呈现的效果。”远在AI作画还没有爆火之前，深度学习就已经...

生成式AI 2024-01-24 人工智能

1130阅读

UltrAvatar官网体验入口 AI生成逼真可动3D头像生成模型在线使用地址

UltrAvatar是一款逼真可动的3D头像生成模型，它采用先进的AI技术，可以生成高保真度、高质量的3D头像。UltrAvatar应用了Score Distillation Sampling (SDS loss和可微分渲染器以及文本条件来引导扩散模型生...

生成式AI 2024-01-23 人工智能

1013阅读

[论文精读] 自条件图像生成 - 【恺明大神新作，AIGC 新基准】

论文导读: 论文背景: 2023年8月，AI大神何恺明在个人网站宣布，2024年将加入MIT担任教职，回归学术界。这篇论文是其官宣加盟MIT后首度与MIT师生合著的公开论文，论文一作本科毕业于清华姚班，二作为MIT电气工程与计算机科学系教授，今年的斯...

生成式AI 2024-01-23 人工智能

1018阅读

stable-diffusion、stable-diffusion-webui、novelai、naifu区别介绍

文章目录 1. Stable Diffusion Reference 2. Stable Diffusion WebUI Reference 3. NovelAI Reference 4. Naifu Reference 区别简述 Refere...

大数据 2024-01-23 人工智能

1446阅读

从0到1，入门到进阶玩转AI——Stable Diffusion超详细教程（一）

前沿目前市面上的AI主要集中在两方面，一方面是AI 作图（代表产品：Midjourney和Stable-Diffusion），一方面是AI应答（代表产品：ChatGPT），本文主要针对AI作图进行探索。由于Midjo...

大数据 2024-01-23 人工智能

1236阅读