clip 第6页 - AIGC资讯

喜大普奔，AI绘画SD3终于开源了，AI绘画又添新利器！【附模型下载和安装包】

sd3终于开源了！没错就是stablediffusion 3.0版本！这是stability迄今为止最先进最复杂图像生成模型。这次开源的是medium版本，总共有三个型号的模型，下面我们来详细的说下sd3的功能特点以及不同型号区别、安装方法！首...

生成式AI 2024-06-27 人工智能

1546阅读

Stable Diffusion web UI 安装、启动脚本、插件（Debian12）

一、Debian12安装教程很多，这儿就不详细说明啦，小编使用的是“debian-12.5.0-amd64-DVD-1.iso”。二、换源 Debian12需要先换源，才能在安装第三方包时不出现报错。 1、备份当前镜像源 cp /etc/...

AIGC 2024-06-26 人工智能

1251阅读

重磅发布！Stable Diffusion 3 Medium 终于开源，革新图像生成技术新时代

重磅发布！Stable Diffusion 3 Medium 终于开源，革新图像生成技术新时代关键词：Stable Diffusion 3 Medium, MMDiT, 文本到图像模型, 图像质量, 排版, 复杂提示理解, 资源效率原...

AIGC 2024-06-26 人工智能

916阅读

Stable Diffusion XL网络结构-超详细原创

强烈推荐先看本人的这篇 Stable Diffusion1.5网络结构-超详细原创-CSDN博客 1 Unet 1.1 详细整体结构 1.2 缩小版整体结构以生成图像1024x1024为例，与SD1.5的3个CrossAttnDownBlo...

大数据 2024-06-25 人工智能

1137阅读

stable diffusion 1.x 模型训练概述

本文主要介绍sd发展的第一阶段版本的模型架构和一些微调训练方法，后续版本SDXL，LCM 版本再写文章继续介绍 SD 1.x 版本模型结构 autoencoder(VAE ：encoder将图像压缩到latent空间，而decoder将latent解码...

生成式AI 2024-06-25 人工智能

1146阅读

Stable Diffusion WebUI 安装记录[Ubuntu服务器]

前言在远程服务器（Ubuntu）上安装Stable Diffusion WebUI。服务器是4090，所以在服务器上配置。原本是MobaXterm SSH连接服务器，建议用vscode连接。尝试了给服务器出海但不知道为什么还是不行。GitHub上我...

生成式AI 2024-06-25 人工智能

951阅读

Llama 3-V：以100倍小的模型和500美元匹敌GPT4-V视觉模型

概述 Llama3 的横空出世震惊了世界，它在几乎所有基准测试中都超越了 GPT-3.5，并在一些方面超越了 GPT-4。随后，GPT-4o 的出现凭借其多模态能力再次夺回了王座。今天，我们发布了一个改变现状的产品：Llama3-V，这是首个基于 Ll...

AIGC 2024-06-25 人工智能

1280阅读

Llama 3-V: 比GPT4-V小100倍的SOTA

大模型技术论文不断，每个月总会新增上千篇。本专栏精选论文重点解读，主题还是围绕着行业实践和工程量产。若在某个环节出现卡点，可以回到大模型必备腔调重新阅读。而最新科技（Mamba，xLSTM,KAN）则提供了大模型领域最新技术跟踪。若对于如果构建生成级别的A...

人工智能 2024-06-25 人工智能

1164阅读

AI绘画：实例-利用Stable Diffusion ComfyUI实现多图连接：区域化提示词与条件设置

在Stable Diffusion ComfyUI中，有一种高级技巧可以让用户通过细致的区域化提示词来控制图像的不同部分，从而实现多图连接的效果。这种方法允许艺术家在同一画布上展现多个场景，创造出富有层次和故事性的图像。以下是实现这一效果的详细步骤。步...

AIGC 2024-06-25 人工智能

2711阅读

Midjourney + SD 做场景图太香了

Midjourney V6 生成的图片细节逼真，堪比真实摄影。它可以解决绝大多数商业上的场景图需求。从此再也不必专门为了场景而去拍摄照片了。资料在文末获取。可是，光有场景很难实现商业上的落地。如何把产品很自然地融入其中才是关键！这时候 Stable D...

大数据 2024-06-24 人工智能

1298阅读

Stable Diffusion 3 如何下载安装使用及性能优化

Stable Diffusion 3 Stable Diffusion 3（SD3），Stability AI最新推出的Stable Diffusion模型系列，现在可以在Hugging Face Hub上使用，并且可以与Diffusers一起使用。...

AIGC 2024-06-24 人工智能

1333阅读

原来Stable Diffusion是这样工作的

stable diffusion是一种潜在扩散模型，可以从文本生成人工智能图像。为什么叫做潜在扩散模型呢？这是因为与在高维图像空间中操作不同，它首先将图像压缩到潜在空间中，然后再进行操作。在这篇文章中，我们将深入了解它到底是如何工作的,还能够知道文生图...

生成式AI 2024-06-24 人工智能

1015阅读

10款AI变现案例：利用stable diffusion 赚钱的10种方式

stable diffusion 是一种基于文本生成图像的深度学习模型，它可以根据任何文本输入生成逼真的图像。它利用了 CLIP ViT-L/14 文本编码器的文本嵌入和扩散模型的潜在变量，实现了高质量的图像合成。 stable diffusion 可以...

大数据 2024-06-24 人工智能

2008阅读

安装stable diffusion，加载模型报错：AttributeError: ‘NoneType‘ object has no attribute ‘lowvram‘ 的解决办法

Windows中安装stable diffusion流程（使用原始方法、非整合包快捷安装）：实验机器配置： OS：Win10 64bit；CPU：i5 4.1GHz 12核；内存32G；显卡NVIDIA Quadro P1000 4G显存参考...

大数据 2024-06-24 人工智能

2027阅读

9个全球顶尖的AIGC图片生成网站

AIGC图片生成网站的出现，为人们提供了全新的创作模式，通过输入简单的prompt就可以得到高质量的图片作品。这是我收集到的10个全球顶尖的AIGC图片生成网站，都放到这个链接里面了，Smart Tab by NoteGPT - Build Your A...

人工智能 2024-06-23 人工智能

3700阅读

Stable Diffusion安装记录II

文章目录前言 0 更改python路径（跳过） 1 Torch is not able to use GPU 1.1 确认显卡 1.2 安装nvdia驱动 1.3 检查CUDA 1.4更改启动脚本 2 依赖安装 2.1 pip inst...

生成式AI 2024-06-23 人工智能

1200阅读

SD3开源：AI绘画的新纪元，出图效果巨好，不容错过！（附教程）

大家好，我是画画的小强。这两天，Stability AI 将史上最牛的AI绘画模型SD3开源了，真是有格局！虽说只是中杯的20亿参数版本，但我已经很满足了，再高的版本，我这普通的16G 4070Ti Super 显卡也跑不起来… 话不多说，这...

生成式AI 2024-06-23 人工智能

1324阅读

老电脑焕发第二春，玩转 Stable Diffusion 3

几年前，我头脑一热，配置了一台顶配级消费 PC（RTX 2080 Ti GPU + i9 CPU），打算用来学习 AI。然而，起初我并没有找到合适的切入点。深度学习早期阶段，消费级显卡根本无法承担训练大模型、微调大模型，甚至连运行大模型都很吃力。结果...

人工智能 2024-06-23 人工智能

1047阅读

【从零开始AI绘画6】StableDiffusionWebUI拓展的安装方法以及推荐的几个拓展

这里写自定义目录标题拓展Extention 安装方法（以双语对照插件为例） 1、WebUI内置的下载方式（推荐） 2、git clone安装（更推荐） 3、github下载安装包后解压（不推荐）强力推荐安装的几个插件拓展 1、[中...

生成式AI 2024-06-22 人工智能

1041阅读

Diffusion Model原理及Stable Diffusion

什么是扩散（diffusion）？扩散一词来自非平衡热力学（non-equilibrium thermodynamics），在非平衡热力学中扩散过程指的是：“在浓度梯度的驱动下，颗粒或分子从高浓度区域移动到低浓度区域。” 什么是扩散模型（di...

人工智能 2024-06-22 人工智能

1040阅读

Stable Diffusion | Gradio界面设计及API调用

Stability AI 2024年2月发布了 Stable Cascade 模型，但由于该模型较大（fp32格式的 Stage_A + Stage_B + Stage_C 模型超过20GB，ComfyUI 专用 Stage_B + Stage_C 模型也...

生成式AI 2024-06-22 人工智能

1238阅读

ubuntu部署stable-diffusion-webui

1、下载stable-diffusion-webui 我这里使用的是阿里的oss缓存，可以直接下载 wget https://pai-vision-data-sh.oss-cn-shanghai.aliyuncs.com/aigc-data/code/...

生成式AI 2024-06-22 人工智能

981阅读

Stable Diffusion的本地部署教程

以下是在Windows 10电脑上的操作步骤：一、下载安装包从以下夸克网盘下载地址下载安装包到本地，地址如下：链接：https://pan.quark.cn/s/7c51556d27eb 提取码：cFdx 输入提取码之后，界面如下图：...

大数据 2024-06-22 人工智能

1240阅读

不管黑丝或者白丝还是想撕坏它，都可以用LoRA（Stable Diffusion进阶篇：ComfyUI 附加网络）

先来几张图现在来教教大家怎样做出这样的图片在学习WebUI的那些基础知识点的时候，有一个东西是每一个初学者都绕不开的大山-附加网络。这个东西对于每一个接触Stable Diffusion的小伙伴来说就像是小学门口小卖部卖的辣条、初中课本上的涂...

生成式AI 2024-06-22 人工智能

2785阅读

AIGC笔记--Stable Diffusion源码剖析之UNetModel

1--前言以论文《High-Resolution Image Synthesis with Latent Diffusion Models》开源的项目为例，剖析Stable Diffusion经典组成部分，巩固学习加深印象。...

AIGC 2024-06-21 人工智能

1027阅读

在Windows下搭建Stable Diffusion环境中途出错咋弄？

在Windows下搭建Stable Diffusion环境需要以下几个步骤：安装Git和Anaconda 首先，确保你的计算机上已经安装了Git和Anaconda。如果没有安装，可以分别访问官方网站进行下载和安装： Git: https://git...

AIGC 2024-06-21 人工智能

813阅读

Stable Diffusion本地部署教程

0.介绍与版本 1）介绍 Stable Diffusion是一个文本到图像的潜在扩散模型，由CompVis、Stability AI和LAION的研究人员在Latent Diffusion Model的基础上于2022年8月创建并推出。其核心技术源于A...

生成式AI 2024-06-20 人工智能

923阅读

stable diffusion无限贴近真人的调教方法，助力AI变现（下）

对于人像，我的研究重点主要是如何让脸更贴近原图。这篇文章就通过一些专题的实践，讲讲我对还原人脸的一些出图思路、技巧和心得，会从出图思路、优化方向出发，逐步拆解，希望能给大家带来启发。本篇的重点内容有：如何根据一张图像还原人脸？如何使用 stab...

生成式AI 2024-06-19 人工智能

1843阅读

【学习笔记】文生图模型——Stable diffusion3.0

2.0原理才看到VAE，sd3.0就发布了，虽然还没看到源码和详解，但原来的那个小方向估计得弃。人已经麻了。 1.LDMs模型（stable diffusion≈LDMs+CLIP） 2.stable diffusion3.0模型架构图...

生成式AI 2024-06-19 人工智能

1412阅读

【全网瞩目】最强文生图模型，Stable Diffusion 3技术报告解禁

12号，终于在Hugging Face上出现了 Stable Diffusion 3 Medium。没错，正如他所承诺的，最强文生图模型真的开源了。而且此次开源不仅是以SD2的比较下性能得到了更好的升级，同时也向我们展示了最前沿的DiT技术——MMDiT。...

生成式AI 2024-06-19 人工智能

1236阅读

深入浅出完整解析Stable Diffusion XL（SDXL）核心基础知识

原文：深入浅出完整解析Stable Diffusion XL（SDXL）核心基础知识 Rocky的公众号：WeThinkIn Rocky的知乎：Rocky Ding 更多AI行业干货内容欢迎关注Rocky的CSDN、知乎、公众号～码字不易，希望大家...

大数据 2024-06-18 人工智能

4995阅读

利用Python与Whisper革新视频翻译：打造高精度字幕翻译流程。

实现流程需要使用以下的工具。 1.python,需要自行安装， 2.python的音视频处理库moviepy安装 pip install moviepy 3.Whisper语音识别，在我之前的文章中有：Whisper语音识别安装教程。 4.文字翻...

人工智能 2024-06-18 人工智能

1196阅读

从论文中看AI绘画

个人博客:Sekyoro的博客小屋个人网站:Proanimer的个人网站主要看是看Diffusion Models,CLIP,ControlNet,IP-Adapter这种经典论文,尝试总结论文写作的一些方式以及图像生成模型的一些内在思想. 对于其中的数...

AIGC 2024-06-18 人工智能

1019阅读

AIGC |「多模态模型」系列之OneChart：端到端图表理解信息提取模型

论文标题: OneChart: Purify the Chart Structural Extraction via One Auxiliary Token 论文作者: Jinyue Chen, Lingyu Kong, Haoran Wei, Chen...

人工智能 2024-06-18 人工智能

1164阅读

stable-diffusion 3 体验部署流程（ComfyUI)

环境准备下载及简介 git clone https://huggingface.co/stabilityai/stable-diffusion-3-medium SD3 checkpoints： sd3_medium_incl_clips.s...

大数据 2024-06-17 人工智能

1476阅读

Midjourney基础使用技巧

1.1 常用技巧本篇主要讲述MJ的常用技巧，围绕相关的常用指令来拓展一些使用方法。 2.1 版本切换最常用的是版本切换，其实也可以通过在prompt后添加--v加数字一般我都默认MJ 4，偶尔用 3 或Niji。V4对生物、地方、物体等有更多...

生成式AI 2024-06-17 人工智能

1085阅读

【LLM第二篇】stable diffusion扩散模型、名词解释

最近在整理大模型的相关资料，发现了几个名词，不是很懂，这里整理一下： stable diffusion（SD 模型：扩散模型（Diffusion model）的一种，主要用于生成高质量的图像，GAN的替代者，扩散模型通过一些列学习步骤生成数据，逐渐从...

人工智能 2024-06-17 人工智能

1353阅读

whisper使用

whisper使用 1. 直接调用语音识别 2. 语种识别 whisper.detect_language( 和whisper.decode( 3. 指定要识别的语种做语音识别 **whisper 源码的transcribe函数** 函数解...

生成式AI 2024-06-17 人工智能

1378阅读

论文笔记：Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization

CVPR2024 论文代码：yangxy/PASD (github.com 论文地址：[2308.14469v3] Pixel-Aware Stable Diffusion for Realistic Image Super-resolution a...

大数据 2024-06-16 人工智能

1295阅读

五一超级课堂---Llama3-Tutorial（Llama 3 超级课堂）---第三节llama 3图片理解能力微调（xtuner+llava版）

课程文档： https://github.com/SmartFlowAI/Llama3-Tutorial 课程视频： https://space.bilibili.com/3546636263360696/channel/collectiondetail?...

大数据 2024-06-16 人工智能

1096阅读

重磅！Stable Diffusion 3.0正式开源！史上最强AI绘画模型！（附安装方法和下载地址）

大家好，我是程序员晓晓正如承诺的那样，Stability AI在6月12日正式开源了Stable Diffusion 3（Medium版本）！不愧是AI生图领域的“开源英雄”。接下来就讲讲，怎么在本地部署最新的Stable Diffusion...

人工智能 2024-06-15 人工智能

2281阅读

AIGC——ComfyUI使用SDXL双模型的工作流（附件SDXL模型下载）

SDXL算法概述 SDXL（Stable Diffusion XL）是Stable Diffusion公司发布的一款图像生成大模型。在以往的模型基础上，SDXL进行了极大的升级，其base模型参数数量达到了35亿，refiner模型参数数量达到了66亿...

AIGC 2024-06-15 人工智能

1242阅读

【论文精读】DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents

文章目录一、前言（一）DALLE2 简介（二）DALLE2和DALLE的对比（三）相关模型推出时间二、文章概要（一）标题（二）摘要（三）引言（四）模型架构三、方法（一）图像生成的相关工作（二）diffusion...

大数据 2024-06-15 人工智能

1237阅读

51-34 DALLE2 结合预训练CLIP和扩散模型实现图像生成

今天要分享的论文是OpenAI于2022年4月出品的DALLE2，全名Hierarchical Text-Conditional Image Generation with CLIP Latents。该工作是在CLIP和GLIDE基础之上完成。很早之前...

AIGC 2024-06-15 人工智能

885阅读

Stable Diffusion原理

一、Diffusion扩散理论 1.1、 Diffusion Model（扩散模型） Diffusion扩散模型分为两个阶段：前向过程 + 反向过程前向过程：不断往输入图片中添加高斯噪声来破坏图像反向过程：使用一系列马尔可夫链逐步将噪声还原...

AIGC 2024-06-14 人工智能

1096阅读

Stable Diffusion AI绘画：绘画参数与原理全攻略参上！千万别错过！

一、基础模型和外挂VAE模型 Ⅰ. 基本术语讲解基础模型（大模型/底模型）：属于预调模型，它决定了AI图片的主要风格。 VAE模型：全称Variational auto enconder变分自编码器，它类似于图片生成后的滤镜。 “基础模型”和...

生成式AI 2024-06-13 人工智能

1140阅读

【Stable Diffusion】：SDXL1.0大模型的发布给SD带来全新的使用体验

1.Stable Diffusion XL模型是什么？ SDXL是stabilityai公司推出的最新的图像大模型，可以使用stable diffusion生成Ai图像，SDXL模型与之前的Stable Diffusion v1-v2.1模型相比，使用...

AIGC 2024-06-13 人工智能

1253阅读

运行stable-diffusion出现的问题(1)

Checkout your internet connection or see how to run the library in offline mode at ‘https://huggingface.co/docs/transformers/ins...

生成式AI 2024-06-13 人工智能

2746阅读

stable diffusion官方版本复现

踩了一些坑，来记录下环境 CentOS Linux release 7.5.1804 (Core 服务器 RTX 3090 复现流程按照Stable Diffusion的readme下载模型权重、我下载的是stable-diffusio...

生成式AI 2024-06-13 人工智能

1080阅读

人工智能学习笔记（2）：认识和安装Stable Diffusion

人工智能学习笔记（2）：认识和安装Stable Diffusion 文章目录人工智能学习笔记（2）：认识和安装Stable Diffusion Stable Diffusion的起源和发展历程 Stable Diffusion的应用...

人工智能 2024-06-13 人工智能

1047阅读