-
AI绘画利器:Stable-Diffusion-ComfyUI保姆级教程
AI绘画在今天,已经发展到了炽手可热的地步,相比于过去,无论是从画面精细度,真实性,风格化,还是对于操作的易用性,都有了很大的提升。并且如今有众多的绘画工具可选择。今天我们主要来聊聊基于stable diffusion的comfyUI! comfyU...
-
【AIGC】如何在Windows/Linux上部署stable diffusion
文章目录 整体安装步骤 windows10安装stable diffusion 环境要求 安装步骤 注意事项 参考博客 其他事项 安装显卡驱动 安装cuda 卸载cuda 安装对应版本pytorch 安装git上的python包 Q&...
-
stable-diffusion-webui踩坑指南
过年刷资讯AI的信息铺天盖地,准备研究研究。最后选择从AI绘画的stable diffusion入手。本地安装了最新的Python(13.12.2)然后直接克隆GitHub - Stability-AI/stablediffusion: High-Reso...
-
stable diffusion webui ubuntu 安装和教程
0.环境: cuda:11.8 gpu:p40 torch:2.2.0+cu118 python:3.10.12 1.git clone 下来 GitHub - AUTOMATIC1111/stable-diffusion-webui: St...
-
(含代码)利用NVIDIA Triton加速Stable Diffusion XL推理速度
在 NVIDIA AI 推理平台上使用 Stable Diffusion XL 生成令人惊叹的图像 扩散模型正在改变跨行业的创意工作流程。 这些模型通过去噪扩散技术迭代地将随机噪声塑造成人工智能生成的艺术,从而基于简单的文本或图像输入生成令人惊叹的...
-
如何利用OpenAI、NATS和Streamlight彻底改变实时警报
本文将介绍如何使用Streamlight、NATS和OpenAI这些非常酷的工具,在Python中构建一个全栈事件驱动的天气警报聊天应用程序。该应用程序可以实时收集天气信息,使用人工智能了解警报标准,并将这些警报发送到用户界面。 这段内容和代码示例对于那...
-
AI绘画24年最新的Stable Diffusion整合包安装教程,建议收藏!
1、背景信息 ▍Stable Diffusion 是什么? Stable Diffusion(简称SD)是一种生成式人工智能,于2022年发布,主要用于根据文本描述生成详细图像,也可用于其他任务,如图像的修补、扩展和通过文本提示指导图像到图像的...
-
20240203在WIN10下使用GTX1080配置stable-diffusion-webui.git不支持float16精度出错的处理
20240203在WIN10下使用GTX1080配置stable-diffusion-webui.git不支持float16精度出错的处理 2024/2/3 21:23 缘起:最近学习stable-diffusion-webui.git,在Ubuntu...
-
【讲解下如何Stable Diffusion本地部署】
🎥博主:程序员不想YY啊 💫CSDN优质创作者,CSDN实力新星,CSDN博客专家 🤗点赞🎈收藏⭐再看💫养成习惯 ✨希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共同学习、交流进步! 目录 🎥前言 🎥前提条件 🎥步骤...
-
AIGC在广告创意上的实践
1 引言 1.1 背景 随着抖音、小红书等新媒体的快速崛起,新媒体广告需求日益增大。而新媒体广告投放的图片和文案创意占用了运营工作者大量的精力和时间。文案、图片、视频广告创意制作难度大、效率低、成本高、周期长的问题日益凸显。如何快速的完成广告创意,...
-
20240203在Ubuntu20.04.6下配置stable-diffusion-webui.git
20240203在Ubuntu20.04.6下配置stable-diffusion-webui.git 2024/2/3 11:55 【结论:在Ubuntu20.04.6下,生成512x512分辨率的图像,大概需要11秒钟!】 前提条件,可以通过技术...
-
DALL·E 2(内含扩散模型介绍)【论文精读】Hierarchical Text-ConditionalImage Generation with CLIP Latents
1官方对模型的介绍 大家好,今天我们就一起来看一下两个月之前 OpenAI 刚放出来的一篇力作。DALL·E 2是 OpenAI 一系列文本图像生成工作的最新一篇。去年 1 月份他们先推出了Dolly,然后在年底的时候又推出了glide。...
-
文生图大模型三部曲:DDPM、LDM、SD 详细讲解!
1、引言 跨模态大模型是指能够在不同感官模态(如视觉、语言、音频等 之间进行信息转换的大规模语言模型。当前图文跨模态大模型主要有: 文生图大模型:如 Stable Diffusion系列、DALL-E系列、Imagen等 图文匹配大模型:如CLI...
-
【小白】一文读懂AIGC模型之Stable Diffusion模型
目录 模型简介 模型结构 VAE变分编码器 VAE结构 VAE模型训练与损失函数 U-Net结构 CLIP Text Encoder 模型工作流程 参考 模型简介 Stable Diffusion(SD)模型是一种基于...
-
AIGC批量图生成的一些思考
从技术到先进生产力,从先进装备到作战能力,中间隔了一道GAP。现在AI技术进展很快,开源的模型大部分是单点或者一个模块单元的突破。如何把这些技术整装成作战单元,为业务带来实际的价值是我们必须要解决的一个问题。 消费侧技术点 中文clip: 这...
-
WebCopilot:一款功能强大的子域名枚举和安全漏洞扫描工具
关于WebCopilot WebCopilot是一款功能强大的子域名枚举和安全漏洞扫描工具,该工具能够枚举目标域名下的子域名,并使用不同的开源工具检测目标存在的安全漏洞。 工具运行机制 WebCopilot首先会使用assetsfind...
-
AIGC学习笔记——DALL-E2详解+测试
它主要包括三个部分:CLIP,先验模块prior和img decoder。其中CLIP又包含text encoder和img encoder。(在看DALL·E2之前强烈建议先搞懂CLIP模型的训练和运作机制,之前发过CLIP博客) 论文地址:https...
-
快手强化学习与多任务推荐
一、Two-Stage Constrained Actor-Critic for Short Video Recommendation 第一篇工作是快手自研的,主要针对的是带约束的多任务场景。 1. 短视频多任务推荐场景 这篇工作主要针对的是短视频的一...
-
探索使用对比损失的孪生网络进行图像相似性比较
简介 在计算机视觉领域,准确地测量图像相似性是一项关键任务,具有广泛的实际应用。从图像搜索引擎到人脸识别系统和基于内容的推荐系统,有效比较和查找相似图像的能力非常重要。Siamese网络与对比损失结合,为以数据驱动方式学习图像相似性提供了强大的框架。在...
-
大模型创业淘汰潮开始了:这是第一个估值 10 亿美元的祭品
风雨飘摇中的Stability AI还能走多远? 近期,AI 绘画神器 Stable Diffusion 背后的开发公司 Stability AI 发生一系列变动,包括 CEO Emad Mostaque 在内的多名核心高管、技术人员离职,公司面临现金流危...
-
llama笔记:官方示例解析 example_chat_completion.py
1 导入库 from typing import List, Optional ''' 从typing模块中导入List和Optional。 typing模块用于提供类型注解的支持,以帮助明确函数预期接收和返回的数据类型。 List用于指定列表...
-
秋叶大佬24年最新的Stable Diffusion整合包V4.6.7来了~
! 「 无套路!文末提供下载方式 」 要说今年绘画圈最大的新秀 那妥妥的就Stable Diffution V4升级版无需安装**,直接解压就能用 (在此要感谢秋葉aaaki大佬的分享!) 比之前推送的更加智能、快速和简单 有多简单呢?这么说...
-
全网最全Stable Diffusion原理说明!!简单明了 容易理解!!!
手把手教你入门绘图超强的AI绘画程序Stable Diffusion,用户只需要输入一段图片的文字描述,即可生成精美的绘画。下面是Stable Diffusion注册和使用的方法。给大家带来了全新Stable Diffusion保姆级教程资料包(文末可获取...
-
[AIGC] Redis基础命令集详细介绍
Redis是一个强大的开源的键-值存储系统,被广泛应用于各种应用程序中。在使用Redis时,我们需要掌握一些基本的Redis命令来操作存储在其上的数据。这篇文章将向你介绍一些基本的Redis命令,让你能够更好地使用和理解Redis。 文章...
-
上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升
CLIP长文本能力被解锁,图像检索任务表现显著提升! 一些关键细节也能被捕捉到。上海交大联合上海AI实验室提出新框架Long-CLIP。 △棕色文本为区分两张图的关键细节 Long-CLIP在保持CLIP原始特征空间的基础上,在图像生成等下游任务中即插...
-
Stable Diffusion WebUI 图生图(img2img):图生图/涂鸦绘制/局部重绘/有色蒙版/上传蒙版/批量处理/反推提示词
本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。 大家好,我是水滴~~ 本篇文章我们介绍 Stable Diffusion WebUI 的图生图功能,主要包括:图生图、图生图(手绘修正)/涂鸦绘制、局部重绘、...
-
stable-diffusion.cpp 一个文件解决stable diffusion所有环境,不需要python,stable-diffusion.dll动态库C#调用Demo
stable-diffusion.cpp 一个文件解决stable-diffusion所有环境,不需要python,stable-diffusion.dll动态库C#调用Demo 目录 介绍 效果 Text To Image Image To...
-
全面综述!大模型到底微调个啥?或者说技术含量到底有多大?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 大型模型代表了多个应用领域的突破性进展,能够在各种任务中取得显著成就。然而,它们前所未有的规模带来了巨大的计算成本。这些模型通常由数十亿个参数组成,需要大量的计算资源才...
-
【Stable Diffusion初学者指南】模型指南
文章目录 微调模型 什么是微调? 人们为什么要制作Stable Diffusion模型? 模型是如何创建的? 流行的Stable Diffusion模型 Stable diffusion v1.4 Stable diffusion v1....
-
此时此刻,两个Claude智能体正在无休止对话,无人干预
现在,AI 大模型已经疯狂到这种地步了吗? 此时此刻,正有两个 Claude 模型在无休止地对话,它们在探索整个宇宙的奥妙。 项目主页介绍称,这是两个 Claude 3 Opus 模型实例之间的自动对话,它们被指示使用命令行界面的比喻(metaphor...
-
Stable Diffusion——Animate Diff一键AI图像转视频
前言 AnimateDiff 是一个实用框架,可以对文本生成图像模型进行动画处理,无需进行特定模型调整,即可为大多数现有的个性化文本转图像模型提供动画化能力。而Animatediff 已更新至 2.0 版本和3.0两个版本,相较于 1.0 版本,2.0...
-
Stable Diffusion之核心基础知识和网络结构解析
Stable Diffusion核心基础知识和网络结构解析 一. Stable Diffusion核心基础知识 1.1 Stable Diffusion模型工作流程 1. 文生图(txt2img 2. 图生图 3. 图像优化模块 1.2...
-
Python使用whisper实现语音识别(ASR)
目录 Whisper的安装 Whisper的基本使用 识别结果转简体中文 断句 Whisper的安装 Whisper是OpenAI的一个强大的语音识别库,支持离线的语音识别。在使用之前,需要先安装它的库: pip install ope...
-
llama.cpp部署多模态视觉模型到应用实践
一、安装cmake https://cmake.org/ 因为我使用是win10系统cmake版本是3.26.4,请根据自己系统选择版本。 二、下载源码 git clone https://github.com/ggerganov/llam...
-
Yuan2.0大模型,联合向量数据库和Llama-index,助力检索增强生成技术
1. 背景 在大模型爆发的时代,快速准确地从大量数据中检索出有价值的信息变得至关重要。检索增强生成(RAG)技术,结合了传统的信息检索和最新的大语言模型(LLM),不仅能够回答复杂的查询,还能在此基础上生成信息丰富的内容。 RAG技术的核心在于其能够将...
-
stable diffusion webui 搭建和初步使用
官方repo: GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI 关于stable-diffusion的介绍:Stable Diffusion|图解稳定扩散原理...
-
AI绘画 | stable-diffusion-web-ui的基本操作
前言 我们下载安装完成stable-diffusion-web-ui以后,下载对应风格的模型,就可以开始我们的绘画操作了。进行Ai绘画操作前,我们最好先弄清楚web ui界面上的参数按钮的含义。这样我们就能更轻松的绘画出我们想要stable-diffu...
-
python调用GPT-4-API/gpt3.5-api/chatGML-API/llama2-API/文心一言ERNIE-BOT-API
目录 调用GPT-4进行单轮对话 调用GPT3.5 调用llama2-70B(百度接口) 调用chatGML 调用ERNIE-BOT 4.0 关于如何开通GPT-API服务,请参考这一篇文章 目前仅使用到单轮对话,记录一下,之后拓展需...
-
AI绘画Imagen大力出奇迹生成图像
AI绘画Imagen大力出奇迹生成图像 介绍 Imagen是一个文本到图像的扩散模型,由Google大脑团队研究所开发。 Imagen通过创新的设计,摈弃了需要预训练视觉-语言模型的繁琐步骤,直接采用了T5等大规模语言模型作为文...
-
llama-index调用qwen大模型实现RAG
背景 llama-index在实现RAG方案的时候多是用的llama等英文大模型,对于国内的诸多模型案例较少,本次将使用qwen大模型实现llama-index的RAG方案。 环境配置 (1)pip包 llamaindex需要预装很多包,这里先把我...
-
Sam Altman断言:核聚变是解决AI能源需求的终极答案
整理丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 人工智能是一个能耗大户,随着各公司竞相使其变得更大、更智能、更复杂,其电力需求将进一步增加。这给一个标榜自身为强大环保工具的行业设置了一个棘手的问题:巨大的碳排放足迹。 然而,根据Op...
-
怎么调用文心一言的api接口生成一个简单的聊天机器人(python代码)
寒假在学习大模型,但也没弄出多少眉目,电脑性能还有点小问题,大模型总跑不起来,只会简单调用一下现有的大模型的接口,例如:文心一言,下面展示一下代码: import tkinter as tk import requests import json #此...
-
两分钟1200帧的长视频生成器StreamingT2V来了,代码将开源
广阔的战场,风暴兵在奔跑…… prompt:Wide shot of battlefield, stormtroopers running... 这段长达 1200 帧的 2 分钟视频来自一个文生视频(text-to-video)模型,尽管 AI 生成...
-
Github Copilot 工具,无需账号,一键激活
① 无需账号,100%认证成功!0风险,可联网可更新,,支持copilot版本升级,支持chat ② 支持windows、mac、linux系统等设备 ③一号通用,支持所有IDE(AppCode,CLion,DataGrip,GoLand,Intelli...
-
【无标题】
类组件本身无法直接使用React.forwardRef来暴露出ref引用。但是,您可以在类组件内部使用React.forwardRef来包裹类组件,从而使类组件支持ref转发。以下是一个示例代码,展示了如何在类组件内部使用React.forwardRef来...
-
CLIP-BEVFormer:显式监督BEVFormer结构,提升长尾检测性能
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 目前,在整个自动驾驶系统当中,感知模块扮演了其中至关重要的角色,行驶在道路上的自动驾驶车辆只有通过感知模块获得到准确的感知结果后,才能让自动驾驶系统中的下游规控模块做...
-
【AI绘画】没有大显存?新人上手SD1.5模型推荐
SDXL有千般好,但是大显存却绕不开。更何况很多优秀的模型目前只有SD1.5版本的,今天就来介绍一些不同领域内好用的代表性的SD1.5模型,足够新人探索一段时间喽。(相关模型去C站搜标题找或者直接文末扫马领取 目录 好看到不真实的写实风:maj...
-
stable-diffusion-webui中stability的sdv1.5和sdxl模型结构config对比
sdv1.5 v1-inference.yaml model: base_learning_rate: 1.0e-04 target: ldm.models.diffusion.ddpm.LatentDiffusion params:...
-
一文告诉你如何用 Python 操作 ChatGPT
楔子 ChatGPT 相信大家都用过,你觉得它给你的工作带来了多少帮助呢?目前我们使用 ChatGPT 的方式是通过浏览器访问 chat.openai.com,然后输入问题,就像下面这样。 图片 除了网页之外,ChatGPT 还提供了 API...
-
Amazon SageMaker + Stable Diffusion 搭建文本生成图像模型
如果我们的计算机视觉系统要真正理解视觉世界,它们不仅必须能够识别图像,而且必须能够生成图像。文本到图像的 AI 模型仅根据简单的文字输入就可以生成图像。 近两年,以ChatGPT为代表的AIGC技术崭露头角,逐渐从学术研究的象牙塔迈向工业应用的广阔天...