-
深入浅出完整解析Stable Diffusion(SD)核心基础知识
2022年,Stable Diffusion模型横空出世,其成为AI行业从传统深度学习时代走向AIGC时代的标志性模型之一,并为工业界,投资界,学术界以及竞赛界都注入了新的AI想象空间,让AI再次性感。 Stable Diffusion是计算机视觉领域的...
-
Stable Diffusion学习
参考 Stable Diffusion原理详解_stable diffusion csdn-CSDN博客 Stable Diffusion是stability.ai开源的图像生成模型,可以说Stable Diffusion的发布将AI图像生成提高到了全新...
-
Stable Diffusion WebUi云端部署配置记录
一、前言 业务逻辑:服务器部署sdwebui项目,远程浏览器访问ui界面。服务器可租用AutoDL的GPU服务器 服务器:租用AutoDL的GPU服务器,Linux Stable Diffusion WebUi:作者AUTOMATIC1111,git...
-
纯文本模型训出「视觉」表征!MIT最新研究:语言模型用代码就能作画
只会「看书」的大语言模型,有现实世界的视觉感知力吗?通过对字符串之间的关系进行建模,关于视觉世界,语言模型到底能学会什么? 最近,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的研究人员对语言模型的视觉能力进行了系统的评估,从简单形状、物体...
-
GitHub copilot 的使用方法和快捷键
随着技术的不断进步,自动化工具在编程领域扮演着越来越重要的角色。GitHub Copilot 是一个 AI 编程助手,能够根据您的代码和上下文提供代码建议。本文将介绍 GitHub Copilot 的使用方法和常用快捷键,帮助您更高效地编写代码。 一、安...
-
大家都在用的AI作画Python几行代码就可实现
一、通过openai实现的作品: 要想快速实现功能,咱们先了解一下OpenAI,OpenAI是一家人工智能公司,专注于开发强化学习、机器学习、自然语言处理等技术。OpenAI的主要目标是创造一套安全的人工智能系统,以帮助人们在各行各业中利用这项技术.接...
-
轻松上手,本地运行LlaMA 2的简易指南
我们将学习一种无需设置Python或任何程序即可安装和使用LlaMA 2的简单方法。只需下载文件并在PowerShell中运行命令即可。 微信搜索关注《Python学研大本营》,加入读者群,分享更多精彩 图像由DALL·E 3生成 一...
-
stable diffusion实践操作-大模型介绍-SDXL1大模型
系列文章目录 大家移步下面链接中,里面详细介绍了stable diffusion的原理,操作等(本文只是下面系列文章的一个写作模板)。stable diffusion实践操作 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档...
-
菜鸟初进stable diffusion
不知道是不是玩novelai被boss看到了,推荐了我学stable diffusion 扩散模型 DALL E Midjourney stable diffusion latent diffusion 说是改进点在于“给输入图片压缩降低维度,...
-
diffusion model(五)stable diffusion底层原理(latent diffusion model, LDM)
LDM: 在隐空间用diffusion model合成高质量的图片! [论文地址] High-Resolution Image Synthesis with Latent Diffusion Models [github] https://githu...
-
被大V推荐的AI论文,被引量会翻倍?两位推特博主5年推文背后影响揭秘
经常在 X 平台(推特)上浏览 AI 论文的研究者应该都很熟悉两位博主:AK (@_akhaliq 和 Aran Komatsuzaki (@arankomatsuzaki 。他们每天都会精选一些论文进行展示,方便大家重点阅读。数据显示,AK 在 X...
-
重塑3D生成核心理论:VAST、港大、清华用「零」训练数据生成了3D模型
无需任何训练数据,只需对着模型描述一句话,如「一个做作业的香蕉人」: 或是「一只戴着 VR 眼镜的猫」: 就能生成符合描述的带有高质量纹理贴图的 3D 场景。不仅如此,还能对已有的 3D 模型进行精细化贴图。 这是港大与清华大学联合 3D 生成明星...
-
Windows端部署Stable Diffusion完整教程
1 环境准备 1.1 python安装 Python 3.10.6 Python3.10的安装方法(Windows10版本)_python3.10.10_ckirt的博客-CSDN博客 1.2 cuda安装 详细参见: Windows环境关于C...
-
年轻人的第一个多模态大模型:1080Ti轻松运行,已开源在线可玩
一款名为Vary-toy的“年轻人的第一个多模态大模型”来了! 模型大小不到2B,消费级显卡可训练,GTX1080ti 8G的老显卡轻松运行。 想将一份文档图片转换成Markdown格式?以往需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤...
-
CMU华人18万打造高能机器人,完爆斯坦福炒虾机器人!全自主操作,1小时学会开12种门
比斯坦福炒虾机器人还厉害的机器人来了! 最近,CMU的研究者只花费2.5万美元,就打造出一个在开放世界中可以自适应移动操作铰接对象的机器人。 论文地址:https://arxiv.org/abs/2401.14403 厉害之处就在于,它是完全自主完成操作...
-
Stable Diffusion XL总结
Stable Diffusion XL是一个二阶段的级联扩散模型,包括Base模型和Refiner模型。其中Base模型的主要工作和Stable Diffusion一致,具备文生图,图生图,图像inpainting等能力。在Base模型之后,级联了Refi...
-
十分钟读懂Stable Diffusion运行原理
AIGC 热潮正猛烈地席卷开来,可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度,特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性,也在逐渐改变一部分行业的生产模式。惊...
-
AWS Iot Device Shadows
参考连接:AWS IoT Device Shadow 服务 - AWS IoT Core (amazon.com 1、 Device shadow基本概念 设备的影子是用于存储和检索设备的当前状态信息的 JSON 文档。(存储在AWS IOT c...
-
检测路在何方?YOLOv8终极指南
本文经自动驾驶之心公众号授权转载,转载请联系出处。 YOLOv8是计算机视觉领域的最新发展,它是一种用于目标检测、实例分割和分类的最新先进模型。除了对模型架构本身的改进之外,YOLOv8通过一个用于使用YOLO模型的PIP包为开发者提供了一个新的友好界...
-
LLaMA Efficient Tuning
文章目录 LLaMA Efficient Tuning 安装 数据准备 浏览器一体化界面 单 GPU 训练 train_bash 1、预训练 pt 2、指令监督微调 sft 3、奖励模型训练 rm 4、PPO 训练 ppo 5、DPO 训练...
-
Llama 2: Open Foundation and Fine-Tuned Chat Models
文章目录 TL;DR Introduction 背景 本文方案 实现方式 预训练 预训练数据 训练细节 训练硬件支持 预训练碳足迹 微调 SFT SFT 训练细节 RLHF 人类偏好数据收集 奖励模型 迭代式微调(RLHF) 拒...
-
为Stable Diffusion web UI开发自己的插件实战
最近,Stable Diffusion AI绘画受到了广泛的关注和热捧。它的Web UI提供了了一系列强大的功能,其中特别值得一提的是对插件的支持,尤其是Controlnet插件的加持,让它的受欢迎程度不断攀升。那么,如果你有出色的创意,如何将其融入Sta...
-
Stable Diffusion训练Lora模型
以下内容参考:https://www.bilibili.com/video/BV1Qk4y1E7nv/?spm_id_from=333.337.search-card.all.click&vd_source=3969f30b089463e19db0...
-
Stable Diffusion 系列教程 - 6 Dreambooth及训练
Stable-Diffusion、Imagen等文生图大模型已经具备了强大的生成能力,假设我们的Prompt为 [Cyberpunk Style],SD或许能很快画出赛博朋克风格的一幅画。但你作为一个不知名的人,不能奢求SD在训练的时候把你自己想要的风格也...
-
stable diffusion 基础教程-图生图
界面 图生图大概有以下几个功能: 图生图 涂鸦绘制 局部绘制 局部绘制(涂鸦蒙版) 其常用的也就上面四个,接下来逐步讲解。 以图反推提示词 图生图可以根据反推提示词来获取相应图片的提示词,目前3种主流方式,如下: CLIP反...
-
记录Stable-Diffusion-Webui 在Windows11的Anaconda环境下的避坑安装
#记录工作,工作复盘 仅作记录,未尽之处请补充,谢谢! 电脑配置情况大致记录如下,请参考: MSI移动工作站,64G内存,4GB显存 一、安装前准备: 阅读文档,明确软件依赖和安装要求: 在用Anaconda环境下安装stable-diff...
-
stable diffusion代码学习笔记
前言:本文没有太多公式推理,只有一些简单的公式,以及公式和代码的对应关系。本文仅做个人学习笔记,如有理解错误的地方,请指出。 本文包含stable diffusion入门文献和不同版本的代码。 文献资源 本文学习的代码; 相关文献: D...
-
一文教会你使用AI绘画利器Stable Diffusion!这可能是CSDN最全的AI绘画使用教程,建议收藏!
大家好,我是程序员晓晓 随着 stable-diffusion 的开源,让更多人有机会直接参与到 AI 绘画的创作中,相关的教程也如雨后春笋般的出现。可是目前我看到的教程同质性较高,通常只能称作为"使用流程讲解",但是通常没有对其原理和逻辑进行深入说明。...
-
stable diffusion 人物高级提示词(一)头部篇
一、女生发型 prompt 描述 推荐用法 Long hair 长发 一定不要和 high ponytail 一同使用 Short hair 短发 - Curly hair 卷发 - Straight hair 直发 - Po...
-
使用 Transformers 为多语种语音识别任务微调 Whisper 模型
本文提供了一个使用 Hugging Face 🤗 Transformers 在任意多语种语音识别 (ASR 数据集上微调 Whisper 的分步指南。同时,我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识,并提供...
-
Stable Diffusion 学习(一)——Web UI 的安装与部署
Stable Diffusion作为一款开源的AIGC项目受到众多人的欢迎,掀起了一大波AI绘画的浪潮。通过它我们可以将我的想法变成现实,并且随时调整,也可以让AI生成不同于人类角度的照片,接下来我们将进入到StableDiffusion的学习中去,今天的...
-
Nightcafe Creator:AI绘画艺术图片生成器
【产品介绍】 NightCafe Creator是一个在线AI绘画艺术图片生成器,它可以让你在几秒钟内用人工智能的力量创造出惊人的艺术作品。无论你是想用神经风格将你的照片变成一幅杰作,还是想用文本到图像的AI从一个提示中创造出一幅艺术品...
-
NeurIPS 2023精选回顾:大模型最火,清华ToT思维树上榜
近日,作为美国前十的科技博客,Latent Space对于刚刚过去的NeurIPS 2023大会进行了精选回顾总结。 在NeurIPS会议总共接受的3586篇论文之中,除去6篇获奖论文,其他论文也同样优秀和具有潜力,甚至有可能预示着下一个AI领域的新突破...
-
AIGC:大语言模型开放平台OpenLLM简介(提供简易的模型部署体验)
文章目录 @[toc] 简介 一、安装 二、启动LLM服务器 项目链接 简介 该项目旨在为各种大语言模型(LLM)在生产环境中的部署和可观测性提供一个标准的解决方案,用最简单直接的方式把大语言模型(LLM)部署到云端或本...
-
一文读懂Stable Diffusion 论文原理+代码超详细解读
背景 Stable diffusion是一个基于Latent Diffusion Models(LDMs)实现的的文图生成(text-to-image)模型。 2022年8月,游戏设计师Jason Allen凭借AI绘画作品《太空歌剧院(Théâtre...
-
AIGC:文生图模型Stable Diffusion
1 Stable Diffusion介绍 Stable Diffusion 是由CompVis、Stability AI和LAION共同开发的一个文本转图像模型,它通过LAION-5B子集大量的 512x512 图文模型进行训练,我们只要简单的输入一段文...
-
stable diffusion webui的代码结构解析
stable-diffusion-webui源码分析(1)-Gradio - 知乎AUTOMATIC1111的webui是近期很流行的stable-diffusion应用,它集合stable-diffusion各项常用功能,还通过扩展的形式支持contro...
-
AIGC内容分享(十九):插上 AIGC 翅膀的 Kubernetes AIOps工具 - K8sGPT
目录 介绍 概述 K8sGPT 安装 配置 OpenAI 初步尝试 根因分析 更多用法 总结 介绍 因为 AIGC的巨大成功, AIOps 中引入大语言模型也引起了很多人的关注,这其中 Kubernetes 为代表的基础...
-
Stable Diffusion WebUI文生图操作界面基本参数说明!
朋友们,大家好,我是王赞,正在学习研究Stable Diffusion,致力于用最为朴素直白的语言为你介绍AI绘画的相关知识。 很多朋友在部署好Stable Diffusion后,本来想着可以愉快的玩耍了,但是点开一看,密密麻麻的选项立马又劝退了一大批人...
-
5.28 深圳活动|Jina AI 生态助力云原生场景下的 AIGC 应用开发
亚马逊云科技 Community Day 将于 5 月 28 日 在深圳南山区海德酒店 11 楼举办,Jina AI 软件工程师付杰将带来 《Jina AI 生态助力云原生场景下的 AIGC 应用开发》 的主题演讲。 Community Day 是亚马逊云...
-
RAG实战 7 - 使用llama_index实现多模态RAG
LLM之RAG实战(七)| 使用llama_index实现多模态RAG 文章目录 LLM之RAG实战(七)| 使用llama_index实现多模态RAG 一、多模态RAG 二、多模态LLM 三、多模态嵌入 四、多模态索引与检索 五、多...
-
AI4Science还是伪命题吗?两年后workshop组织者重新审视AI4Science
2021年,一群热血青年提出了要把AI4Science(AI for Science)带入机器学习顶会NeurIPS。 什么?AI4Science是一门学科吗?是不是靠着AI蹭热点?各种质疑声接踵而来。 这些质疑和不解也反映在了第一届AI4Science...
-
stable diffusion推理过程代码梳理
最近在看stable diffusion,想梳理一下代码流程,以便之后查阅 从txt2img.py开始看 1.首先是对文本进行编码 (1)调用的是 stable-diffusion/ldm/models/diffusion/ddpm.py的get...
-
Stable Diffusion系列(三):网络分类与选择
文章目录 网络分类 模型 基座模型 衍生模型 二次元模型 2.5D模型 写实风格模型 名称解读 VAE Lora 嵌入 文件放置 界面使用 网络分类 当使用SD webui绘图时,为了提升绘图质量,可以多种网络混合使用,可...
-
云服务器部署Stable Diffusion Webui从0到1总结:反复重启+循环debug
文章目录 在学校服务器部署Stable Diffusion Webui (一)准备工作 (二)环境配置 (三)git拉取项目到本地 (四)运行项目 遇到的问题: (一)使用git clone时,Failed to connect to 1...
-
用通俗易懂的方式讲解:Stable Diffusion WebUI 从零基础到入门
本文主要介绍 Stable Diffusion WebUI 的实际操作方法,涵盖prompt推导、lora模型、vae模型和controlNet应用等内容,并给出了可操作的文生图、图生图实战示例。适合对Stable Diffusion感兴趣,但又对Stab...
-
只需三步,开发文心一言应用帮你建立情感纽带!
本期文心开发者说邀请到飞桨开发者技术专家李龙老师,分享自己与文心一言之间的故事,故事从一个应用——“文心一言情感关怀之旅”开始。本期分享将从应用介绍、技术路径拆解以及如何实现功能的应用三个方面,对“文心一言情感关怀之旅”应用进行详细的讲解。作者...
-
AIGC学习手册
AIGC工作流 在经过大量实验后得出一些经验 如果没有足够的审美和设计功底来驾驭AI,那它只是一个壁纸连连看生成器。 Al未来应该会细分为很多方向,但稳定可控、可预见效果的Al才能真正的不再局限,加入工作流之中。 对参数和数据敏感的设计...
-
stable diffusion实践操作-提示词
系列文章目录 stable diffusion实践操作 stable diffusion实践操作-提示词-人物属性stable diffusion实践操作-提示词-人物服饰stable diffusion实践操作-提示词-整体环境stable dif...
-
Clipchamp官网体验入口 微软AI视频编辑神器免费使用地址
Microsoft Clipchamp是微软 365 新推出的视频编辑器,为个人创作者、企业市场营销人员、教师和学生提供了简化视频剪辑编辑任务的便捷工具。通过直观的拖拽编辑工具、定制化模板、特效和过渡效果,以及基于AI的语音转文本、自动字幕等功能,Clip...