-
AIGC文生图:stable-diffusion-webui部署及使用
1 stable-diffusion-webui介绍 Stable Diffusion Web UI 是一个基于 Stable Diffusion 的基础应用,利用 gradio 模块搭建出交互程序,可以在低代码 GUI 中立即访问 Stable Dif...
-
【stable-diffusion使用扩展+插件和模型资源(上】
文章目录 前言 一、插件推荐 1.qrcode-monster 2.sd-webui-openpose-editor 3.sd-webui-depth-lib 4.roop(换脸插件) 5.sd-webui-qrcode-toolkit(艺术...
-
AI原型“Make It Real”震惊开发者,将草图转化为可运行软件
在本周三,一款名为"tldraw"的协作白板应用发布了一项名为"Make It Real"的功能原型,引起了开发者社区的热议。该功能利用OpenAI的GPT-4V API,将用户绘制的矢量图转化为可运行的Tailwind CSS和JavaScript we...
-
AI开源项目screenshot-to-code 借助GPT-4V直接把网页截图制作成HTML网页
这是一个简单的应用程序,可将截图转换为HTML/Tailwind CSS。它利用GPT-4Vision生成代码,并使用DALL-E3生成类似的图像。用户只需上传截图,即可获得整洁的前端代码,包括HTML、Tailwind CSS和JavaScript。...
-
第三方应用接入discord midjourney
背景 目前midjourney没有对外开放api,想体验他们的服务只能在discord中进入他们的频道进行体验或者把他们的机器人拉入自己创建的服务器中Midjourney Quick Start Guide(目前免费的已经无法体验了,需要使用就订阅?,后续...
-
【AICG】关于解决配置stable-diffusion-webui时的问题:No module ‘xformers‘. Proceeding without it.
关于这个问题,在stable-diffusion-webui/venv/Scripts目录下进入terminal,输入./activate激活stable diffusion创建的虚拟环境,然后使用: pip install xformers==0.0....
-
Windows安装Stable Diffusion WebUI及问题解决记录
本文将详细介绍stable diffusion webui的下载、安装及问题解决。 StableDiffusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,尽管它也可以应用于其他任务,如内补绘制、外补绘制,以及在提...
-
faster-whisper-webui
摘要 whisper开源之后,很多相关的衍生产品也开源了,比如faster-whisper,它是一个比whisper转录更快的技术实现,转录速度是whisper的4倍,并且占用的显存更少,占用显存是whisper的1/2。而我们这次要讲的是faster...
-
AI绘画 | 一文学会Midjourney绘画,创作自己的AI作品(快速入门+参数介绍)
一、生成第一个AI图片 首先,生成将中文描述词翻译成英文 然后在输入端输入:/imagine prompt:Bravely running boy in Q version, cute head portrait 最后,稍等一会即可输出效果...
-
Stable Diffusion AI 绘画入门指南
Stable Diffusion AI 绘画入门指南 市面上用的最多的AI绘画工具是 Stable-Diffusion(SD) 和 Midjourney(Mid),SD是在本地运行的服务,开源,门槛高,但自控性极高。而Mid作为在线的服务,门槛低,效果...
-
stable diffusion ——img2img Api参数数据格式参考,插件包含ControlNet和roop换脸
{ "init_images": [ "" ], "resize_mode": 0, "denoising_strength": 1.0, "image_cfg_scale": 1.5, "m...
-
Linux Ubuntu22.04 安装stable diffusion webui(不借助科学上网的方式)
背景/简介: 服务器不能翻墙,所以有了这个指南。主要是因为从github上把sd webui拉下来之后,中间过程会从外网上下载很多模型文件、其他github上的项目,需要绕开这部分操作。模型文件没有办法还是得科学上网下载到本地,再通过ftp上传到服务器来...
-
亚马逊云科技实时 AI 编程助手 Amazon CodeWhisperer,开发快人一步!
近年来,随着 AI 技术的进步、基础设施建设的不断完善,AI 应用场景不断丰富,各类 AI 产品和工具层出不穷。其中,面向开发者的 AI 编程工具也在不断迭代,并因宣称能“帮开发者写代码”而引发关注。目前,可以为开发者提供编程建议的常用工具大致有两类:一类...
-
GitHub2023年度报告:生成式AI项目数量猛增 同比增长248%
GitHub发布的2023年度报告显示,今年度新增的65,000个生成式AI项目标志着开发趋势出现了显著变化。这一数字同比增长达到了惊人的248%,推动了GitHub总项目数的27%的年度增长。微软旗下的GitHub在其年度报告“Octoverse”中指出...
-
stable-diffusion-webui手动安装详细步骤(以及报错解决、踩坑)
文章目录 大话stable-diffusion-webui系列 AMD显卡请看这篇文章 前提 问题 环境 安装过程 升级CUDA驱动 安装CUDAToolKit 安装cuDNN 克隆项目地址 安装Pytorch 启动项目 题外话...
-
秋叶StableDiffusion-webUI安装roop插件排雷记
秋叶StableDiffusion-webUI安装roop插件排雷记 参考资料 安装步骤: 排雷记录 报错一: 报错二: 换脸失败: 按照网上视频教程,屡试不不成功,通过命令床报错逐个排查,有些思路值得整理。 参考资料 Y...
-
LLM 系列 | 21 : Code Llama实战(上篇) : 模型简介与评测
引言 小伙伴们好,我是《小窗幽记机器学习》的小编:卖热干面的小女孩。 个人CSDN首页:JasonLiu1919_面向对象的程序设计,深度学习,C++-CSDN博客 今天开始以2篇小作文介绍代码大语言模型Code Llama。上篇主要介绍Co...
-
Stable Diffusion: 利用Latent Diffusion Models实现高分辨率图像合成
原文链接: Stable Diffusion: 利用Latent Diffusion Models实现高分辨率图像合成 High-Resolution Image Synthesis with Latent Diffusion Models...
-
stable diffusion webui 安装部署(linux系统)
文中部署stable diffusion webui所使用的机器是腾讯云服务器linux系统,centos7 一 环境准备 在这里使用anaconda安装,优势就是可以方便地安装和管理软件包,同一系统上可以同时使用不同版本的 Python 和第三方软件...
-
AMD安装Stable-Diffusion步骤笔记
AMD安装Stable-Diffusion步骤2023.6.4 使用平台 安装步骤 1.安装 Python 3.10.6 2.安装 git 3.获取Stable-Diffusion 4.运行webui-user.bat 访问使用...
-
微调Whisper语音识别模型和加速推理
前言 OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目,且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务,它们能将各种语言的语音变成文本,也能将这些文本翻译成英文。本项目主要的目的是为了对W...
-
推荐10大Midjourney关键词网站,让你Ai创作如虎添翼!
为了让大家提高工作效率,本期将给大家推荐一些灵活高效Midjourney关键词网站,这样各位就可以直接参考别人的AI关键词进行创作了,听起来是不是很棒棒啊!其实当AI盛行后,网上Ai关键词网站就如雨后春笋般一样出现,近期也有在试玩了下,感觉挺不错,但是想关...
-
【微信小程序开发】小程序的事件处理和交互逻辑(最详细)
前言 在微信小程序中,事件处理和交互逻辑是开发过程中非常重要的环节,它们直接影响到用户体验和功能实现。今天为大家继续详解小程序的事件处理和交互逻辑 文章目录 前言 为什么要学习事件处理和交互逻辑? 事件处理基础 事件类型和...
-
OpenAI 上线新功能力捧 RAG,开发者真的不需要向量数据库了?
近期, OpenAI 的开发者大会迅速成为各大媒体及开发者的热议焦点,有人甚至发出疑问“向量数据库是不是失宠了?” 这并非空穴来风。的确,OpenAI 在现场频频放出大招,宣布推出 GPT-4 Turbo 模型、全新 Assistants API 和一系...
-
程序员推荐!JetBrains IDEs使用技巧与必备插件
JetBrains是耳熟能详的软件开发工具提供商,旗下的IDE集成开发环境被广泛应用于不同的开发领域。本文将向新手介绍JetBrains IDEs的基本知识和常用功能。 什么是JetBrains IDEs? JetBrains IDEs是一套面向软件开发...
-
.Net 使用OpenAI开源语音识别模型Whisper
.Net 使用OpenAI开源语音识别模型 Whisper 前言 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的 Whisper 神经网络,且它亦支持其它98种语言的自动语音辨识。 Whisper系统所提供的自动语音...
-
AI 绘画Stable Diffusion 研究(三)sd模型种类介绍及安装使用详解
本文使用工具,作者:秋葉aaaki 免责声明: 工具免费提供 无任何盈利目的 大家好,我是风雨无阻。 今天为大家带来的是 AI 绘画Stable Diffusion 研究(三)sd模型种类介绍及安装使用详解。 目前,AI 绘画Stable Diff...
-
Github学生认证 + Copilot,这一篇就够了!
Github学生认证 + Copilot,这一篇就够了! Github学生认证一遍过 + Copilot Free Trial Step1:修改个人信息 Step2:准备材料 Step3:提交材料 Step4:Check结果 Step5:Gi...
-
Stable Diffusion WebUI 集成 中文提示词插件 sd-webui-prompt-all-in-one Ubuntu22.04 rtx2060 6G
下载插件 cd /home/yeqiang/Downloads/ai/stable-diffusion-webui/extensions git clone https://github.com/Physton/sd-webui-prompt-all-i...
-
Stable Diffusion - ReV Animated v1.2.2 的 2.5D 模型与提示词
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131655644 ReV Animated v1.2.2 模型能够创建...
-
stable diffusion图片转图片(教程)
图片转图片# 一般我们有两种途径对图像进行修复:PS 和 InPaint,使用方法也十分多样。 WebUI 使用 --gradio-img2img-tool color-sketch 启动会带入一个插件对图片进行颜色涂抹(这里不是 Inpaint ...
-
被OpenAI带火的Agent如何解放人力?清华等发布ProAgent
项目地址:https://github.com/OpenBMB/ProAgent 论文地址:https://github.com/OpenBMB/ProAgent/blob/main/paper/paper.pdf 在历史的长河中,自动化是人类技术...
-
修改 Stable Diffusion 使 api 接口增加模型参数
参考:https://zhuanlan.zhihu.com/p/644545784 1、修改 modules/api/models.py 中的 StableDiffusionTxt2ImgProcessingAPI 增加模型名称 StableDiff...
-
Ubuntu18.04本地部署Stable-Diffusion-webui绘画
记录Ubuntu下安装Stable-Diffusion-webui,比较简单,以供参考。 系统:Ubuntu 18.04.4 LTS 内存:40G 显卡:32G 硬盘:500G 一、安装cuda 支持安装的cuda版本可以用nvidia-smi命令查...
-
在win10电脑上搭建python环境下的本地AI绘画工具Stable Diffusion
随着Chatgpt的横空出世,人工智能受到了前所没有的热棒,AI绘画也进入大众的视野。 Stable Diffusion是一种可以部署在本地环境上运行的人工智能绘画工具,图形运算主要用到的是显卡的GPU性能,因此最好有至少4G显存的显卡。 Stable...
-
stable-diffusion-webui安装注意事项
python使用的3.10(python-3.10.6-amd64.exe),太高的版本貌似不好使。 gfpgan、clip等包安装失败的话可以去GitHub下载包,解压后放到stable-diffusion-webui\venv\Scripts目录...
-
LLaMA微调记录
本文基于开源代码https://github.com/Lightning-AI/lit-llama/tree/main执行微调 其他参考链接: Accelerating LLaMA with Fabric: A Comprehensive Guide...
-
Stable Diffusion如何实现API切换模型
研究过Stable Diffusion接口文档的小伙伴们肯定知道,文档中并没有提供模型参数,那么如何实现api切换模型呢? 我们先来看原先的sd-webui的代码,找到模型接收请求参数的中心代码,然后自己修改源码,将这些请求参数传递到这段中心函数中去。...
-
openai开源的whisper在huggingface中使用例子(语音转文字中文)
openai开源的语音转文字支持多语言在huggingface中使用例子。 目前发现多语言模型large-v2支持中文是繁体,因此需要繁体转简体。 后续编写微调训练例子 GitHub地址: https://github.com/openai/whispe...
-
stable diffusion视频生成插件deforum安装详解,问题报错的简处理办法
最近看了网友们用stabled diffusion制作的视频,感觉很梦幻,虽然它的原理很简单,不外乎就是用stabled diffusion的图片生成功能,根据目标视频的帧或者提示词等参数,生成一张张图片帧,然后拼接成一段视频。但如果这个工...
-
如何在VS Code中运用GitHub Copilot提高编程效率
本文首发于公众号:更AI (power_ai ,欢迎关注,编程、AI干货及时送! 在Visual Studio Code中开始使用GitHub Copilot GitHub Copilot是一个AI配对编程工具。这是一个花哨的说法,称它为"第二程...
-
Windows下stable diffusion webui环境配置详细教程
官方地址: https://github.com/AUTOMATIC1111/stable-diffusion-webui 配置成功界面: python版本: 官方要求python版本3.10.6...
-
全方位深度测评AI代码助手Amazon CodeWhisperer
背景 随着互联网技术的不断发展,程序员们面临着越来越多的挑战,如代码复杂度不断提高、代码错误难以避免、团队协作效率低下等。传统的开发工具已经无法满足程序员们的需求,因此这几年基于人工智能技术的代码助手应运而生。AI代码助手的目的是通过自动化的方式帮助程...
-
Stable Diffusion-webUI ckpt模型、lora模型的区别和使用
一、常用的两种模型:ckpt和Lora分别是什么?有什么区别? 1、CKPT(CheckPoint) 经过训练的图片合集,被称作模型,也就是chekpoint,体积较大,一般真人版的单个模型的大小在7GB左右,动漫版的在2-5个G之间 早期的CKP...
-
使用stable diffusion webui时,安装gfpgan失败的解决方案(windows下的操作)
1.问题描述 初次打开stable diffusion webui时,需要安装gfpgan等github项目。但在安装gfpgan时,显示RuntimeError: Couldn't install gfpgan 2.解决方案 无法安装gfpg...
-
[AI图片生成]自己搭建StableDiffusion安装过程
前言 最近尝试玩玩AI图片生成,安装一路坑 出个一路安装成功的记录 开始 找个空间大的盘符,这玩意将来会很占空间.一个模型大约5g左右,你可能还会装很多模型 创建个目录,路径不要有中文 安装git 下载地址 详细教程 (如果有忽略 下载 Py...
-
Stable Diffusion云端部署流程与注意点
前言 在今天的大数据时代,AI绘图是企业必备的重要工具之一。而Stable Diffusion作为一款部署的AI绘图,得到了很多企业和团队的认可。在使用Stable Diffusion的过程中,云部署是一个非常重要的话题,本文将详细介绍Stable Di...
-
stable-diffusion安装教程推荐
总结:安装的时候VPN最重要,安装完成启动使用stable-diffusion关闭vpn 安装报错都是因为vpn问题,各种安装不了,报错基本上百度都有解决方法 安装看下面两基本上够了 Windows安装Stable Diffusion WebUI及...
-
私藏GitHub Copilot:让Visual Studio Code更智能!
GitHub Copilot是一款由GitHub和OpenAI联合开发的人工智能代码助手,它可以帮助开发者更快速地编写代码,提高编程效率。在这篇文章中,我们将介绍如何在Visual Studio Code中使用GitHub Copilot,并且向它提出问...
-
解锁 PaddleOCR 的超能力
光学字符识别(OCR)是一项强大的技术,使机器能够从图像或扫描文档中识别和提取文本。OCR 在各个领域都有应用,包括文件数字化、从图像中提取文本以及基于文本的数据分析。在本文中,我们将探讨如何使用 PaddleOCR,一款基于深度学习的先进OCR工具包,...