-
Stable Diffusion WebUI 各操作系统安装教程
最近几天在 2 台 Mac、2 台 PC、一台云无 GPU 的 Linux 安装了 Stable Diffusion WebUI,这里记录下如何安装,以及一些注意点和坑。 以下内容针对 Windows(N 卡)、MacOS(m 系列芯片)、Linux(U...
-
Stable Diffusion Web-UI 安装指南
Stable DIffusion 是 Stability.AI 开源的 text-to-image 模型,目前类似产品有 Midjourney 以及 OpenAI 的 DELL-2 ;从AI绘画效果上来说,Midjourney 目前公认是最好的;但从模型的...
-
【whisper】在python中调用whisper提取字幕或翻译字幕到文本
最近在做视频处理相关的业务。其中有需要将视频提取字幕的需求,在我们实现过程中分为两步:先将音频分离,然后就用到了whisper来进行语音识别或者翻译。本文将详细介绍一下whisper的基本使用以及在python中调用whisper的两种方式。 一、...
-
Stable Diffusion 无损放大图像和缩小图像
Stable Diffusion默认生成的图片尺寸为512×512,这种尺寸的分辨率可能无法满足高质量的要求。若想生成大图,存在两种可选的方法,在显卡足够支撑的情况下可以将图像当打到8K。 文章目录 hires.fix高分辨率修复 e...
-
diffusers库中stable Diffusion模块的解析
diffusers库中stable Diffusion模块的解析 diffusers中,stable Diffusion v1.5主要由以下几个部分组成 Out[3]: dict_keys(['vae', 'text_encoder', 'token...
-
AWS CodeWhisperer产品初体验
CodeWhisperer 简介 CodeWhisperer 是亚⻢逊出品的一款基于机器学习的通用代码生成器,可实时提供代码建议。 在编写代码时,它会自动根据我们现有的代码和注释生成建议。 从单行代码建议到完整的函数,它可为我们提供各种大小和范围的个性...
-
Stable Diffusion 丝滑无闪烁AI动画 Temporalkit+Ebsynth+Controlnet
早期的EbSynth制作的AI视频闪烁能闪瞎人的双眼,可以通过【temporalkit+ebsynth+controlnet】让视频变得丝滑不闪烁。 文章目录 插件准备 丝滑视频制作 插件准备 下载安装 EbSynth...
-
安装stable-diffusion-webui时一直卡在Installling gfpgan的界面
前言 出现这个问题的原因是,安装gfpgan涉及到国外的仓库,就算科学上网以后,在终端里面还是访问不到这个国外仓库,解决办法就只有手动安装,遇到一些pip安装不了的包都可以尝试去github上找到对应的包仓库进行手动安装。 解决办法:手动安装gfpg...
-
Stable Diffusion - 常用的负向提示 Embeddings 解析与 坐姿 (Sitting) 提示词
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132145248 负向 Embeddings 是用于提高 Stable...
-
QQGC?揭秘QQ的AI绘画大模型技术
?腾小云导读 2022年来,AIGC概念迅速出圈并快速形成产业生态,成为继PGC、UGC之后新的数字内容创作形式。QQ影像中心提出了自研的AI画画技术方案——QQGC,本文将介绍在QQGC基础大模型训练中的实践和探索,接着往下看吧~...
-
GitHub Copilot 快速入门
GitHub Copilot 是 AI 结对程序员。 可以使用 GitHub Copilot 在编辑器中获取整行或整个函数的建议。 1. 简介 让我们首先了解一些关于 GitHub Copilot 的内容。 这是 GitHub 和 OpenAI 的合作...
-
安装stable-diffusion时gfpgan安装失败
错误代码如下: Installing gfpgan Traceback (most recent call last : File "launch.py", line 380, in <module> prepare_enviro...
-
【城南】如何识别AI生成图?视觉AIGC伪造检测技术综述
图片无法加载可参考阅读:知乎文章 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ry2Qw8uO-1685675351028 (https://r3mu87a8e6.feishu.cn/space/api/box/stre...
-
stable diffusion安装问题求教!
最后的webui-user.bat执行的过程真的是痛苦而漫长,网上什么破教程,问题一个接一个,解决一个就跳出另一个! 现在卡在这里了! 求教!如何解决。 Traceback (most recent call last : File "D:\SD...
-
Redis内存空间预估与内存优化策略:保障数据安全与性能的架构实践AIGC/AI绘画/chatGPT/SD/MJ
推荐阅读 AI文本 OCR识别最佳实践 AI Gamma一键生成PPT工具直达链接 玩转cloud Studio 在线编码神器 玩转 GPU AI绘画、AI讲话、翻译,GPU点亮AI想象空间 资源分享 「java、pytho...
-
C#使用whisper.net实现语音识别(语音转文本)
目录 介绍 效果 输出信息 项目 代码 下载 介绍 github地址:https://github.com/sandrohanea/whisper.net Whisper.net. Speech to text made simpl...
-
【Kaggle】Stable Diffusion 竞赛(2023 年 5 月 11 日版本,准确率 0.59 + )
一、第一部分讲解 !mkdir -p /kaggle/images/ from PIL import Image from pathlib import Path images = list(Path('/kaggle/input/stable-di...
-
DALLE2论文解读及实现(一)
DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents paper: https://cdn.openai.com/papers/dall-e-2.pdf githu...
-
AI绘画|免费开源!一键部署的AI绘画工具Fooocus
一、项目介绍 (一 Fooocus:探索创意的图像生成软件。 该项目发布仅仅一周便在Github上收获了超过6k的star!! 其爆火的背后和Fooocus的三个特点分不开: 发扬了Stable Diffusion的开源精神...
-
Llama 及 中文Alpaca模型部署测试
环境: Xeon E5-2680v4 16C 40G RAM WinServer 2019 Standard Edition Python 3.10 依赖库: accelerate==0.18.0 anyio==3.5.0 argon2-c...
-
stable diffusion 运行时报错: returned non-zero exit status 1.
运行sh run.sh安装stable diffusion时报错:ImportError: cannot import name 'builder' from 'google.protobuf.internal' (stable-diffusion-web...
-
LLaMA-Factory可视化界面微调chatglm2;LoRA训练微调模型 简单案例
参考:https://github.com/huggingface/peft https://github.com/hiyouga/LLaMA-Factory 1、LLaMA-Factory可视化界面微调chatglm2 类似工具还有流萤,注意是做中...
-
AI(二):初体验(Cursor、Copilot、Bito、Notion、ChatExcel、Gamma、Tome、ChatPDF、AI-Video、SD、ChatGPTAPI、Midjourney)
Cursor Cursor官网下载:https://www.cursor.so/ && https://github.com/getcursor/cursor Cursor.so是一款基于GPT的代码生成工具,它可以帮助开发者快速生成...
-
【多模态】3、CLIP | OpenAI 出品使用 4 亿样本训练的图文匹配模型
文章目录 一、背景 二、方法 2.1 使用自然语言来监督训练 2.2 建立一个超大数据集 2.3 选择预训练的方式——对比学习而非预测学习 2.4 模型缩放和选择 三、效果 四、思考 论文:Learning Transferabl...
-
LLMLingua:集成LlamaIndex,对提示进行压缩,提供大语言模型的高效推理
大型语言模型(llm 的出现刺激了多个领域的创新。但是在思维链(CoT 提示和情境学习(ICL 等策略的驱动下,提示的复杂性不断增加,这给计算带来了挑战。这些冗长的提示需要大量的资源来进行推理,因此需要高效的解决方案,本文将介绍LLMLingua与专有的...
-
使用stable diffusion生成图片
准备 硬件:有GPU的主机,显存6G+ 系统:windows10 或者 ubuntu 20.04 软件: anaconda 1.下载安装anaconda wget https://repo.anaconda.com/a...
-
〔002〕Stable Diffusion 之 简单汉化和双语汉化 篇
✨ 目录 ▷ 汉化预览 ▷ 下载插件方法一 ▷ 下载插件方法二 ▷ 下载插件方法三 ▷ 简单汉化 ▷ 双语汉化 ▷ 汉化预览 在上一篇文章中,我们安装好了 Stable Diffusion 开源 AI 绘画工具 但是整...
-
Midjourney 生成油画技巧
基本 prompt oil painting, a cute corgi dog surrounded with colorful flowers 技法 Pointillism 点描绘法 笔刷比较细,图像更精细 oil paintin...
-
StableDiffusion实用插件推荐- Image Browsing介绍
插件介绍 ImageBrower不仅是一个图像浏览器,也是一个强大的图像管理器。精确的图像搜索与多选择操作相结合,大大提高了效率。支持独立运行,无需sd - web。 上面是这款插件的官方的介绍,我主要还是使用他的图片管理功能,感觉非常方...
-
(三)SadTalker 让stable diffusion 人物可以说话
功能说明 github 项目SadTalker 可以根据一张图片、一段音频,合成面部说这段语音的视频。图片需要真人或者接近真人。目前项目已经支持stable diffusion webui,可以SD出图后,结合一段音频合成面部说话的视频(抖音常见的数字...
-
openai的whisper语音识别介绍
openAI发布了chatgpt,光环一时无两。但是openAI不止有这一个项目,它的其他项目也非常值得我们去研究学习。 今天说说这个whisper项目 https://github.com/openai/whisper ta是关于语音识别的。它提出了...
-
Stable-Diffusion-WebUI从代码下载到使用技巧
一、写在前面 本文用于对AI绘画感兴趣但无计算机编程基础的人,包含本人安装和使用过程中的心得,可供新学者参考。 心理准备: 电脑性能越高越好,最好有高端显卡,如30系以上。低端显卡也可以,速度和质量感人就是; 会要求下载一些软件、模型,涉及环境变...
-
Stable Diffusion 用2D图片制作3D动态壁纸
如果想让我们的2D图片动起来可以使用stable-diffusion-webui-depthmap-script插件在SD中进行加工让图片动起来。 这是一个可以从单个图像创建深度图,现在也可以生成3D立体图像对的插件,无论是并排还是浮雕。生成的结果可在3...
-
OpenAI宫斗剧引出神秘项目Q*
Q* “出局-跳槽-返岗”,5天之后,Sam Altman最终重新拿回CEO一职,与力挺他的原董事会主席Greg Brockman一同回到了OpenAI。 当人们以为这家AI巨头上演的宫斗剧彻底落下帷幕时,路透社甩出一个大瓜:在Altman被罢免之前,Op...
-
在GPU云服务器中部署Stable Diffusion web UI
在GPU云服务器中部署Stable Diffusion web UI 1. 前言 2. 关于云服务器的选择 3. 关于机器的选择 4. 部署Stable Diffusion Python和CUDA 检查pip源 下载Stable Diffus...
-
OpenAI开源语音识别模型Whisper在Windows系统的安装详细过程
文章目录 1、安装Python 2、安装FFmpeg 2.1、配置环境变量 3、安装显卡驱动 3.1、安装CUDA 4、安装PyTorch 5、安装whisper 6、whisper的使用 7、总结 8、源码下载 9、视频教程 1、...
-
炸裂!本地部署,轻松切换多个 AI 模型
周末一直在耍 AI 本地部署个人知识库,基本都是基于 OpenAI 的开放接口进行封装,亦或者你本地部署自己部署一个小模型。 感觉这两个要求对小白玩家都太高了,一个要求有科学上网能力,一个要求你电脑带高端显卡能够本地部署。 今天给大家带来一个炸裂产品gp...
-
Stable Diffusion + EbSynth + ControlNet 解决生成视频闪烁
一、安装 1.1、安装ffmpeg 下载地址: 解压,配置环境变量 E:\AI\ffmpeg\bin 检查是否安装成功 1.2、安装SD的 EbSynth 插件 插件地址 https://github.com/s9roll7/ebsynth_...
-
midjourney ai与ChatGPT结合使用,大大提升返回结果准确率
最近在试用midjourney ai绘图,结合ChatGPT给到更多的特征来说明 如果只是单纯的提问,可能返回杂乱的图片. 提问时要把相关特征,风格,物件都要说清楚,ai才能识别得到,放几张体验照: 生成结束后将会出现两排按钮。 U是upscale的缩写,...
-
谷歌Colab云端部署Stable Diffusion 进行绘图
系列文章目录 本地部署Stable Diffusion教程,亲测可以安装成功 Stable Diffusion界面参数及模型使用 文章目录 系列文章目录 前言 一、Colab是什么? 二、操作步骤 1.找到对应的脚本 2.在谷歌...
-
Open Vocabulary Detection 开放世界目标检测竞赛 2023获胜团队方案分享
OVD技术简介 目标检测是计算机视觉领域中的一项核心任务,其主要目标是让计算机能够自动识别图片中目标的类别,并准确标示每个目标的位置。目前,主流的目标检测方法主要针对闭集目标的开发,即在任务开始之前需要对待检测目标进行类别定义,并进行人工数据标注,通...
-
Copilot插件安装及IDEA配置
白嫖也可以但是前提要进行了学生认证,否则要花钱 认证方法在这 没有认证的购买方法 打开GitHub Copilot 网址:GitHub Copilot · Your AI pair programmer 直接在这登录账号购买即可 教程在这Copi...
-
pycharm连接GitHub copilot提示错误:...request id: 3, error code: -32603(请求id:3,错误代码:-32603)
检查网络,输入www.github.com看是否能接着成功 记得copilot插件要升级到最新 重启IDE 也有可能是其他问题 修改host文件 检查copilot是否授权allow 参考博客 webstrom连接GitHub copi...
-
LLMs之Code:大语言模型纵向赋能场景—垂直行业场景应用之大模型代码场景的简介、主流LLMs(SQLCoder/Code Llama/Ziya-Coding/CodeShell等)及其评估
LLMs之Code:大语言模型纵向赋能场景—垂直行业场景应用之大模型代码场景的简介、主流LLMs(SQLCoder/Code Llama/Ziya-Coding/CodeShell等 及其评估基准(包括数据集 、案例应用之详细攻略 目录 大模...
-
本地免费GPT4?Llama 2开源大模型,一键部署且无需硬件要求教程
目前扎克布格带来了最新的Llama 2开源NLP大模型,目前有三个版本分别是70亿参数量,130亿参数量和700亿参数量,庞大的数据集和参数量保证了模型的强大,官网宣称性能与gpt4相比不落下风,又因为开源使得我们可以实现本地化gpt4的梦...
-
stable diffusion实践操作-宽高设置以及高清修复
系列文章目录 stable diffusion实践操作 文章目录 系列文章目录 前言 一、SD宽高怎么设置? 1.1 宽高历史 二、高清修复 1. 文生图中的高清修复 1.按钮Hires.fix 2.不同放大算法对比 1.第一...
-
微调stable diffusion哪个部分才是最有效的?
Diffusion Models专栏文章汇总:入门与实战 前言:最近一直在做stable diffusion微调方面的研究, 因为stable diffusion模型非常大,一个非常关键的问题是微调哪个部分才是最有效的?是微调unet吗?是微...
-
使用 LoRA 技术对 LLaMA 65B 大模型进行微调及推理
前几天,Meta 发布了 LIMA 大模型,在LLaMA-65B的基础上,无需使用 RLHF,只用了 1000 个精心准备的样本数据进行微调,就达到了和 GPT-4 相媲美的程度。这激发了我探索 LLaMA 65B 大模型的兴趣。 之前的一系列大模型相...
-
【Stable-Diffusion-WebUI】Windows系统安装Stable-Diffusion-WebUI
写在前面 基于 stable-diffusion 封装的 webui 开源项目,通过界面交互的方式来使用 stable-diffusion,降低了使用门槛,可以通过本地部署的方式进行访问,对电脑的配置要求较高,以下配置要求仅供参考 GPU显卡:最好6...
-
Stable Diffusion入门修炼手册
简介 作为新入门的新手,通常安装完Stable Diffusion之后,一打开界面,在文生图输入girl或者dog,结果出来的画面比较糟糕,看起来像素很低,画面不清晰,人物也不怎么美,等等其他问题,总之就觉得自己生成的图片怎么跟别人差距那么大?是不是大...