-
【AIGC】Diffusers:扩散模型的开发手册说明1
主要组件 最先进的扩散管道 diffusion pipelines,只需几行代码即可进行推理。 可交替使用的各种噪声调度器 noise schedulers,用于平衡生成速度和质量。 预训练模型 models,可作为构建模块,并与调度程序结合使用,来...
-
huggingface学习|用dreambooth和lora对stable diffusion模型进行微调
目录 用dreambooth对stable-diffusion-v1-5模型进行微调 (一)模型下载和环境配置 (二)数据集准备 (三)模型微调 (四)运行微调后的模型 用lora对stable-diffusion-v1-5模型进行微调...
-
Mac本地部署大模型体验AIGC能力
介绍 随着ChatGPT的横空出世,国内互联网大厂、创业公司纷纷加了AIGC赛道,不断推出各种大模型,而这些大模型由于规模庞大、结构复杂,往往包含了数十亿至数千亿的参数。这些模型在训练阶段,一般需要使用高效能的GPU集群训练数十天时间,在推理阶段,一般...
-
20240202在WIN10下部署faster-whisper
20240202在WIN10下部署faster-whisper 2024/2/2 12:15 前提条件,可以通过技术手段上外网!^_ 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥ 2...
-
1024 分辨率下最快模型,字节跳动文生图开放模型 SDXL-Lightning 发布
模型|https://huggingface.co/ByteDance/SDXL-Lightning 论文|https://arxiv.org/abs/2402.13929 1、闪电般的图片生成 生成式 AI 正凭借其根据文本提示(text prom...
-
借助知识图谱和Llama-Index实现基于大模型的RAG
幻觉是在处理大型语言模型(LLMs)时常见的问题。LLMs生成流畅连贯的文本,但经常产生不准确或不一致的信息。防止LLMs中出现幻觉的一种方法是使用外部知识源,如提供事实信息的数据库或知识图谱。 矢量数据库和知识图谱使用不同的方法来存储和表示数据。矢量数...
-
英伟达NeMo框架在AI领域的综合应用与优势总结
一、NeMo 框架介绍 NVIDIA NeMo 是基于 PyTorch 和 PyTorch Lightning 的一个开源训练框架,源代码完全公开在 GitHub 上。NeMo 的主要目标是使 AI 开发者能够快速构建对话式 AI 模型并开发相关应用。...
-
大型多视角高斯模型LGM:5秒产出高质量3D物体,可试玩
为满足元宇宙中对 3D 创意工具不断增长的需求,三维内容生成(3D AIGC)最近受到相当多的关注。并且,3D 内容创作在质量和速度方面都取得了显著进展。 尽管当前的前馈式生成模型可以在几秒钟内生成 3D 对象,但它们的分辨率受到训练期间所需密集计算的限...
-
Python进行AI声音克隆的端到端指南
人工智能语音克隆是一种捕捉声音的独特特征,然后准确性复制它的技术。这种技术不仅可以让我们复制现有的声音,还可以创造全新的声音。它是一种彻底改变内容创作的工具,从个性化歌曲到自定义画外音,开辟了一个超越语言和文化障碍的创意世界。 本文的将提供利用AI语音...
-
近期关于AIGC方面的学习笔记和思路整理
LLM 对于LLM,我现在重点关注在这几个方面: 开源且可私有化部署的代码生成模型: 因为大部分软件企业对于安全都很重视,文档、数据、代码一般都会尽量避免被泄露。所以很难使用类似Copilot或者OpenAI的Bito这种需要连到互联网上的服务。如果...
-
Stable Diffusion原理详解(附代码实现)
一、前言 回顾AI绘画的历史,GAN(Generative Adversarial Nets)是比较出众的一个。GAN的出现让AI绘画成为可能,当时GAN给AI绘画提供了一种新的思路,现在回顾当时的绘画可以算是相当粗糙。 gan-results....
-
无 N卡 Stable Diffusion WebUI 安装过程记录
目录 前提 过程 准备 Git 初始化 权重文件 模型文件 文件配置(2024-02-15 12:42 更新) 运行 [notice] pip 更新 无 tb-nightly 包 无 xformers 模块 多处爆红 ERROR...
-
AIGC系列之:实时出图的SDXL Turbo模型介绍
原理介绍 StabilityAI在刚刚发布Stable Video Diffusion之后,2023年11月29日又发布了爆炸性模型:SDXL Turbo,SDXL Turbo是在SDXL 1.0的基础上采用新的蒸馏方案,让模型只需要...
-
Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试
2023年10月,我们发表了一篇关于TimeGPT的文章,TimeGPT是时间序列预测的第一个基础模型之一,具有零样本推理、异常检测和共形预测能力。 虽然TimeGPT是一个专有模型,只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了...
-
基本概念:什么是ChatGPT和AIGC?
1.背景介绍 1. 背景介绍 自2012年的AlexNet成功地赢得了ImageNet Large Scale Visual Recognition Challenge,深度学习技术开始引以为奎。随着算法的不断发展和优化,深度学习技术已经应用...
-
本地部署 Stable Diffusion(Mac 系统)
在 Mac 系统本地部署 Stable Diffusion 与在 Windows 系统下本地部署的方法本质上是差不多的。 一、安装 Homebrew Homebrew 是一个流行的 macOS (或 Linux)软件包管理器,用于自动下载、编...
-
LLMs之Llama2 70B:使用 PyTorch FSDP 微调 Llama 2 70B实现全部过程讲解之详细攻略
LLMs之Llama2 70B:使用 PyTorch FSDP 微调 Llama 2 70B实现全部过程讲解之详细攻略 目录 使用 PyTorch FSDP 微调 Llama 2 70B 引言 FSDP 工作流 使用的硬件 微调 LLa...
-
AI绘画Stable Diffusion进阶使用
本文讲解,模型底模,VAE美化模型,Lora模型,hypernetwork。 文本Stable Diffusion 简称sd欢迎关注 使用模型 C站:https://civitai.com/ huggingface:https://huggingfa...
-
Docker部署Stable-Diffusion-webui
前排提示:如果不想折腾,可直接跳到最后获取封装好的容器,一键运行 :D 前言 乘上AI生成的快车,一同看看沿途的风景。 启一个miniconda容器 docker run -itd -v 宿主机内SD项目路径:/tmp --gpus all --...
-
LLaMA 入门指南
LLaMA 入门指南 LLaMA 入门指南 LLaMA的简介 LLaMA模型的主要结构 Transformer架构 多层自注意力层 前馈神经网络 Layer Normalization和残差连接 LLaMA模型的变体 Base版本 La...
-
本地部署Stable Diffusion WebUI
官网 Stable Diffusion在线 Github上的Stable Diffusion WebUI 提醒一下:下面实例讲解是在Mac系统演示的; 一、 环境所需资源 Python Pycharm Anaconda stabl...
-
AIGC:导航网站精选
文章目录 @[toc] 简介 AIGC导航 https://www.aigc.cn 潮点AI https://aichaodian.com AI工具集 https://ai-bot.cn FuturePedia https://ww...
-
LLaMA-Factory添加adalora
感谢https://github.com/tsingcoo/LLaMA-Efficient-Tuning/commit/f3a532f56b4aa7d4200f24d93fade4b2c9042736和https://github.com/huggingf...
-
【stable diffusion】保姆级入门课程01-Stable diffusion(SD)文生图究竟是怎么一回事
目录 学前视频 0.本章素材 1.什么是文生图 2.界面介绍 2.1切换模型的地方 2.2切换VAE 2.3功能栏 2.4提示词 1.提示词的词性 2.提示词的语法 3.提示词的组成 4.提示词的权重调整 2.5参数调整栏 1....
-
win部署stable-diffusion
win部署stable-diffusion 1.环境 2.模型 3.使用 4.效果 1.环境 首先下载stable-diffusion-webui,这个包了一层ui,特别好用。 git clone https://github....
-
【AIGC】Diffusers:训练扩散模型
前言 无条件图像生成是扩散模型的一种流行应用,它生成的图像看起来像用于训练的数据集中的图像。通常,通过在特定数据集上微调预训练模型来获得最佳结果。你可以在HUB找到很多这样的模型,但如果你找不到你喜欢的模型,你可以随时训练自己的模型! 本教程将教您如何...
-
WhisperBot:整合了Mistral大型语言模型的实时语音转文本系统
项目简介 欢迎来到 WhisperBot。WhisperBot 基于 WhisperLive 和 WhisperSpeech 的功能而构建,在实时语音到文本管道之上集成了大型语言模型 Mistral (LLM 。WhisperLive 依赖于 OpenA...
-
Stable Diffusion 又是一个史诗级增强、出图效率暴增 5 倍
AI 绘画进化的速度真的真的是太快了!!最近爆火的新一代生成模型 LCM 席卷而来,可以大大的提升出图效率。 今儿我们就来一起尝尝鲜! 一 LCM 简介 LCM 全称 Latent Consistency Models(潜在一致性模型),是清华...
-
m2安装stable-diffusion报错及解决方案
背景:自己的电脑是macbookpro m2,之前装很多软件都遇到各种问题,不出意外,装这个stable-diffusion一样遇到各种问题,现在总结一下安装过程中遇到的问题。 报错一: Launching Web UI with argument...
-
【AIGC】Diffusers:加载管道、模型和调度程序
前言 拥有一种使用扩散系统进行推理的简单方法对于?扩散器至关重要。扩散系统通常由多个组件组成,例如参数化模型、分词器和调度器,它们以复杂的方式进行交互。这就是为什么我们设计了 DiffusionPipeline,将整个扩散系统的复杂性包装成一个易于使用的...
-
Llama-7b-hf和vicuna-7b-delta-v0合并成vicuna-7b-v0
最近使用pandagpt需要vicuna-7b-v0,重新过了一遍,前段时间部署了vicuna-7b-v3,还是有不少差别的,transforms和fastchat版本更新导致许多地方不匹配,出现很多错误,记录一下。 更多相关内容可见Fastchat实战...
-
stable diffusion微调总结
stable diffusion微调总结 stable diffusion 模型类别: SD SD2 SDXL SDXL LCM(潜在一致性模型) SDXL Distilled SDXL Turbo 安装accelerate 通过pip...
-
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过FunAsr,但是经过中文特殊优化的Whisper就未必...
-
这篇深入浅出贴 助你早日实现Stable diffusion自由
我也不想标题党,可它们就是好萌啊!看看下面这些你认识多少? 我是憨憨,一个不会画画的设计师。过去半年里,AI绘画曾经多次引爆公众讨论,网络上那些精致的二次元同人插画、堪比真人的AI穿搭博主、打破次元壁的赛博Coser……背后都有一个“幕后黑手” —— S...
-
【candle】(2):使用hf-mirror镜像下载TheBloke/Llama-2-7B-GGML的q4_0.bin文件,并设置HF_HOME,example模块可以识别下载的模型
1,视频演示地址 https://www.bilibili.com/video/BV1Dc41117wT/?vd_source=4b290247452adda4e56d84b659b0c8a2 【candle】(2):使用hf-mir...
-
探索 StableDiffusion:生成高质量图片学习及应用
本文主要介绍了 StableDiffusion在图片生成上的内容,然后详细说明了StableDiffusion 的主要术语和参数,并探讨了如何使用 prompt 和高级技巧(如图像修复、训练自定义模型和图像编辑)来生成高质量的图片。...
-
Stable Diffusion 【通用模型】:出图效果非常惊艳的Playground美学模型
大家好,我是程序员晓晓 之前我重点介绍过一个网站:PlaygroundAI。这是一个提供一个图像专业人士创建和编辑图像的网站,它整合了图像创建和社交网络的功能。 该网站模型提供了3个大类:Stable Diffusion V1.5、Stable Diff...
-
chatglm2-2b+sdxl1.0+langchain打造私有AIGC(一)
一、背景及目标 在ChatGPT爆火之后,我对AI技术也开始关注,一是出于好奇,而是出于危机。想必对于应用开发人员来说从“面面向对象编程”转成“面向AI编程”也是极好的。 最初的时候我也是抱着试一试的心态,开始魔法上网使用chatgpt,然后尝试调用o...
-
超详细!AI 绘画神器 Stable Diffusion 基础教程
一、AI 绘画工具的选择与运用 1. 工作场景下 AI 绘画工具的选择 目前文生图的主流 AI 绘画平台主要有三种:Midjourney、Stable Diffusion、DALL·E。如果要在实际工作场景中应用,我更推荐 Stable Diffusi...
-
AI绘画:PhotoMaker Win11本地安装记录!
昨天介绍一个叫PhotoMaker的AI绘画开源项目。挺不错的! 通过这个项目可以快速制作特定人脸的AI绘画作品,相比传统的技术效果会好很多,效率也高很多。 今天趁热打铁,本地电脑装装看,并且记录,分享一下! 本文主要面向有一定配置基...
-
Faster-Whisper 实时识别电脑语音转文本
Faster-Whisper 实时识别电脑语音转文本 前言 项目 搭建环境 安装Faster-Whisper 下载模型 编写测试代码 运行测试代码 实时转写脚本 实时转写WebSocket服务器模式 参考 前言 以前做的智能对...
-
Stable Diffusion【插件篇】:使用After Detailer实现人脸修复
大家好,我是程序员晓晓。 在使用SD绘图的时候,默认的分辨率大小是512*512,这样设置的好处是出图效率高。但是如果涉及到人全身照的时候,经常会出现一个问题:脸部崩。主要原因是在一个比较低的像素画布上,绘制一个全身图,脸部能分配到的像素不够了。我们来看...
-
在2GB DAYU200上本地部署大语言模型
实现思路和步骤 移植轻量级LLM模型推理框架InferLLM到OpenHarmony标准系统,编译出能在OpenHarmony运行的二进制产物。(InferLLM 是一个简单高效的 LLM CPU 推理框架,可以本地部署 LLM 中的量化模型) 使用O...
-
StableDiffusion入门教程
目录 介绍 模型的后缀 ckpt模型: safetensors模型 文件夹 VAE 模型在哪下载 Hugging face:<https://huggingface.co/models> 下载SD官方模型 文生图模型 标签介...
-
最简单粗暴的Stable Diffusion Webui本地部署教程!让每个人都能自己实现AI画图!
先放两张自己画的图片镇楼。 什么是Stable Diffusion Webui Stable Diffusion WebUI是 Stable Diffusion 的浏览器界面,Stable Diffusion...
-
【深度学习】SDXL tensorRT 推理,Stable Diffusion 转onnx,转TensorRT
文章目录 1 sdxl 转 diffusers 2 转onnx 3 转TensorRT 1 sdxl 转 diffusers juggernautXL_version6Rundiffusion.safetensors文件...
-
Centos7 部署 Stable Diffusion
参考:https://www.jianshu.com/p/ff81bb76158a 一、安装最新版 git yum install libcurl-devel curl-devel -y # 安装依赖库 yum -y install zlib-dev...
-
aigc修复美颜学习笔记
目录 GFPGAN进行图像人脸修复 美颜 修复畸形手势 GFPGAN进行图像人脸修复 原文:本地使用GFPGAN进行图像人脸修复_人相修复处理网页 csdn-CSDN博客 人脸修复 1.下载项目和权重文件 2.部署环境 3.下载权重文件...
-
通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5
赶在春节前,通义千问大模型(Qwen)的 1.5 版上线了。今天上午,新版本的消息引发了 AI 社区关注。 新版大模型包括六个型号尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最强版本的性能超越了 GPT 3.5、Mistral-Medi...
-
MedicalGPT:基于LLaMA-13B的中英医疗问答模型(LoRA)、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。
项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用 CSDN 平台,自主完成项目设计升级,提升自身...