-
m2安装stable-diffusion报错及解决方案
背景:自己的电脑是macbookpro m2,之前装很多软件都遇到各种问题,不出意外,装这个stable-diffusion一样遇到各种问题,现在总结一下安装过程中遇到的问题。 报错一: Launching Web UI with argument...
-
【AIGC】Diffusers:加载管道、模型和调度程序
前言 拥有一种使用扩散系统进行推理的简单方法对于🧨扩散器至关重要。扩散系统通常由多个组件组成,例如参数化模型、分词器和调度器,它们以复杂的方式进行交互。这就是为什么我们设计了 DiffusionPipeline,将整个扩散系统的复杂性包装成一个易于使用的...
-
20240131在WIN10下配置whisper
20240131在WIN10下配置whisper 2024/1/31 18:25 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥ 2、请正确安装好NVIDIA最新的545版本的驱动程序...
-
Llama-7b-hf和vicuna-7b-delta-v0合并成vicuna-7b-v0
最近使用pandagpt需要vicuna-7b-v0,重新过了一遍,前段时间部署了vicuna-7b-v3,还是有不少差别的,transforms和fastchat版本更新导致许多地方不匹配,出现很多错误,记录一下。 更多相关内容可见Fastchat实战...
-
闲谈【Stable-Diffusion WEBUI】的插件:模型工具箱:省空间利器
文章目录 (零)前言 (一)模型工具箱(Model Toolbox) (1.1)基本使用界面 (1.2)高阶使用界面 (1.3)自动修剪模型 (零)前言 本篇主要提到WEBUI的一个新插件,模型工具箱,可以修剪模型,提取...
-
stable diffusion微调总结
stable diffusion微调总结 stable diffusion 模型类别: SD SD2 SDXL SDXL LCM(潜在一致性模型) SDXL Distilled SDXL Turbo 安装accelerate 通过pip...
-
实战whisper:本地化部署通用语音识别模型
前言 Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 这里呢,我将给出我的一些代码,来帮助你尽快实现【语音转文字】的服务部署...
-
llama/llama2论文解读
llama 摘要 llama在约1.4T的token上,训练出参数量7B到65B的模型,其模型规模如下 在仅使用开源数据集的情况下,llama-13B在多数benchmarks上与GPT-3效果相当;llama-65B也与最好的模型(Chin...
-
Github Copilot 全方位上手通关指南
从上年 AI 大火开始,其实安仔就一直在使用 Github Copilot 的功能了,那时候它还是 Beta 版,可以不用钱薅羊毛,而且它帮安仔做一些重复性的代码工作很适合,可以默默地帮安仔增加摸鱼时间。 但随着最近 Github Copilot 用的...
-
本地运行LlaMA 2的简易指南
大家好,像LLaMA 2这样的新开源模型已经变得相当先进,并且可以免费使用。可以在商业上使用它们,也可以根据自己的数据进行微调,以开发专业版本。凭借其易用性,现在可以在自己的设备上本地运行它们。 本文将介绍如何下载所需的文件和LLaMA 2模型,以运行C...
-
AI绘画优秀开源项目推荐
AI绘画优秀开源项目推荐 stable-diffusion-webui:基于 Gradio 库的 Stable Diffusion 浏览器界面 InvokeAI:InvokeAI是稳定扩散模型的领先创意引擎,使专业人员、艺术家和爱好者能够使用最...
-
【candle】(2):使用hf-mirror镜像下载TheBloke/Llama-2-7B-GGML的q4_0.bin文件,并设置HF_HOME,example模块可以识别下载的模型
1,视频演示地址 https://www.bilibili.com/video/BV1Dc41117wT/?vd_source=4b290247452adda4e56d84b659b0c8a2 【candle】(2):使用hf-mir...
-
stable diffusion实践操作-SD原理
系列文章目录 本文专门开一节写SD原理相关的内容,在看之前,可以同步关注:stable diffusion实践操作 文章目录 系列文章目录 前言 一、原理说明 1.1、出图原理 1.1.1 AI画画不是和人一样,从0开始,而是一...
-
AI绘画Stable Diffusion原理之扩散模型DDPM
前言 传送门: stable diffusion:Git|论文 stable-diffusion-webui:Git Google Colab Notebook部署stable-diffusion-webui:Git kaggle...
-
Stable Diffusion 【通用模型】:出图效果非常惊艳的Playground美学模型
大家好,我是程序员晓晓 之前我重点介绍过一个网站:PlaygroundAI。这是一个提供一个图像专业人士创建和编辑图像的网站,它整合了图像创建和社交网络的功能。 该网站模型提供了3个大类:Stable Diffusion V1.5、Stable Diff...
-
20240127在ubuntu20.04.6下配置whisper
20240131在ubuntu20.04.6下配置whisper 2024/1/31 15:48 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥ 2、请正确安装好NVIDIA最新的驱动...
-
Faster-Whisper 实时识别电脑语音转文本
Faster-Whisper 实时识别电脑语音转文本 前言 项目 搭建环境 安装Faster-Whisper 下载模型 编写测试代码 运行测试代码 实时转写脚本 实时转写WebSocket服务器模式 参考 前言 以前做的智能对...
-
使用laf云开发三分钟上线你自己的Midjourney
文章尾部有demo 江湖惯例:先来一波感谢,感谢laf,让我们可以不使用魔法、免费接入Midjourney,不了解laf的请猛戳 Laf介绍 一、写这篇博客的背景 laf官方最近发布了一个活动,活动链接,新手也可以接入哦!废话不多说,赶紧点击链接报名...
-
全网最全stable diffusion模型讲解!快来!!小白必收藏!!
手把手教你入门绘图超强的AI绘画程序Stable Diffusion,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新Stable Diffusion保姆级教程资料包(文末可获取) AI模型最新展现出的图像生成能力远远超出人们的预期...
-
Stable Diffusion【插件篇】:使用After Detailer实现人脸修复
大家好,我是程序员晓晓。 在使用SD绘图的时候,默认的分辨率大小是512*512,这样设置的好处是出图效率高。但是如果涉及到人全身照的时候,经常会出现一个问题:脸部崩。主要原因是在一个比较低的像素画布上,绘制一个全身图,脸部能分配到的像素不够了。我们来看...
-
Stable Diffusion 基本原理
1 Diffusion Model的运作过程 输入一张和我们所需结果图尺寸一致的噪声图像,通过Denoise模块逐步减少noise,最终生成我们需要的效果图。 图中Denoise模块虽然是同一个,但是它会根据不同step的输入图像和代表noise严重程...
-
GitHub Copilot 的10种意想不到的使用方法
了解如何将人工智能编程助手的能力扩展到代码生成之外。 作为开发者我们知道,开发应用不仅仅是编写代码,还有一些其他相关工作要做:有提交消息要写,CLI命令要执行,还有晦涩的语法要记住。虽然你可能已经使用GitHub Copilot来支持你的编码,但你知...
-
OccNeRF:完全无需激光雷达数据监督
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人总结 近年来,3D 占据预测(3D Occupancy Prediction)任务因其独特的优势获得了学界及业界的广泛关注。3D 占据预测通过重建周围环境的 3D 结构为自...
-
【深度学习】SDXL tensorRT 推理,Stable Diffusion 转onnx,转TensorRT
文章目录 1 sdxl 转 diffusers 2 转onnx 3 转TensorRT 1 sdxl 转 diffusers juggernautXL_version6Rundiffusion.safetensors文件...
-
Centos7 部署 Stable Diffusion
参考:https://www.jianshu.com/p/ff81bb76158a 一、安装最新版 git yum install libcurl-devel curl-devel -y # 安装依赖库 yum -y install zlib-dev...
-
20240131在ubuntu20.04.6下使用whisper不同模式的比对
20240131在ubuntu20.04.6下使用whisper不同模式的比对 2024/1/31 16:07 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】 2、请正确安装好NVIDIA最新...
-
LLaVA:GPT-4V(ision) 的开源替代品
LLaVA(大型语言和视觉助理)(链接::https://llava-vl.github.io/)是一个很有前途的开源生成式人工智能模型,它复制了OpenAI GPT-4在图像转换方面的一些功能。用户可以将图像添加到LLaVA聊天对话中,允许讨论这些图像...
-
stable diffusion 使用 faceswaplab插件生成证件照
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一.生成证件照 1.1 下载好需要使用的ckpt 模型和lora 1.2 输入以下提示词 1.3 手动调整画面比例,设置每次生成的图片数 1.4 点击Fac...
-
20240126请问在ubuntu20.04.6下让GTX1080显卡让whisper工作在large模式下?
20240126请问在ubuntu20.04.6下让GTX1080显卡让whisper工作在large模式下? 2024/1/26 21:19 问GTX1080模式使用large该如何配置呢? 这个问题没有完成,可能需要使用使用显存更大的显卡了! 比如G...
-
秒速出图!体验 TensorRT 加速 Stable Diffusion 图像创作
TensorRT 如何加速 Stable Diffusion? 生成式 AI 图像内容生成技术近年来发展迅速,可以根据人类语言描述生成图片,在时尚、建筑、动漫、广告、游戏等领域有着广泛应用。 Stable Diffusion WebUI 是 Githu...
-
罕见!苹果开源图片编辑神器MGIE,要上iPhone?
拍张照片,输入文字指令,手机就开始自动修图? 这一神奇功能,来自苹果刚刚开源的图片编辑神器「MGIE」。 把背景中的人移除 在桌子上添加披萨 最近一段时间,AI 在图片编辑这一应用上取得了不小的进展。一方面,在 LLM 的基础上,多模态大模型(MLL...
-
iPhone动嘴10秒P图!UCSB苹果全华人团队发布多模态MGIE,官宣开源人人可玩
几天前,库克在苹果电话会上证实,「今年晚些时候会发布生成式AI」。 ChatGPT掀起全球热潮之后,苹果也在悄悄发力AI,曾曝出的大模型框架Ajax、AppleGPT等AI工具让业界充满了期待。 6月举办的WWDC上,这家曾霸占全球市值第一公司,将会宣布...
-
Segment Anything论文翻译,SAM模型,SAM论文,SAM论文翻译;一个用于图像分割的新任务、模型和数据集;SA-1B数据集
【论文翻译】- Segment Anything / Model / SAM论文 论文链接: https://arxiv.org/pdf/2304.02643.pdf https://ai.facebook.com/research/publica...
-
数学建模比赛中,chatgpt、文心一言如何提问更有效?
在数学建模的战场上,ChatGPT和文心一言可是我们的“神助攻”!但想让它们发挥出最大威力,提问可是个技术活。问题问得好,答案跑不了;问题问得妙,解决没烦恼! 下面我就一个实际的对话为例,带大家看看提问的技巧。 首先第一回合,先使用我教给大家的pro...
-
Stable Diffusion学习指南【模型篇】
模型作为机器学习后的结晶,可以说是对绘图画面影响最大的因素之一,一款好的模型即使不写提示词,出的图都会比绞尽脑汁编写咒语出的图更精美。但当我们兴致勃勃的下载了一堆模型后,往往会被一堆看不懂的文件后缀给乱花了眼,为什么模型要划分这么多类型、不同模型间有什么区...
-
教你用Midjourney做UI,设计们赶紧学起来!
在AI绘画的大浪潮下,很多朋友开始尝试使用Midjourney做 UI 设计,我这边就从APP活动弹窗、福袋活动弹窗、直播礼物元素、3D活动弹窗、B端运营海报这几方面来做实操演示。这篇先来说说“APP活动弹窗”的设计方法。 一. 找参考图 大家在接到设...
-
超简单,不用GPU,3步教你轻松在笔记本上部署聊天大模型 LLaMA
大家好啊,我是董董灿。 今天带大家在自己的电脑(笔记本 上部署一个类似于 chatGPT 的 AI 聊天大模型。 部署完之后,你就拥有了一个私人 AI 聊天机器人,无需联网,随时进行实时对话。 0. 简单说下背景 大模型我们都不陌生了,但是以...
-
【多模态】13、Vision-Language 模型在视觉任务中的调研
文章目录 一、简介 二、基础知识 2.1 视觉任务的训练策略 2.2 VLM 基础 2.2.1 网络结构 2.2.2 预训练目标函数 2.2.3 评估和下游任务 2.3 数据集 三、迁移学习 3.1 使用 prompt tunin...
-
AI绘画stability工具大全
Stability AI 公司的关于AI绘画工具集合,这家公司从Stable Diffusion商业出来,具有能浓厚社区文化,凡事研究AI绘画都会关注这家公司! Stability AI 的使命是让AI对所有人开放和有益。 本文基于Stable Dif...
-
【部署LLaMa到自己的Linux服务器】
部署LLaMa到自己的Linux服务器 一、官方方法(知道就好,具体操作用不上这个) 1、Llama2 项目获取 方法1:有git可以直接克隆到本地 方法2:直接下载 2、LLama2 项目部署 3、申请Llama2许可 4、下载模型权重...
-
CES 2024的亮点仅仅聚焦AI深度赋能和产业创新吗?| DALL-E 3、Stable Diffusion等20+ 图像生成模型综述
随着科技飞速发展,CES(国际消费电子展)已然成为全球科技产业的风向标,每年的CES大会都是业界瞩目的盛事。回顾2024年CES大会,不难发现其亮点纷呈,其中以人工智能的深度赋能为最引人注目之处。AI技术的深入应用成为CES大会上的一大亮点,各大厂商纷纷展...
-
Java 接入文心一格(Ai绘画)
JAVA接入文心一格 环境准备 首先进入百度云的智能创作平台百度云创作平台 先购买对应的版本,各版本的价格为: 在购买完成后,点击创建应用 创建完成后,就可以开始进行代码编写了 代码部分 鉴权 首先需要鉴权,需要通过传入上面的apik...
-
【AI绘画】stable diffusion原理解读,通俗易懂,直接喂到你嘴里!!!
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) 文章目录 一、前言(可跳过) 二、stable diffusion 1.clip 2...
-
人工智能大时代——AIGC综述
生成式AI分类 模型按照输入输出的数据类型分类,目前主要包括9类。 有趣的是,在这些已发布大模型的背后,只有六个组织(OpenAI, Google, DeepMind, Meta, runway, Nvidia)参与部署了这些最先进的模型。...
-
AIGC面经大全(持续更新)
目录 DDPM算法原理部分: DDIM算法原理部分: ⾼阶采样⽅案: 特征编码篇: Stable Diffusion篇: SDXL篇: ⼤模型微调篇: 控制模型篇: 适配器篇: DDPM算法原理部分: 简述DDP...
-
文心一言情感关怀之旅
【AGIFoundathon】文心一言情感关怀之旅,让我们一起来体验吧! 上传一张照片,用ernie-bot生成专属于你的小故事! 此项目主要使用clip_interrogator获取图片的关键信息,然后将此关键信息用百度翻译API翻译成中文后,使...
-
本地部署Stable Diffusion教程,详细教学,已安装成功,无科学上网版
前言 本篇文章参考多篇文章汇聚而成,安装遇到问题多半因为网络和环境问题,整理可供大家参考 一、Stable Diffusion是什么? Stable Diffusion是一个AI 绘图软件 (开源模型),可本地部署,可切换多种模型,且新的模型和开源库...
-
基于LLaMA Factory,单卡3小时训练专属大模型 Agent
大家好,今天给大家带来一篇 Agent 微调实战文章 Agent(智能体)是当今 LLM(大模型)应用的热门话题 [1],通过任务分解(task planning)、工具调用(tool using)和多智能体协作(multi-agent cooperat...
-
【CV】稳定扩散模型(Stable Diffusion)
🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎 📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞👍 + 收藏⭐️ + 留言📝 📣系列专栏 - 机器学习【ML】 自...
-
AIGC的狂欢,代码安全的隐患。
大家好,这里是安势信息。 小故事 【小开】与【小A】本是一对兄弟,小开年纪大小A几岁。小开是个好哥哥,早早的担负起哥哥的责任,有什么好的都给了小A,比如什么GAN算法、Stable Diffusion,CLIP模型、Transformer等等,小A...