-
【CVHub】《万字长文带你解读AIGC》系列之入门篇
本文来源“CVHub”公众号,侵权删,干货满满。 作者丨派派星 来源丨CVHub 原文链接:《万字长文带你解读AIGC》系列之入门篇 0. 导读 图0 随着ChatGPT的病毒式传播,生成式人工智能(AIGC, a.k.a AI-gener...
-
Stable Diffusion2.0实验室Linux服务器详细运行教程
最近在学习ai共创,在官方网站dreamstdio玩了几次发现需要收费,于是决定部署一个在服务器上。将部署的过程和遇到的问题记录下来供大家参考。 目录 1. 工具准备 2. 下载代码和模型 3. 环境准备 4. 运行代码 1....
-
Ubuntu20.4 docker运行stable diffusion webui
环境前提 系统环境ubuntu20.04 uname -a nvida cuda显卡驱动默认已经安装成功 nvidia-smi 安装配置docker upgrade系统 更新系统依赖: apt-get upgrade 卸...
-
AIGC绘画:kaggle部署stable diffusion项目绘画
文章目录 kaggle介绍 项目部署 edit my copy 链接显示 结果展示 kaggle介绍 Kaggle成立于2010年,是一个进行数据发掘和预测竞赛的在线平台。从公司的角度来讲,可以提供一些数据,进而提出一个实际需...
-
Stable Diffusion爬坑
1.proxy url had no scheme, should start with http:// or https:// traceback (most recent call last : file "d:\myprojects\stab...
-
LLaMA-7B微调记录
Alpaca(https://github.com/tatsu-lab/stanford_alpaca)在70亿参数的LLaMA-7B上进行微调,通过52k指令数据(https://github.com/tatsu-lab/stanford_alpaca/...
-
大语言模型量化方法对比:GPTQ、GGUF、AWQ
在过去的一年里,大型语言模型(llm 有了飞速的发展,在本文中,我们将探讨几种(量化 的方式,除此以外,还会介绍分片及不同的保存和压缩策略。 说明:每次加载LLM示例后,建议清除缓存,以防止出现OutOfMemory错误。 del model, tok...
-
【NLP】Llama & Alpaca大模型
?大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流? ?个人主页-Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】 自然语言...
-
java调用文心一言API的方法
话不多说,直接上干货: 一、首先去官网注册一个账号百度智能云-登录 (baidu.com ,注册完成后等待审核,审核后就可以去控制台操作啦! 二、根据官网介绍,由于文心一言属于收费产品(也有免费的,但功能限制),因此建议可以充值几块钱,足以做实验用了。...
-
使用Google Colab免费部署属于自己的Stable Diffusion模型在线服务
I. 介绍 Stable Diffusion模型(稳定扩散模型) 是一种用于生成式建模的深度学习模型,它使用随机微分方程(SDE)来建模连续时间的动态过程。在图像、声音、文本等各种领域都有广泛的应用。与传统的生成式模型相比,Stable Diffusi...
-
微软深夜连甩三大炸弹!Bing Chat更名Copilot,自研芯片问世,还加入GPTs功能
就在刚刚,微软正式对外重磅宣布?: 从今天起,Bing Chat全线更名——Copilot。 图片 和ChatGPT一样,现在的微软Copilot也拥有自己的专属网站。 但与之不同的是,像GPT-4、DALL·E 3这样的功能,在Copilot上统统都是...
-
AIGC专栏3——Stable Diffusion结构解析-以图像生成图像(图生图,img2img)为例
AIGC专栏3——Stable Diffusion结构解析-以图像生成图像(图生图,img2img)为例 学习前言 源码下载地址 网络构建 一、什么是Stable Diffusion(SD) 二、Stable Diffusion的组成 三、i...
-
微软发布两款定制AI芯片,对标英伟达和英特尔相关产品
微软日前在西雅图举办的Ignite大会上发布了两款AI芯片。第一款是Maia 100 AI芯片,可以与英伟达备受追捧的AI GPU进行竞争;第二款是Cobalt 100 Arm芯片,用于一般计算任务,将与英特尔处理器进行竞争。 微软副总裁Rani B...
-
昇腾CANN 7.0 黑科技:大模型推理部署技术解密
本文分享自华为云社区《昇腾CANN 7.0 黑科技:大模型推理部署技术解密》,作者:昇腾CANN。 近期,随着生成式AI、大模型进入公众视野,越来越多的人意识到抓住AI的爆发就是抓住未来智能化变革的契机。AI基础设施如何快速部署使用,以及如何提升推理性能...
-
【大模型系列 06】LLaMA-7B/13B for PyTorch 昇腾迁移
源码链接 https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/PyTorch/built-in/foundation/LLaMA-13B LLaMA-7B/13B for PyTorch...
-
Whisper JAX 语音识别本地部署
https://nlpcloud.com/zh/how-to-install-and-deploy-whisper-the-best-open-source-alternative-to-google-speech-to-text.html whispe...
-
到底什么是算力?
算力的字面意思,大家都懂,就是计算能力(Computing Power)。 所谓“计算”,我们可以有多种定义。 狭义的定义,是对数学问题进行运算的过程,例如完成“1+1=?”的过程,或者对“哥德巴赫猜想”进行推理的过程。 广义的定义,则更为宏观,凡是对信...
-
stable-diffusion-webui手动安装详细步骤(以及报错解决、踩坑)
文章目录 大话stable-diffusion-webui系列 AMD显卡请看这篇文章 前提 问题 环境 安装过程 升级CUDA驱动 安装CUDAToolKit 安装cuDNN 克隆项目地址 安装Pytorch 启动项目 题外话...
-
Whisper.cpp 编译使用
Whisper.cpp 编译使用 whisper.cpp 是牛人 ggerganov 对 openai 的 whisper 语音识别模型用 C++ 重新实现的项目,开源在 github 上,具有轻量、性能高,实用性强等特点。这篇文章主要记录在 wind...
-
足够惊艳,使用Alpaca-Lora基于LLaMA(7B)二十分钟完成微调,效果比肩斯坦福羊驼
之前尝试了从0到1复现斯坦福羊驼(Stanford Alpaca 7B),Stanford Alpaca 是在 LLaMA 整个模型上微调,即对预训练模型中的所有参数都进行微调(full fine-tuning)。但该方法对于硬件成本要求仍然偏高且训练低效...
-
微调Whisper语音识别模型和加速推理
前言 OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目,且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务,它们能将各种语言的语音变成文本,也能将这些文本翻译成英文。本项目主要的目的是为了对W...
-
OpenAI 上线新功能力捧 RAG,开发者真的不需要向量数据库了?
近期, OpenAI 的开发者大会迅速成为各大媒体及开发者的热议焦点,有人甚至发出疑问“向量数据库是不是失宠了?” 这并非空穴来风。的确,OpenAI 在现场频频放出大招,宣布推出 GPT-4 Turbo 模型、全新 Assistants API 和一系...
-
AI 绘画Stable Diffusion 研究(三)sd模型种类介绍及安装使用详解
本文使用工具,作者:秋葉aaaki 免责声明: 工具免费提供 无任何盈利目的 大家好,我是风雨无阻。 今天为大家带来的是 AI 绘画Stable Diffusion 研究(三)sd模型种类介绍及安装使用详解。 目前,AI 绘画Stable Diff...
-
解决 TypeError: save_pil_to_file(stable diffusion使用sadtalker 插件)
解决 TypeError: save_pil_to_file( 在使用Stable Diffusion时,您可能会遇到使用SadTalker插件时出现的报错问题。其中,常见的报错是TypeError: save_pil_to_file( got a...
-
ImageBind与Stable diffusion使用记录
参考代码 ImageBind:GitHub - facebookresearch/ImageBind: ImageBind One Embedding Space to Bind Them All ImageBind + stable-diffusio...
-
LLaMA微调记录
本文基于开源代码https://github.com/Lightning-AI/lit-llama/tree/main执行微调 其他参考链接: Accelerating LLaMA with Fabric: A Comprehensive Guide...
-
私人定制AI绘画——快速finetune stable diffusion教程
最近AI绘图非常火,只需要输入文本就能得到令人惊艳的图。 举个例子,输入 “photo of a gorgeous young woman in the style of stefan kostic and david la chapelle, coy,...
-
UNC斯坦福等曝光GPT-4V意外漏洞,被人类哄骗数出8个葫芦娃!LeCun和Jim Fan震惊了
GPT-4V诞生后,惊艳的多模态能力让网友惊呼连连,连OpenAI总裁Greg Brockman都不断在X上安利。 不过,最近大家发现,只要打乱布局,GPT-4V就会被曾经解决的著名计算机视觉难题——「吉娃娃还是松饼」,再次难倒…… UCSC教授Xin...
-
如何申请文心一言&文心千帆大模型API调用资格、获取access_token,并使用SpringBoot接入文心一言API
前段时间,百度文心一言&文心千帆大模型开放了API调用的测试,接下来,教大家申请测试资格并接入文心千帆大模型的API。 一、文心一言&文心千帆的测试资格申请 1. 确保拥有一个百度智能云的账号 右上角点击注册,内容如实填写并完成实...
-
[大模型] 搭建llama主流大模型训练环境
关键词:大模型,LLAMA,CUDA,模型训练 1. 基础环境 OS: Ubuntu 18.04GPU: 4*A100(40G (单机4卡A100 40G CUDA:11.7cuDNN: 8.4.1 (需要登录官网后下载 nccl: 2.12.12...
-
详解超强ResNet变体NFNet:抛弃归一化后,性能却达到了最强!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 从上古时期一直到今天,Batch Norm (BN 一直都是视觉骨干架构里面很重要的一个环节。BN 使得研究人员可以训练更深的网络,并在训练集和测试集上实现更高的精度。Batch Norm 还可以平...
-
谷歌洽谈向人工智能初创公司 Character.AI 投资「数亿美元」
据路透社报道,Alphabet 旗下的谷歌正在与人工智能聊天机器人初创公司 Character.AI 进行谈判,计划投资数亿美元。这笔投资将加深 Character.AI 与谷歌现有的合作关系,Character.AI 目前正在使用谷歌的云服务和张量处理单...
-
谷歌正谈判向AI初创公司 Character.AI 投资数亿美元
Alphabet 旗下的谷歌正与人工智能初创公司 Character.AI 进行投资谈判,计划投资数亿美元。据消息人士透露,Character.AI 是一家快速增长的人工智能聊天机器人初创公司,目前正在寻求资金用于模型训练,以满足不断增长的用户需求。 这笔...
-
LLaMA系列 | LLaMA和LLaMA-2精简总结
文章目录 1、LLaMA 1.1、模型结构 1.2、训练方式 1.3、结论 2、LLaMA-2 2.1、相比LLaMA1的升级 2.3、模型结构 2.3.1、MHA, MQA, GQA区别与联系 2.4、训练方式 1、L...
-
解锁 PaddleOCR 的超能力
光学字符识别(OCR)是一项强大的技术,使机器能够从图像或扫描文档中识别和提取文本。OCR 在各个领域都有应用,包括文件数字化、从图像中提取文本以及基于文本的数据分析。在本文中,我们将探讨如何使用 PaddleOCR,一款基于深度学习的先进OCR工具包,...
-
基于LoRA进行Stable Diffusion的微调
文章目录 基于LoRA进行Stable Diffusion的微调 数据集 模型下载 环境配置 微调过程 推理 WebUI部署 基于LoRA进行Stable Diffusion的微调 数据集 本次微调使用的数据集为: Lam...
-
Meta 推出的 LLaMA 大语言模型部署教程
Facebo推出的LLaMA模型 简介: LLaMA(Lager Language Model From Meta),这是一个从7B到65B参数的基础语言模型的集合。它在数万亿的文本tokens上训练的模型,并表明在不求助于专有和不可访问的数据集,而仅...
-
Stable Diffusion之Scheduler模块比对生成结果
项目场景: 替换Stable Diffusion的Scheduler模块并对结果进行分析 diffusers包含多个用于扩散过程的预置scheduler function,用于接收经过训练的模型的输出,扩散过程正在迭代的样本,以及返回去噪样本的...
-
Whisper、React 和 Node 构建语音转文本 Web 应用程序
在本文中,我们将使用 OpenAI 的 Whisper 以及 React、Node.js 和 FFmpeg 构建一个语音转文本应用程序。该应用程序将获取用户输入,使用 OpenAI 的 Whisper API 将其合成为语音,并输出结果文本。Whisper...
-
大语言模型之十五-预训练和监督微调中文LLama-2
这篇博客是继《大语言模型之十二 SentencePiece扩充LLama2中文词汇》、《大语言模型之十三 LLama2中文推理》和《大语言模型之十四-PEFT的LoRA》 前面博客演示了中文词汇的扩充以及给予LoRA方法的预训练模型参数合并,并没有给出Lo...
-
Stable Diffusion WebUI使用python调用WD 1.4标签器(tagger),获取并处理标签tag权重
Stable Diffusion为秋叶大佬的绘世2.2.4 webUI api后台:http://127.0.0.1:7860/docs 数据获取结果,python代码在文章尾部 1girl: 0.9883618950843811, 98% so...
-
TPU编程竞赛|Stable Diffusion大模型巅峰对决,第五届全球校园人工智能算法精英赛正式启动!
目录 赛题介绍 赛题背景 赛题任务 赛程安排 评分机制 奖项设置 近日,2023第五届全球校园人工智能算法精英赛正式开启报名。作为赛题合作方,算丰承办了“算法专项赛”赛道,提供赛题「面向Stable Diffusi...
-
使用LoRA对大语言模型LLaMA做Fine-tune
使用LoRA对大语言模型LLaMA做Fine-tune 前言 下载 配置环境 模型的训练 Fine-tune 模型的使用 Inference 参考 问题汇总 前言 目前有大量对LLM(大语言模型)做Fine-tune的方式,不...
-
语音识别模型whisper的参数说明
一、whisper简介: Whisper是一种通用的语音识别模型。它是在各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 二、whisper的参数 1、-h, --help 查看whisper的参数...
-
NLP-分词器:SentencePiece【参考Chinese-LLaMA-Alpaca在通用中文语料上训练的20K中文词表并与原版LLaMA模型的32K词表进行合并的代码】
背景 随着ChatGPT迅速出圈,最近几个月开源的大模型也是遍地开花。目前,开源的大语言模型主要有三大类:ChatGLM衍生的大模型(wenda、ChatSQL等)、LLaMA衍生的大模型(Alpaca、Vicuna、BELLE、Phoenix、Chim...
-
AIGC实战——卷积神经网络(Convolutional Neural Network, CNN)
AIGC实战——卷积神经网络 0. 前言 1. 卷积神经网络 1.1 卷积层 1.2 叠加卷积层 1.3 检查模型 2. 批归一化 2.1 协变量漂移 2.2 使用批归一化进行训练 2.3 使用批归一化进行预测 3. Dropout 4...
-
快速训练自己的大语言模型:基于LLAMA-7B的lora指令微调
目录 1. 选用工程:lit-llama 2. 下载工程 3. 安装环境 4. 下载LLAMA-7B模型 5. 做模型转换 6. 初步测试 7. 为什么要进行指令微调? 8. 开始进行指令微调 8.1. 数据准备 8.2 开始模型训练 8.3...
-
M1芯片Mac book pro部署stable diffusion模型
使用的电脑配置: 本文中,我的实验环境是 Apple M1CPU 的 MacBook Pro,机器内存容量为 16GB。同样还能够运行本文的设备包含: 2022 年生产的MacBook Air (M2 、13寸的 MacBook Pro (M2 、M...
-
全面对比GPT-3.5与LLaMA 2微调
通用大模型虽好,但通过微调得到一个专属大模型不仅可以提高模型的可操控性、输出格式的可靠性和语气的一致性,还能让用户缩短提示长度,加速API调用,降低成本。 本文作者Sam L'Huillier对GPT-3.5与LLaMA 2的微调进行了基准...
-
Java接入文心一言
文章目录 文心一言应用创建 接口对接 接口文档 代码示例 依赖 常量类 实体类 结束语 文心一言应用创建 首先需要先申请文心千帆大模型,申请地址:文心一言 (baidu.com ,点击加入体验,等通过审核之后就可以进入文心千帆...