-
学习实践-Whisper语音识别模型实战(部署+运行)
1、Whisper内容简单介绍 OpenAI的语音识别模型Whisper,Whisper 是一个自动语音识别(ASR,Automatic Speech Recognition)系统,OpenAI 通过从网络上收集了 68 万小时的多语言(98 种语言)...
-
13个优秀开源语音识别引擎
语音识别(ASR)在人机交互方面发挥着重要的作用,可用于:转录、翻译、听写、语音合成、关键字定位、语音日记、语言增强等场景。语音识别基本过程一般包括:分析音频、音频分解、格式转换、文本匹配,但实际的语音识别系统可能会更复杂,并且可能包括其他步骤和功能组件...
-
400万token上下文、推理再加速46%!最新开源方案升级MIT成果,推理成本再降低
22倍加速还不够,再来提升46%,而且方法直接开源! 这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。 StreamingLLM可以在不牺牲生成效果、推理速度的前提下,实现多轮对话共400万个token,22.2倍推理速度提升。 该项...
-
使用LLaMA-Factory微调ChatGLM3
1、创建虚拟环境 略 2、部署LLaMA-Factory (1)下载LLaMA-Factory https://github.com/hiyouga/LLaMA-Factory (2)安装依赖 pip3 install -r requi...
-
大模型无限流式输入推理飙升46%!国产开源加速「全家桶」,打破多轮对话长度限制
在大型语言模型(LLM)的世界中,处理多轮对话一直是一个挑战。前不久麻省理工Guangxuan Xiao等人推出的StreamingLLM,能够在不牺牲推理速度和生成效果的前提下,可实现多轮对话总共400万个token的流式输入,22.2倍的推理速度提升...
-
如何在你的电脑上完成whisper的简单部署
如何在你的电脑上完成whisper的简单部署(超详细教程) 前言 一、显卡驱动、CUDA ToolKit、cuDNN的下载 1. 显卡驱动 2. CUDA ToolKit 3. cuDNN的安装 二、windows下安装conda 三、使...
-
使用PyTorch实现去噪扩散模型
在深入研究去噪扩散概率模型(DDPM 如何工作的细节之前,让我们先看看生成式人工智能的一些发展,也就是DDPM的一些基础研究。 VAE VAE 采用了编码器、概率潜在空间和解码器。在训练过程中,编码器预测每个图像的均值和方差。然后从高斯分布中对这些值进...
-
突破 Pytorch 核心点,自动求导 !!
嗨,我是小壮! 关于pytorch中的自动求导操作,介绍有关pytorch自动求导的概念. 自动求导是深度学习框架中的一项重要功能,它允许机器学习模型自动计算梯度,进而进行参数更新和优化。 PyTorch是一个流行的深度学习框架,它通过动态计算图和自动...
-
Meta最新模型LLaMA详解(含部署+论文)
来源:投稿 作者:毛华庆 编辑:学姐 前言 本课程来自深度之眼《大模型——前沿论文带读训练营》公开课,部分截图来自课程视频。 文章标题:LLaMA: Open and Efficient Foundation Language Mode...
-
【AI实战】llama.cpp量化cuBLAS编译;nvcc fatal:Value ‘native‘ is not defined for option ‘gpu-architecture‘
【AI实战】llama.cpp量化cuBLAS编译;nvcc fatal:Value 'native' is not defined for option 'gpu-architecture' llama.cpp量化介绍 llama.cpp 编...
-
使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion
使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion 0. 前言 1. Amazon SageMaker 与机器学习 1.1 机器学习流程 1.2 Amazon SageMaker 简介 1.3 Amaz...
-
Stable Diffusion实现之 Huggingface
Stable Diffusion 以及Huggingface的安装实现 介绍: Stable Diffusion AI是指将Stable Diffusion模型应用于人工智能领域的相关技术和方法。通常情况下,Stable Diffusion AI主...
-
[玩转AIGC]如何训练LLaMA2(模型训练、推理、代码讲解,并附可直接运行的kaggle连接)
目录 一、clone仓库 二、数据集下载与处理 1、数据集下载 2、数据集标记化(耗时较长) 三、修改配置 四、开始训练 五、模型推理 六、train.py训练代码讲解 1、导包 2、定义模型训练参数与相关设置 3、加载模型配置 4、迭代...
-
stable diffusion webui安装和运行中出现的bug及解决方式
webui的运行实在名为venv的虚拟环境中进行的,所以通过launch.py运行的时候,一定要先通过source venv/bin/activate激活虚拟环境venv。 1、报错:Couldn’t install gfpgan 原因: 代理的问题...
-
20分钟,使用Amazon SageMaker快速搭建属于自己的AIGC应用
真火! 作为最近一段时间人工智能领域内的顶流之一,AIGC(AI-Generated Content)早已火爆出圈,频登各大互联网平台热搜。 cite: 微软亚洲研究院官方微博 这段时间以来,基于深度学习的内容生成在图像、视频、语音、音乐、...
-
如何在亚马逊 SageMaker 进行 Stable Diffusion 模型在线服务部署
文章目录 前言 - 浅谈 AIGC AIGC - 引领人工智能走向春天 春天里盛开的 AI 绘画 AI 绘画之Stable Diffusion 2.0 登场 人人都有机会成为前沿的技术探索者 基于Amazon SageMaker进行Stab...
-
AI平台:NVIDIA Toronto AI Lab
站点网址:https://nv-tlabs.github.io...
-
精调训练中文LLaMA模型实战教程,民间羊驼模型
羊驼实战系列索引 博文1:本地部署中文LLaMA模型实战教程,民间羊驼模型博文2:本地训练中文LLaMA模型实战教程,民间羊驼模型博文3:精调训练中文LLaMA模型实战教程,民间羊驼模型(本博客) 简介 在学习完上篇【博文2:本地训练中文LLaM...
-
stable diffusion硬件要求
硬件要求# 内存# 建议使用不少于 16 GB 内存。在一些情况下,可能需要调高虚拟内存,以容纳模型文件。 存储# 建议准备 40 GB 以上的可用硬盘空间。 显卡# WARNING 注意显卡温度,有报道称显卡太热炸了。 显卡型号#...
-
Stable Diffusion AI绘画系列【23】:赛博朋克-机甲美女系列
《博主简介》 小伙伴们好,我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源,可关注公-仲-hao:【阿旭算法与机器学习】,共同学习交流~ ?感谢小伙伴们点赞、关注! 《------往期经典推荐----...
-
突破Pytorch核心,tensor !!
今天会把pytorch在张量这方面的内容做一个记录。 同时希望可以给大家提供一丢丢帮助! 因为今儿分享的内容,绝对是非常干货的一些示例。 先简单介绍下,在PyTorch中,张量是核心数据结构,它是一个多维数组,类似于NumPy中的数组。张量不仅仅是存储数...
-
突破Pytorch核心点,优化器 !!
嗨,我是小壮! 今儿咱们聊聊Pytorch中的优化器。 优化器在深度学习中的选择直接影响模型的训练效果和速度。不同的优化器适用于不同的问题,其性能的差异可能导致模型更快、更稳定地收敛,或者在某些任务上表现更好。 因此,选择合适的优化器是深度学习模型调优中...
-
pytorch快速训练ai作画模型的python代码
在 PyTorch 中训练 AI 作画模型的基本步骤如下: 准备数据集: 需要准备一个包含许多图像的数据集, 这些图像可以是手绘的或者是真实的图像. 定义模型: 选择一个适当的深度学习模型, 并使用 PyTorch 定义该模型. 例如...
-
斯坦福炒虾机器人爆火全网!华人团队成本22万元,能做满汉全席还会洗碗
今天,会做一大桌子菜的斯坦福机器人Mobile ALOHA刷屏全网。 滑蛋虾仁、干贝烧鸡、蚝油生菜,色香味俱全,看着很诱人。 就拿滑蛋虾仁这道菜来说,Mobile ALOHA在烧水的过程中先打上3颗鸡蛋,然后把虾仁放到水中焯熟,平底锅倒入鸡蛋液再加入...
-
阿里云容器服务助力万兴科技 AIGC 应用加速
2023 年堪称是 AIGC 元年,文生图领域诞生了 Stable Diffusion 项目,文生文领域诞生了 GPT 家族。一时间风起云涌,国内外许多企业投身 AIGC 创新浪潮,各大云厂商紧随其后纷纷推出自己的大语言模型。在文生图领域落地的企业更多,国...
-
[linux-sd-webui]api化之训练lora
lora的训练使用的文件是https://github.com/Akegarasu/lora-scripts lora训练是需要成对的文本图像对的,需要准备相应的训练数据。 1.训练数据准备 使用deepbooru/blip生成训练数据,建筑类建议使...
-
端到端的自动驾驶会取代Apollo、autoware这类框架吗?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 Rethinking the Open-Loop Evaluation of End-to-End Autonomous Driving in nuScenes 作者单位:百度 作者:共一 Jian...
-
人工智能利用深度学习技术增强高级驾驶辅助系统(ADAS)
译者 | 李睿 审校 | 重楼 人工智能和机器学习利用深度学习技术的优势,使高级驾驶辅助系统(ADAS 发生了重大变革。ADAS在很大程度上依赖深度学习来分析和解释从各种传感器获得的大量数据。摄像头、激光雷达(光探测和测距 、雷达和超声波传感器都是传感器...
-
基于whisper和whisperx的语音视频和字幕对齐
环境的安装 创建py310虚拟环境,需要安装Anaconda的Python环境。 Python初学者在不同系统上安装Python的保姆级指引 Win10+Python3.9+GPU版pytorch环境搭建最简流程 Python虚拟环境的安装和使用...
-
配置 Stable Diffusion WebUI 纯 CPU 或核显绘画
(如有更新,见原文:https://blog.iyatt.com/?p=12345 1 前言 我笔记本电脑的独显上半年的时候烧掉了,所以只能用 CPU,折腾了一下午总算给配置出来了。我这里用的官方 Python,网上很多教程用 Anaconda(...
-
论最近热门的AI绘画技术—从小白绘画到文创手账设计【文末送书-13】
文章目录 ?前言 ⚽AI绘图技术栈 ⚾️简单的代码实现案例 ?iPad萌系简笔画:从小白绘画到文创手账设计【文末送书-13】 ⛳粉丝福利:文末推荐与福利免费包邮送书! ?前言 AI绘画技术,也称为人工智能绘画,是指利用人工智能技术...
-
利用Lama Cleaner本地实现AIGC试玩:擦除对象、替换对象、更换风格等等
目录 一、安装 二、擦除功能 1. LaMa模型 实操实例一:去除路人 实操实例二:去水印 实操实例三:老照片修复 2. LDM模型 3. ZITS模型 4. MAT模型 5. FcF模型 6. Manga模型 三、替换对象功能 1....
-
突破Pytorch核心点,模型定义与搭建 !!
嗨,我是小壮! 咱们今儿来聊聊关于模型定义与搭建。很适合初学者! 在使用PyTorch进行深度学习时,首先需要了解的是如何定义和搭建模型。这块内容非常重要。 在PyTorch中,模型的定义通常通过创建一个继承自torch.nn.Module的类来完成。...
-
LLaMA模型论文《LLaMA: Open and Efficient Foundation Language Models》阅读笔记
文章目录 1. 简介 2.方法 2.1 预训练数据 2.2 网络架构 2.3 优化器 2.4 高效的实现 3.论文其余部分 4. 参考资料 1. 简介 LLaMA是meta在2023年2月开源的大模型,在这之后,很多开源模型都...
-
stable-diffusion-webui 安装采坑日记
这里写自定义目录标题 安装容易采坑的点 效果测试 安装容易采坑的点 1、不愿安装大佬的整合包。在自己时间足够多的情况下,可以尝试自己搭环境。但是自己安装的时间成本真的非常高,环境配置报错会让人陷入崩溃,如果没有代码排错能力,还是建...
-
神经网络中的分位数回归和分位数损失
在使用机器学习构建预测模型时,我们不只是想知道“预测值(点预测 ”,而是想知道“预测值落在某个范围内的可能性有多大(区间预测 ”。例如当需要进行需求预测时,如果只储备最可能的需求预测量,那么缺货的概率非常的大。但是如果库存处于预测的第95个百分位数(需求...
-
AI绘图模型不会写字的难题,被阿里AnyText破解了
能准确写汉字的AI绘图工具,终于登场了! 包括中文在内一共支持四种语言,而且还能文字的位置还能任意指定。 从此,人们终于可以和AI绘图模型的“鬼画符”说再见了。 这款名为AnyText的绘图工具来自阿里巴巴,可以按照指定位置精准地向图中加入文字。 此前的绘...
-
AI秒出图!StableDiffusion Automatic1111正式支持Tensorrt
秒级出图的AI绘画终于支持Automatic1111。 今天在AI绘画的开源平台Automatic1111上发布了Tensorrt项目,项目地址是 https://github.com/AUTOMATIC1111/stable-diffusion-we...
-
一个超强 Pytorch 操作!!
哈喽,我是小壮! 这几天关于深度学习的内容,已经分享了一些。 另外,类似于numpy、pandas常用数据处理函数,在Pytorch中也是同样的重要,同样的有趣!! Pytorch同样提供了许多用于数据处理和转换的函数。 今儿来看下,最重要的几个必会函数...
-
九大Pytorch最重要操作!!
今儿咱们聊聊pytorch的事情,今儿总结了九个最重要的pytorch的操作,一定会给你一个总体的概念。 张量创建和基本操作 PyTorch的张量类似于NumPy数组,但它们提供了GPU加速和自动求导的功能。张量的创建可以通过torch.tensor,...
-
4、stable diffusion
github 安装anaconda环境 conda env create -f environment.yaml conda activate ldm 安装依赖 conda install pytorch==1.12.1 torchvision=...
-
win10部署NovelAI绘画,Stable Diffusion,Chilloutmix,实现txt2img,img2img(含调参)
文章目录 1、Stable Diffusion是什么 2、深度学习环境搭建 3、Stable Diffusion环境搭建(可跳过) 4、Stable Diffusion WebUI环境搭建(主要) 5、NovelAI模型的修改与调参 6、Chi...
-
Stable Diffusion WebUI 1.4「gradio」报错解决方案
今天有很多朋友在运行 Stable Diffusion WebUI 1.4 时都遇到了「ModuleNotFoundError: No module named 'gradio'」这个报错,在这里给大家一个解决方案。(请注意这里针对的是 Google...
-
Stable diffusion环境部署搭建
1、安装Nvidia驱动、cuda版本等 略 2、安装anaconda环境 略 3、安装git #git工具的安装参考下面命令 apt-get update -y a pt-get upgrade -y apt install git 4、...
-
深度学习实战29-AIGC项目:利用GPT-2(CPU环境)进行文本续写与生成歌词任务
大家好,我是微学AI,今天给大家介绍一下深度学习实战29-AIGC项目:利用GPT-2(CPU环境 进行文本续写与生成歌词任务。在大家没有GPU算力的情况,大模型可能玩不动,推理速度慢,那么我们怎么才能跑去生成式的模型呢,我们可以试一下GPT-2完成一些简...
-
在自定义数据集上微调Alpaca和LLaMA
本文将介绍使用LoRa在本地机器上微调Alpaca和LLaMA,我们将介绍在特定数据集上对Alpaca LoRa进行微调的整个过程,本文将涵盖数据处理、模型训练和使用流行的自然语言处理库(如Transformers和hugs Face 进行评估。此外还将介...
-
一份保姆级的Stable Diffusion部署教程,开启你的炼丹之路 | 京东云技术团队
市面上有很多可以被用于AI绘画的应用,例如DALL-E、Midjourney、NovelAI等,他们的大部分都依托云端服务器运行,一部分还需要支付会员费用来购买更多出图的额度。在2022年8月,一款叫做Stable Diffusion的应用,通过算法迭代将...
-
在autodl算力云上部署Stable Diffusion
这里写自定义目录标题 如何在算力云上部署Stable Diffusion 零、基础环境 一、初始准备,用户权限的设置 1.创建非root管理员用户并改主目录为数据盘 2.删除lock锁 3.更改这两个目录权限 4.改python的用户权限...
-
秒懂AI-深度学习四种常用激活函数:Sigmoid、Tanh、ReLU和Softmax
深度学习中的激活函数是神经网络中至关重要的组成部分,它们为神经网络引入非线性特性,使其能够更好地学习和模拟复杂的输入输出关系。激活函数的选择和使用对于神经网络的性能和训练效果具有重要影响。 本文将介绍四种常用的激活函数:Sigmoid、Tanh、ReLU...
-
人脸识别技术演进:从几何算法到深度学习的深度剖析
本文全面探讨了人脸识别技术的发展历程、关键方法及其应用任务目标,深入分析了从几何特征到深度学习的技术演进。 关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实...