-
whisper实践--基于whisper+pyqt5开发的语音识别翻译生成字幕工具
大家新年快乐,事业生活蒸蒸日上,解封的第一个年,想必大家都回家过年,好好陪陪家人了吧,这篇文章也是我在老家码的,还记得上篇我带大家基本了解了whisper,相信大家对whisper是什么,怎么安装whisper,以及使用都有了一个认识,这次作为新年第一篇文...
-
Whisper
文章目录 使后感 Paper Review 个人觉得有趣的 Log Mel spectrogram & STFT Training cross-atte...
-
【whisper】在python中调用whisper提取字幕或翻译字幕到文本_python whisper
一、whisper简介 whisper 是一款用于语音识别的开源库,支持多种语言,其中包括中文。在本篇文章中,我们将介绍如何安装 whisper 以及如何使用它来识别中文字幕。 二、安装 whisper 首先,我们需要安装 whisper。根据操...
-
用通俗易懂的方式讲解:使用Llama-2、PgVector和LlamaIndex,构建大模型 RAG 全流程
近年来,大型语言模型(LLM)取得了显著的进步,然而大模型缺点之一是幻觉问题,即“一本正经的胡说八道”。其中RAG(Retrieval Augmented Generation,检索增强生成)是解决幻觉比较有效的方法。 本文,我们将深入研究使用trans...
-
【AIGC】Diffusers:训练扩散模型
前言 无条件图像生成是扩散模型的一种流行应用,它生成的图像看起来像用于训练的数据集中的图像。通常,通过在特定数据集上微调预训练模型来获得最佳结果。你可以在HUB找到很多这样的模型,但如果你找不到你喜欢的模型,你可以随时训练自己的模型! 本教程将教您如何...
-
Stable Diffusion结构解析-以图像生成图像!
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) AIGC专栏3——Stable Diffusion结构解析-以图像生成图像(图生图,img2img)为例 学习...
-
深度学习系列56:使用whisper进行语音转文字
1. openai-whisper 这应该是最快的使用方式了。安装pip install -U openai-whisper,接着安装ffmpeg,随后就可以使用了。模型清单如下: 第一种方式,使用命令行: whisper japanese.wav...
-
20240131在WIN10下配置whisper
20240131在WIN10下配置whisper 2024/1/31 18:25 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥ 2、请正确安装好NVIDIA最新的545版本的驱动程序...
-
Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based proj
安装llama-cpp-python包时,出现下述问题: Collecting llama-cpp-python Using cached llama_cpp_python-0.2.28.tar.gz (9.4 MB Installing bu...
-
【AI绘画】Stable Diffusion扩散模型 + Consistency一致性模型 小白必看!!!!!
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) 1 GAN到Stable Diffusion的改朝换代 2 从DDPM到Stable Diffusion发展史...
-
使用人工智能助手 Github Copilot 进行编程 02
本章涵盖了 在您的系统上设置 Python、VS Code 和 Copilot 引⼊ Copilot 设计流程 Copilot 的价值在于基本的数据处理任务 本章将帮助您在自己的计算机上开始使用 Copilot,并熟悉与其的交互方式。在设置好Copi...
-
从0开始用 PyTorch 构建完整的 NeRF
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在解释代码之前,首先对NeRF(神经辐射场)的原理与含义进行简单回顾。而NeRF论文中是这样解释NeRF算法流程的: “我们提出了一个当前最优的方法,应用于复杂场景下合成新视图的任务,具体的实现原理是...
-
【大麦小米学量化】使用文心一言AI编写股票量化交易策略代码(含演示代码和进阶演示)
文章目录 AI是个宝 前言 一、文心一言是什么? 二、让AI根据策略写出代码 1. 策略提示词 2. AI给出的策略代码及说明 三、进阶调试 总结 AI是个宝 小米听说百度开放了文心一言AI,好奇的跑去问大麦:“文心一...
-
AIGC智能编程:编程革新还是就业陷阱?
AIGC智能编程:程序员的失业陷阱? 引言 随着人工智能的迅猛发展,智能编程技术也越来越受到关注。AIGC智能编程是一种利用人工智能技术自动生成代码的方法,它能够极大地提高编程效率和质量。然而,这种技术的兴起也引发了人们对程序员就业前景的忧虑。本文...
-
【扩散模型】万字长文全面理解与应用Stable Diffusion
万字长文全面理解与应用Stable Diffusion 1. Stable Diffusion简介 1.1 基本概念 1.2 主体结构 1.3 训练细节 1.4 模型评测 1.5 模型应用 1.6 模型版本 1.7 其他类型的条件生成模型 1...
-
学习AIGC大模型必知的强化学习RL的核心代码示例,速进!!!
Look!👀我们的大模型商业化落地产品 📖更多AI资讯请👉🏾关注 Free三天集训营助教在线为您火热答疑👩🏼🏫 在人工智能的发展历程中,强化学习(RL)已成为推动技术突破的关键动力,尤其在自动化内容生成(AIGC)和大型语言模型(LLM)的领域中...
-
人工智能教程(七):Scikit-learn 和训练第一个模型
在本系列的 上一篇文章 中,我们用 TensorFlow 构建了第一个神经网络,然后还通过 Keras 接触了第一个数据集。我们还将介绍另一个强大的机器学习 Python 库 scikit-learn。不过在进入正题之前,我要介绍两个轰动性的人工...
-
GPT时代学算法,Pytorch框架实现线性模型
今天我们继续来实现线性回归模型,不过这一次我们不再所有功能都自己实现,而是使用Pytorch框架来完成。 整个代码会发生多大变化呢? 首先是数据生成的部分,这个部分和之前类似: import numpy as np import torch from t...
-
超简单stable diffusion安装教程,最新吐血整理
SD没有中文版并且需要翻墙,如果不会的也可以直接用国内AI绘画工具:触站AI,是国内基于SD搭建的最好用站点,对国人来说更加方便,所以本教程面向sd海外用户。 随着AI技术的不断发展,越来越多的AI绘画软件被开发出来,让绘画的过程变得更加高效和有趣。...
-
使用核模型高斯过程(KMGPs)进行数据建模
核模型高斯过程(KMGPs 作为一种复杂的工具可以处理各种数据集的复杂性。他通过核函数来扩展高斯过程的传统概念。本文将深入探讨kmgp的理论基础、实际应用以及它们所面临的挑战。 核模型高斯过程是机器学习和统计学中对传统高斯过程的一种扩展。要理解kmgp,...
-
【AIGC】从零手写一个GPT
手写一个GPT 在GPT,确切的说是Transformer,出现之前,一个问题长久地困扰着人们——如何让两句内容不同、但语义相近的句子得到较为接近的表示。 比如我们有两句话 我喜欢你 吾中意你 它们作为句子内容并不一样,但是表达的含义却...
-
利用 “diart“ 和 OpenAI 的 Whisper 简化实时转录
利用 "diart" 和 OpenAI 的 Whisper 简化实时转录 工作原理 Diart 是一个基于人工智能的 Python 库,用于实时记录说话者语言(即 "谁在什么时候说话"),它建立在 pyannote.audio 模型之上,专为实时音频流...
-
记录Stable-Diffusion-Webui 在Windows11的Anaconda环境下的避坑安装
#记录工作,工作复盘 仅作记录,未尽之处请补充,谢谢! 电脑配置情况大致记录如下,请参考: MSI移动工作站,64G内存,4GB显存 一、安装前准备: 阅读文档,明确软件依赖和安装要求: 在用Anaconda环境下安装stable-diff...
-
一文读懂Stable Diffusion 论文原理+代码超详细解读
背景 Stable diffusion是一个基于Latent Diffusion Models(LDMs)实现的的文图生成(text-to-image)模型。 2022年8月,游戏设计师Jason Allen凭借AI绘画作品《太空歌剧院(Théâtre...
-
stable diffusion webui的代码结构解析
stable-diffusion-webui源码分析(1)-Gradio - 知乎AUTOMATIC1111的webui是近期很流行的stable-diffusion应用,它集合stable-diffusion各项常用功能,还通过扩展的形式支持contro...
-
异常值检测方法比较——基于美国职业棒球联盟2023赛季击球数据
译者 | 朱先忠 审校 | 重楼 异常值检测是一种无监督的机器学习任务,用于识别给定数据集中的异常(即“异常观测”)。在大量现实世界中,当我们的可用数据集已经被异常“污染”时,异常值检测任务对于整个机器学习环节来说是非常有帮助的。当前,开源框架Sciki...
-
Stable Diffusion 硬核生存指南:WebUI 中的 VAE
本文使用「署名 4.0 国际 (CC BY 4.0 」许可协议,欢迎转载、或重新修改使用,但需要注明来源。 署名 4.0 国际 (CC BY 4.0 本文作者: 苏洋 创建时间: 2023年07月30日 统计字数: 11485字 阅读时间: 23分钟...
-
人工智能教程(六):Keras 和第一个数据集
在本系列的 上一篇文章中,我们学习了使用 Anaconda,加强了概率论的知识。在本文中我们将继续学习概率论的知识,学习使用 seaborn 和 Pandas 进行数据可视化,并进一步介绍 TensorFlow 和 Keras 的使用。 让我们从增长人...
-
LLM之RAG实战(十六)| 使用Llama-2、PgVector和LlamaIndex构建LLM Rag Pipeline
近年来,大型语言模型(LLM)取得了显著的进步,然而大模型缺点之一是幻觉问题,即“一本正经的胡说八道”。其中RAG(Retrieval Augmented Generation,检索增强生成)是解决幻觉比较有效的方法。本文,我们将深入研究使用...
-
从0到1,入门到进阶玩转AI——Stable Diffusion超详细教程(一)
前沿 目前市面上的AI主要集中在两方面,一方面是AI 作图(代表产品:Midjourney和Stable-Diffusion),一方面是AI应答(代表产品:ChatGPT),本文主要针对AI作图进行探索。 由于Midjo...
-
AIGC神器CLIP:技术详解及应用示例
编者按:上一期,我们介绍了Diffusion模型的发展历程、核心原理及其对AIGC发展的推动作用。本期,我们将共同走进另一项AI重要突破——CLIP,著名的DALLE和Stable Diffusion均采用了CLIP哦。 Nikos Kafrit...
-
爆肝整理全网最全最新AI生成算法【Stable Diffusion|Diffusion Model|DallE2|CLIP|VAE|VQGAN】原理解析
1、生成模型 首先回顾一下生成模型要解决的问题: 如上图所示,给定两组数据z和x,其中z服从已知的简单先验分布π(z (通常是高斯分布),x服从复杂的分布p(x (即训练数据代表的分布),现在我们想要找到一个变换函数f,它能建立一种z到x的映射f:z...
-
AIGC专栏2——Stable Diffusion结构解析-以文本生成图像(文生图,txt2img)为例
AIGC专栏2——Stable Diffusion结构解析-以文本生成图像(文生图,txt2img)为例 学习前言 源码下载地址 网络构建 一、什么是Stable Diffusion(SD) 二、Stable Diffusion的组成 三、生...
-
Stable Diffusion VAE
简介 Stable Diffusion在逐步去噪的过程中,按照图片的原尺寸进行运算,由于图片尺寸的太大,需要很大的计算量。sd通常是在latent space(潜在空间)运算的,相当于在压缩的图片上运算的,然后再恢复到原尺寸。VAE的encode和dec...
-
Stable Diffusion 源码解析(1)
参考1:https://blog.csdn.net/Eric_1993/article/details/129393890 参考2:https://zhuanlan.zhihu.com/p/613337342 1.StableDiff...
-
stable diffusion(1): webui的本地部署(windows)
一、前言 是的,现在是202308月份了,网上已经有很多打包好的工具,或者直接进一个web就能用SD的功能,但是我们作为程序员,就应该去躺坑,这样做也是为了能够有更多自主操作的空间。 像其他AI一样,先出结果才是王道,所以先不直接搞SD源码或者命令行,...
-
【AIGC使用教程】GitHub Copilot 免费注册及在 VS Code 中的安装使用
欢迎关注【AIGC使用教程】 专栏 【AIGC使用教程】SciSpace 论文阅读神器【AIGC使用教程】Microsoft Edge/Bing Chat 注册使用完全指南【AIGC使用教程】GitHub Copilot 免费注册及在 VS Code...
-
【openAI】Whisper如何高效语音转文字(详细教程)
文章目录 前言 一、准备 二、使用Whisper进行语音转文字 三.Whisper转换结果分析 总结 前言 语音转文字在许多不同领域都有着广泛的应用。以下是一些例子: 1.字幕制作:语音转文字可以帮助视频制作者快速制作字幕,这...
-
AIGC:使用生成对抗网络GAN实现MINST手写数字图像生成
1 生成对抗网络 生成对抗网络(Generative Adversarial Networks, GAN)是一种非常经典的生成式模型,它受到双人零和博弈的启发,让两个神经网络在相互博弈中进行学习,开创了生成式模型的新范式。从 2017 年以后,GAN相...
-
AIGC实战——像素卷积神经网络(PixelCNN)
AIGC实战——像素卷积神经网络 0. 前言 1. PixelCNN 工作原理 1.1 掩码卷积层 1.2 残差块 2. 训练 PixelCNN 3. PixelCNN 分析 4. 使用混合分布改进 PixelCNN 小结 系列链接...
-
2023年的深度学习入门指南(24) - 处理音频的大模型 OpenAI Whisper
2023年的深度学习入门指南(24 - 处理音频的大模型 OpenAI Whisper 在这一讲之前,我们所用的大模型都是针对文本的。这一讲我们增加一个新的领域,即音频。我们将介绍OpenAI的Whisper模型,它是一个处理音频的大模型。 Wh...
-
Stable Diffusion with Diffusers 学习笔记: 原理+完整pipeline代码
文章目录 01 使用 02 Stable Diffusion 的工作原理 The autoencoder (VAE The U-Net The Text-encoder Latent Diffusion 又快又高效的原因 Stable Di...
-
【Stable Diffusion XL】huggingface diffusers 官方教程解读
文章目录 01 Tutorial Deconstruct a basic pipeline Deconstruct the Stable Diffusion pipeline Autopipeline Train a diffusion mo...
-
Stable Diffusion扩散模型 + Consistency一致性模型
1 GAN到Stable Diffusion的改朝换代 2 从DDPM到Stable Diffusion发展史 2.1 DDPM 扩散过程(正向) 去噪过程(反向) 总结 优化目标 理论推导 代码解析 2.2 Stable Diffu...
-
【生成模型】Stable Diffusion原理+代码
文章目录 前言 一、Latent space 二、AutoEncoder 和 VAE 1.AutoEncoder: 2.VAE: 三、Diffusion扩散模型 1.前向过程 2.逆向过程 四、多模态 cross attention 五...
-
[玩转AIGC]LLaMA2训练中文文章撰写神器(数据准备,数据处理,模型训练,模型推理)
目录 一、下载并加载中文数据集 二、中文数据集处理 1、数据格式 2、数据集处理之tokenizer训练格式 1)先将一篇篇文本拼凑到一起(只是简单的拼凑一起,用于训练tokenizer) 2)将数据集进行合并 3、数据集处理之模型(ll...
-
探索学习和入门使用GitHub Copilot:提升代码开发的新利器
目录 引言 1. 什么是GitHub Copilot? 2. 入门使用GitHub Copilot 3. GitHub Copilot的基础知识 4. GitHub Copilot的应用场景 结论 在最近的开发工作中,发现了一个比较实用...
-
软硬约束下的轨迹如何生成,理论&代码详解!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 本项目代码: github.com/liangwq/robot_motion_planing 轨迹约束中的软硬约束 前面的几篇文章已经介绍了,轨迹约束的本质就是在做带约束的轨迹拟合。输入就是waypo...
-
Stable Diffusion架构的3D分子生成模型 GeoLDM - 测评与代码解析
之前,向大家介绍过3D分子生成模型 GeoLDM。 GeoLDM按照Stable Diffusion架构,将3D分子生成的扩散过程运行在隐空间内,优化了基于扩散模型的分子生成。可能是打开Drug-AIGC的关键之作。让精确控制分子生成有了希望。...
-
whisper深入-语者分离
文章目录 学习目标:如何使用whisper 学习内容一:whisper 转文字 1.1 使用whisper.load_model( 方法下载,加载 1.2 使用实例对文件进行转录 1.3 实战 学习内容二:语者分离(pyannote.aud...