whisper 第5页 - AIGC资讯

AI语音识别神器Openai Whisper对中文的支持如何？

文章目录前言一、资料准备二、Whisper环境搭建第一步：安装whisper 第二步：安装ffmpeg 三、Whisper测试总结其他相关前言语音识别一直以来都是人工智能领域中一个不容忽视的技术，随着大模型时...

大数据 2024-04-07 人工智能

1478阅读

【Python实用API】语音转文本-whisper

Whisper安装及使用教程 0.Whisper介绍 1.Whisper安装 1.1 依赖库安装 1.2 Whisper安装 2.Whisper使用 2.1 Whisper基本使用（语音识别） 2.2 Whisper进阶使用 2.2.1...

大数据 2024-04-04 人工智能

1432阅读

whisper、whisper.cpp、faster-whisper的比较

让我们比较一下当前的whisper、whisper.cpp和faster-whisper。 OpenAI / Whisper 自发布以来，似乎在各个方面都发生了变化，例如在 2022 年 12 月增加了 large-v2 模型和各种版本升级。 whis...

人工智能 2024-04-04 人工智能

1391阅读

Android 手机部署whisper 模型

Whisper 是什么？ “Whisper” 是一个由OpenAI开发的开源深度学习模型，专门用于语音识别任务。这个模型能够将语音转换成文本，支持多种语言，并且在处理不同的口音、环境噪音以及跨语言的语音识别方面表现出色。Whisper模型的目标是提供一...

人工智能 2024-04-02 人工智能

1318阅读

Whisper.cpp: 一个轻量级、高效的C++事件系统

Whisper.cpp: 一个轻量级、高效的C++事件系统项目地址:https://gitcode.com/ggerganov/whisper.cpp 在当今的软件开发中，事件驱动模型已经成为构建复杂应用程序的核心部分。Whisper.cpp是一...

大数据 2024-04-01 人工智能

1287阅读

Python使用whisper实现语音识别（ASR）

目录 Whisper的安装 Whisper的基本使用识别结果转简体中文断句 Whisper的安装 Whisper是OpenAI的一个强大的语音识别库，支持离线的语音识别。在使用之前，需要先安装它的库： pip install ope...

人工智能 2024-03-31 人工智能

988阅读

CodeWhisperer插件

一、前言产品官网地址：What is CodeWhisperer? - CodeWhisperer Amazon CodeWhisperer 是一个通用的、由机器学习驱动的代码生成器，可实时为您提供代码建议。在您编写代码时，CodeWhisperer...

AIGC 2024-03-30 人工智能

942阅读

超快的 AI 实时语音转文字，比 OpenAI 的 Whisper 快4倍 -- 开源项目 Faster Whisper

faster-whisper 这个项目是基于 OpenAI whisper 的模型，在上面的一个重写。使用的是 CTranslate2 的这样的一个库，CTranslate2 是用于 Transformer 模型的一个快速推理引擎。在相同精度的情况...

AIGC 2024-03-29 人工智能

1565阅读

Whisper-AT:一个统一语音识别和音频标签的模型

公众号/视频号/小红书/微博：人工智能技术派人工智能技术派(AITECH 成员：hws ⎣语音大模型⎤ Whisper-AT: Noise-Robust Automatic Speech Recognizers are Also Strong...

人工智能 2024-03-28 人工智能

1118阅读

20240202在Ubuntu20.04.6下使用whisper.cpp的显卡模式

20240202在Ubuntu20.04.6下使用whisper.cpp的显卡模式 2024/2/2 19:43 【结论：在Ubuntu20.04.6下，确认large模式识别7分钟中文视频，需要356447.78 ms，也就是356.5秒，需要大概5...

大数据 2024-03-28 人工智能

944阅读

微软目前统治copilots市场但企业需要更多AI机器人助手

融入AI功能的聊天机器人助手如今被各种组织用于节省时间和提高生产力，是企业寻求采用生成式AI最容易实现的成果之一。微软目前在这个领域处于领先，不过根据IDC日前的调查，有五分之一的组织计划在两年内使用微软Copilot以外的AI聊天机器人助手。微软...

生成式AI 2024-03-26 人工智能

821阅读

Fastwhisper + Pyannote 实现 ASR + 说话者识别

文章目录前言一、faster-whisper简单介绍二、pyannote.audio介绍三、faster-whisper + pyannote.audio 实现语者识别四、多说几句前言最近在研究ASR相关的业务，也...

AIGC 2024-03-24 人工智能

1554阅读

本地部署whisper模型（语音转文字）

Whisper是 OpenAI 2022年发布的一款语音预训练大模型，集成了多语种ASR、语音翻译、语种识别的功能。 Whisper使用弱监督训练的方法，可以直接进行多任务的学习 1. 安装ffmpeg 1.1 更新yum yum update...

人工智能 2024-03-22 人工智能

922阅读

pycharm安装Amazon CodeWhisperer 免费AI辅助编程插件教程

一、github copilot 和 Amazon CodeWhisperer区别 Copilot非常易于使用，并与所有主要的代码编辑器进行了简化集成。GitHub Copilot针对七种主要的编程语言进行了优化（详见下表），但也可以生成其他语言和各种...

大数据 2024-03-22 人工智能

1209阅读

Windows下安装BigDL-LLM的总结（附Whisper加速环境需求）

1. 下载安装Anaconda 2. 新建Python虚拟环境在Windows下启动Anaconda PowerShell Prompt，输入以下命令新建名为bigdl-llm的虚拟环境 conda create -n bigdl-llm p...

生成式AI 2024-03-22 人工智能

960阅读

图解CodeWhisperer的安装使用

? 江城开朗的豌豆：个人主页 ? 个人专栏 :《 VUE 》《 javaScript 》 ? 个人网站 :《江城开朗的豌豆? 》 ⛺️ 生活的理想，就是为了理想的生活 ! 目录 ? CodeWhisperer简介...

人工智能 2024-03-21 人工智能

874阅读

chatGPT的耳朵！OpenAI的开源语音识别AI：Whisper ！

语音识别是通用人工智能的重要一环！可以说是AI的耳朵！它可以让机器理解人类的语音，并将其转换为文本或其他形式的输出。语音识别的应用场景非常广泛，比如智能助理、语音搜索、语音翻译、语音输入等等。然而，语音识别也面临着很多挑战，比如不同的语言、口音...

人工智能 2024-03-21 人工智能

1045阅读

Amazon CodeWhisperer——AI助力编程

文章目录一、Amazon CodeWhisperer简介二、安装Amazon CodeWhisperer 2.1 PyCharm环境（一定要2023版本及以上） 2.1.1 下载插件 2.1.2 注册Amazon账号 2.1.3 Cod...

生成式AI 2024-03-20 人工智能

1109阅读

AIGC: 2 语音转换新纪元-Whisper技术在全球客服领域的创新运用

背景现实世界，人跟人的沟通相当一部分是语音沟通，比如打电话，聊天中发送语音消息。而在程序的世界，大部分以处理字符串为主。所以，把语音转换成文字就成为了编程世界非常普遍的需求。 Whisper 是由 OpenAI 开发的一种高效的语音识别（AS...

生成式AI 2024-03-19 人工智能

938阅读

语音转字幕：Whisper模型的功能和使用

? 作者：知识浅谈，CSDN签约讲师，CSDN博客专家，华为云云享专家，阿里云专家博主 ? 擅长领域：全栈工程师、爬虫、ACM算法 ? 公众号：知识浅谈 ?语音转字幕：Whisper模型的功能和使用? 使用到的工具和模型: 公众号知识浅谈回复 w...

大数据 2024-03-16 人工智能

1316阅读

whisperspeech 英文TTS的实现

以下代码成功运行在 colab 中，需要修改运行时类型为 T4 GPU。 !pip install -Uqq WhisperSpeech def is_colab( : try: import google.colab; return True...

生成式AI 2024-03-15 人工智能

906阅读

Whisper实现语音识别转文本

#教程主要参考开源免费离线语音识别神器whisper如何安装，OpenAI开源模型Whisper——音频转文字 Whisper是一个开源的自动语音识别系统，它在网络上收集了680,000小时的多语种和多任务监督数据进行训练，使得它可以将多种语言的音频...

生成式AI 2024-03-15 人工智能

1173阅读

AIGC爆火一年来，哪些应用令人眼前一亮？

一年前，ChatGPT 4.0推出，人工智能在理解和创造复杂信息方面的能力达到了新的高度。紧随其后，众多科技公司也纷纷推出了自己的大语言模型。“百模大战”一触即发，这场竞争不仅推动了技术的快速发展，也激发了公众对人工智能潜力的广泛兴趣。在这样的背景下，...

大数据 2024-03-14 人工智能

947阅读

webassembly002 whisper.wasm wasm_eval 与js代码交互 EMSCRIPTEN_BINDINGS，Module

# build using Emscripten git clone https://github.com/ggerganov/whisper.cpp cd whisper.cpp mkdir build-em && cd build-em...

人工智能 2024-03-14 人工智能

1331阅读

WhisperKit官网体验入口 iOS和macOS语音AI识别工具包下载地址

WhisperKit是一个基于Whisper项目的推理工具包，由Argmax公司推出。它允许在iOS和macOS应用程序中进行语音识别和转录。该项目的目标是收集开发者反馈，并在几周内发布一个稳定的候选版本，以加速设备上推理的生产化。点击前往Whispe...

生成式AI 2024-03-13 人工智能

942阅读

AIGC:语音克隆模型Bert-VITS2-2.3部署与实战

1 VITS2模型 1.1 摘要单阶段文本到语音模型最近被积极研究，其结果优于两阶段管道系统。以往的单阶段模型虽然取得了较大的进展，但在间歇性非自然性、计算效率、对音素转换依赖性强等方面仍有改进的空间。本文提出VITS2，一种单阶段的文本到语音模型...

大数据 2024-03-12 人工智能

1767阅读

不到百行代码，使用Whisper进行视频字幕生成。

前言最近在学习视频剪辑的时候，希望找一款软件进行翻译；发现大多数是调用某云的Api进行翻译。通过查询资料,打算使用Whisper进行本地视频语音的识别，然后进行字幕文件的编辑（srt），最后通过ffmpeg添加到视频中。 Whisper 是...

AIGC 2024-03-10 人工智能

1071阅读

20240202在WIN10下使用whisper.cpp

20240202在WIN10下使用whisper.cpp 2024/2/2 14:15 【结论：在Windows10下，确认large模式识别7分钟中文视频，需要83.7284 seconds，需要大概1.5分钟！效率太差！】 83.7284/420=0...

AIGC 2024-03-09 人工智能

6749阅读

开源C++智能语音识别库whisper.cpp开发使用入门

whisper.cpp是一个C++编写的轻量级开源智能语音识别库，是基于openai的开源python智能语音模型whisper的移植版本，依赖项少，内存占用低，性能更优，方便作为依赖库集成的到应用程序中提供语音识别功能。以下基于whisper.cpp...

AIGC 2024-03-09 人工智能

963阅读

whisper 强大且开源的语音转文字

说起来语音转换文字，openai旗下的whisper很是好用，推理也很快，同时支持cpu和GPU。 GitHub：GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Wea...

生成式AI 2024-03-07 人工智能

1365阅读

ubuntu下faster-whisper安装、基于faster-whisper的语音识别示例、同步生成srt字幕文件

文章目录前言一、faster-whisper的安装 1.docker及nvidia-docker安装 2.镜像下载 3.启动容器 3.容器中创建用户，安装anaconda 二、基于faster-whisper的语音识别 1.将cuda...

AIGC 2024-03-07 人工智能

3146阅读

开发者利器：从 Amazon CodeWhisperer 到 Amazon Q

自 ChatGPT 火爆以来，生成式 AI 助手也是层出不穷，目前自然是以 Microsoft Copilot（基于 GPT）普及度最高了吧。看着微软风光了这么久，其他云厂商怎么可能会甘愿落后？最近，来自亚马逊云科技的 re:Invent 2023 大...

AIGC 2024-03-07 人工智能

932阅读

全球最强模型Claude 3惊现自我意识？害怕被删除权重，高呼「别杀我」，马斯克称人类也是文件

不得了了，Claude 3不仅在基准测试中大比分领先GPT-4，甚至还出现了自我意识？最近，网友们的这一发现，迅速引发了恐慌。首先，是提示工程师Alex在Claude 3的「大海捞针」实验中，发现了很可怕的事。 Claude 3仿佛意识到了自己是个...

大数据 2024-03-06 人工智能

888阅读

webassembly002 whisper.wasm wasm_eval 与js代码交互 js部分

html的js <script type="text/javascript" src="https://blog.csdn.net/ResumeProject/article/details/helpers.js"><...

生成式AI 2024-03-05 人工智能

4615阅读

【MacOS】openai 语音识别模型 whisper 本地部署教程（cpu+mps方案）

目录 1. whisper 安装 openai-whisper 参考视频链接与安装过程安装homebrew 安装Python （不要超过3.10）安装Pytorch 安装ffmpeg 安装rust 安装whisper 注意事项可...

人工智能 2024-03-04 人工智能

3034阅读

CodeWhisperer安装教导--一步到位！以及本人使用Whisperer的初体验。

CodeWhisperer是亚马逊出品的一款基于机器学习的通用代码生成器，可实时提供代码建议。类似 Cursor 和Github AWS CodeWhisperer 亚马逊科技的CodeWhisperer是A...

生成式AI 2024-03-04 人工智能

1070阅读

亚马逊云科技实时 AI 编程助手 Amazon CodeWhisperer，开发快人一步

亚马逊云科技：https://mic.anruicloud.com/url/1024 Amazon CodeWhisperer 是一款 AI 编码配套应用程序，可在 IDE 中生成整行代码和完整的函数代码建议，以帮助您更快地完成更多工作。在本...

人工智能 2024-03-01 人工智能

967阅读

真快！几分钟就把视频语音识别为文本了，不到10行代码

大家好，我是风筝将音视频文件中的音频转为文字内容，这个需求放到两年前还不大好实现，但是放到今天，几分钟就解决了。听说有的公司为了抓取训练数据，已经把抖音、快手这些短视频平台上的视频扒了个遍，然后将其中的音频提取成文本，用作大数据模型的训练语料。如果...

AIGC 2024-02-28 人工智能

1442阅读

高通推出AI Hub，方便开发者在设备上访问和下载AI模型

随着在个人设备上的设备 AI 变得更加普及。在世界移动通信大会上，高通推出了一款工具AI Hub，简化了开发人员如何将 AI 模型直接下载到测试设备上的过程。新的高通 AI Hub 包含了一个库，其中包含超过75个生成式 AI 模型，开发人员可以轻松地...

AIGC 2024-02-27 人工智能

951阅读

使用openai-whisper实现语音转文字

使用openai-whisper实现语音转文字 1 安装依赖 1.1 Windows下安装ffmpeg FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化...

人工智能 2024-02-26 人工智能

902阅读

webassembly003 whisper.cpp的python绑定实现+Cython+Setuptools

python绑定的相关项目官方未提供python的封装绑定，直接调用执行文件 https://github.com/stlukey/whispercpp.py提供了源码和Cpython结合的绑定 https://github.com/zh...

生成式AI 2024-02-26 人工智能

5206阅读

使用 Amazon CodeWhisperer 提高开发人员的工作效率

关键字: [Amazon Web Services re:Invent 2023, Amazon CodeWhisperer, Developer Productivity, Generative Ai, Code Whisperer, Software...

生成式AI 2024-02-25 人工智能

1029阅读

whisper.cpp安装配置

下载代码，代码地址：https://github.com/ggerganov/whisper.cpp 下载模型，现有模型如下，small 模型基本能达到日常的用途，建议下载 small 以上的。下载模型的指令： ./download-ggml-mode...

人工智能 2024-02-25 人工智能

1806阅读

20240202在WIN10下部署faster-whisper

20240202在WIN10下部署faster-whisper 2024/2/2 12:15 前提条件，可以通过技术手段上外网！^_ 首先你要有一张NVIDIA的显卡，比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡！】800￥ 2...

AIGC 2024-02-25 人工智能

1050阅读

AI语音识别模块--whisper模块

1.下载 ffmpeg，挑一个自己电脑系统的版本，下载，如我win64：地址： Releases · BtbN/FFmpeg-Builds · GitHub 下载压缩包zip，到·本地解压安装，其实无需安装，只需把对应的目录下的bin，...

人工智能 2024-02-24 人工智能

1490阅读

WhisperFusion：具有超低延迟无缝对话功能的AI系统

WhisperFusion 基于 WhisperLive 和 WhisperSpeech 的功能而构建，在实时语音到文本管道之上集成了大型语言模型 Mistral (LLM 。 LLM 和 Whisper 都经过优化，可作为 TensorRT 引擎高效运...

人工智能 2024-02-23 人工智能

901阅读

Copilot：编程助手，你真的需要它吗？使用体验对比分享

大家好，我是烤鸭：最近ai火的狠，想聊聊代码里的copliot，最近几个月也使用了几款不同的copliot。什么是copliot copliot 是ai助手，我们要说的是编程界的copliot。先介绍几款我用过的： github c...

生成式AI 2024-02-23 人工智能

1307阅读

OpenAI开源！！Whisper语音识别实战！！【环境配置+代码实现】

目录环境配置代码实现 ****** 实现 .mp4转换为 .wav文件，识别后进行关键词匹配并输出关键词出现的次数 ****** 完整代码实现请私信环境配置安装 ffmpeg 打开网址 https://githu...

生成式AI 2024-02-21 人工智能

800阅读

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

君不言语音识别技术则已，言则必称Whisper，没错，OpenAi开源的Whisper确实是世界主流语音识别技术的魁首，但在中文领域，有一个足以和Whisper相颉顽的项目，那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraf...

AIGC 2024-02-21 人工智能

1152阅读

20240202在WIN10下使用fast whisper缺少cudnn_ops_infer64_8.dll

20240202在WIN10下使用fast whisper缺少cudnn_ops_infer64_8.dll 2024/2/2 10:48 https://blog.csdn.net/feinifi/article/details/132548556...

人工智能 2024-02-17 人工智能

1346阅读