搜索 "语音识别"

当前位置：AIGC资讯 > 搜索 "语音识别"

Whisper JAX：闪电般快速的语音识别框架

Whisper JAX：闪电般快速的语音识别框架 whisper-jaxJAX implementation of OpenAI's Whisper model for up to 70x spe...

大数据 2024-10-03 AIGC
147阅读
本地搭建 Whisper 语音识别模型

Whisper 是由 OpenAI 开发的一款强大的语音识别模型，具有出色的多语言处理能力。搭建和使用 Whisper 模型可以帮助您将音频内容转换为文本，这在语音转写、语音助手、字幕生成等应用中都具...

AIGC 2024-10-02 AIGC
188阅读
如何利用 Whisper 模型进行多语言语音识别的优化和定制？

-------------------------------- 利用Whisper模型进行多语言语音识别的优化和定制，可以从以下几个方面入手：一、模型选择与调整模型规格选择：...

大数据 2024-10-02 AIGC
158阅读
【一文读懂】Whisper 语音识别

Whisper 语音识别 Whisper 是由 OpenAI 开发的一款先进的语音识别模型，它能够将语音转换为文本。Whisper 是一个端到端的深度学习模型，具有多语言和多任务的能力，可以用于多种...

大数据 2024-09-26 AIGC
162阅读
Whisper-CPP：CPU-AI语音识别的天才，CosyVoice - 阿里最新开源语音克隆、文本转语音项目一键整合包下载，GPT-4o实时语音方案Livekit开源voice agent音视频

Whisper-CPP：CPU-AI语音识别的天才，CosyVoice - 阿里最新开源语音克隆、文本转语音项目一键整合包下载，GPT-4o实时语音方案Livekit开源voice agent音视频...

生成式AI 2024-09-25 AIGC
300阅读
最新AI系统源码：支持AI绘画、TTS实时语音识别、文档分析、识图理解及管理后台...

最新AI系统源码：支持AI绘画、TTS实时语音识别、文档分析、识图理解及管理后台 SparkAi-v6.6.2搭建部署教程.zip_0_1_2_3_4项目地址:https://gitcode.co...

AIGC 2024-09-23 AIGC
142阅读
rk3588使用npu加速运行whisper语音识别模型

lone 克隆代码后，准备好 Python 环境，然后执行 transcrible_wav.py完成语音识别。克隆源代码： git clone http://git.bwbot.org/publi...

AIGC 2024-09-16 AIGC
374阅读
本地搭建 Whisper 语音识别模型实现实时语音识别研究

的框架 4.5 代码实现 5. 实验与结果 6. 讨论 7. 结论参考文献摘要语音识别技术近年来发展迅速，广泛应用于智能家居、智能客服、语音助手等领域。Whisper 是由目...

生成式AI 2024-09-15 AIGC
278阅读
基于whisper流式语音识别

例代码展示了如何通过程序控制麦克风进行持续监听，并在检测到声音时实时转录为文本。这一功能可广泛应用于语音识别、会议记录、实时字幕等多种场景。未来，可以根据实际需求调整音量门限、优化缓冲区管理逻辑，并可...

AIGC 2024-09-14 AIGC
217阅读
本地搭建和运行Whisper语音识别模型小记

搭建本地的Whisper语音识别模型可以是一个非常有用的项目，尤其是在需要离线处理语音数据的情况下。Whisper是OpenAI开发的一个开源语音识别模型，支持多语言和高效的转录能力。以下是详细的步骤...

人工智能 2024-09-07 AIGC
198阅读

第一页 1 2 3 4 5 6 7 8 9 10 11 12 下一页尾页

Whisper JAX：闪电般快速的语音识别框架

本地搭建 Whisper 语音识别模型

如何利用 Whisper 模型进行多语言语音识别的优化和定制？

【一文读懂】Whisper 语音识别

Whisper-CPP：CPU-AI语音识别的天才，CosyVoice - 阿里最新开源语音克隆、文本转语音项目一键整合包下载，GPT-4o实时语音方案Livekit开源voice agent音视频

最新AI系统源码：支持AI绘画、TTS实时语音识别、文档分析、识图理解及管理后台...

rk3588使用npu加速运行whisper语音识别模型

本地搭建 Whisper 语音识别模型实现实时语音识别研究

基于whisper流式语音识别

本地搭建和运行Whisper语音识别模型小记