音频转录 - AIGC资讯

使用 CTranslate2 实现 Faster Whisper 的加速转录

使用 CTranslate2 实现 Faster Whisper 的加速转录近年来，语音识别技术得到了快速发展。OpenAI 的 Whisper 模型作为其中的佼佼者，以其高精度和强大的性能广受欢迎。然而，其较长的推理时间和高内存消耗也成为了限制其应...

生成式AI 2024-10-04 人工智能

1094阅读

Insanely Fast Whisper CLI 项目教程

Insanely Fast Whisper CLI 项目教程 insanely-fast-whisper-cli The fastest Whisper optimization for automatic speech recognition a...

AIGC 2024-10-01 人工智能

497阅读

faster-whisper-GUI 使用教程

faster-whisper-GUI 使用教程 faster-whisper-GUIfaster_whisper GUI with PySide6项目地址:https://gitcode.com/gh_mirrors/fa/faster-whisper...

大数据 2024-09-30 人工智能

1332阅读

在 windows 上部署使用 Whisper 教程

在 Windows 上部署 OpenAI Whisper：详细教程 OpenAI Whisper 是一个功能强大的多语言语音识别模型，能够处理多种音频格式并生成高质量的字幕文件。本文将详细介绍如何在 Windows 系统上部署 Whisper，利用 G...

AIGC 2024-09-28 人工智能

1158阅读

Insanely Fast Whisper CLI 使用教程

Insanely Fast Whisper CLI 使用教程 insanely-fast-whisper-cli The fastest Whisper optimization for automatic speech recognition a...

人工智能 2024-09-27 人工智能

676阅读

SwiftWhisper 开源项目教程

SwiftWhisper 开源项目教程 SwiftWhisper? The easiest way to transcribe audio in Swift项目地址:https://gitcode.com/gh_mirrors/sw/SwiftWhis...

大数据 2024-09-19 人工智能

423阅读

audioWhisper 项目使用教程

audioWhisper 项目使用教程 audioWhisperListen to any audio stream on your machine and print out the transcribed or translated audio.项...

大数据 2024-09-15 人工智能

400阅读

基于whisper流式语音识别

为了实现持续监听麦克风并在检测到声音时进行转录，我们可以将流的监听时间设置为无限长。通过使用一个音量门限来检测是否有声音，然后进行转录。安装依赖确保安装必要的库： pip install torch torchaudio openai-whis...

AIGC 2024-09-14 人工智能

863阅读

比OpenAI的Whisper快50%，最新开源语音模型

生成式AI初创公司aiOla在官网开源了最新语音模型Whisper-Medusa，推理效率比OpenAI开源的Whisper快50%。 aiOla在Whisper的架构之上进行了修改采用了“多头注意力”机制的并行计算方法，允许模型在每个推理步骤中预测多个t...

人工智能 2024-08-04 人工智能

485阅读

whisper使用

whisper使用 1. 直接调用语音识别 2. 语种识别 whisper.detect_language( 和whisper.decode( 3. 指定要识别的语种做语音识别 **whisper 源码的transcribe函数** 函数解...

生成式AI 2024-06-17 人工智能

583阅读

文心一言上线声音定制功能；通义千问开源模型；openAI又侵权？

文心一言上线定制专属声音功能百度旗下 AI 聊天机器人文心一言上线新功能，用户录音一句话，即可定制声音。使用这项功能需要使用文心一言 App。在创建智能体中，点击创建自己的声音，朗读系统提示的一句话，等候几秒钟时间，系统就能捕捉到用户的声音...

生成式AI 2024-06-15 人工智能

465阅读

OpenAI 为训练 GPT-4模型转录了超过一百万小时的 YouTube 视频

AI 公司在获取高质量训练数据方面遇到的挑战，OpenAI 为了训练其最先进的大型语言模型 GPT-4，使用了超过一百万小时的 YouTube 视频副本。据了解，该公司通过其 Whisper 音频转录模型转录这些视频，尽管这一做法在法律上具有争议性，Op...

大数据 2024-04-07 人工智能

463阅读

OpenAI 转录了超过一百万小时的 YouTube 视频来训练 GPT-4

近日，《华尔街日报》报道称，人工智能公司在收集高质量训练数据方面遇到了困难。随后，《纽约时报》详细介绍了一些公司处理这一问题的方法，其中涉及到了人工智能版权法的模糊灰色区域。故事从OpenAI开始。该公司迫切需要训练数据，据报道开发了Whisper音频转...

AIGC 2024-04-07 人工智能

449阅读

报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4

IT之家 4 月 7 日消息，本周早些时候，《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天，《纽约时报》详细介绍了 AI 公司处理此问题的一些方法，其中涉及到属于 AI 版权法模糊灰色区域的内容。报道称，OpenAI 迫切需...

大数据 2024-04-07 人工智能

438阅读

Skeleton Fingers官网体验入口 AI音频转录工具在线使用地址

Skeleton Fingers是一款基于AI技术的网页音频转录产品。它可以直接在浏览器中将音频链接、上传的音频文件或语音录制转换为文字。该产品具有无需下载安装、在线即可使用的优势，支持多种音频输入方式，并采用AI语音识别技术，准确高效。操作简单，界面友好...

人工智能 2024-04-03 人工智能

415阅读

Faster-Whisper 实时识别电脑语音转文本

Faster-Whisper 实时识别电脑语音转文本前言项目搭建环境安装Faster-Whisper 下载模型编写测试代码运行测试代码实时转写脚本实时转写WebSocket服务器模式参考前言以前做的智能对...

AIGC 2024-02-08 人工智能

787阅读

AI一点通： OpenAI whisper 在线怎么调用，怎么同时输出时间信息？

OpenAI 语音转文字 whisper API提供了两个端点，即转录和翻译，这基于我们最先进的开源大型v2 Whisper模型。它们可以用来：将音频转录成音频所在的语言。翻译并将音频转录成英文。文件上传目前限制为25 MB，支持以下输入文件类型：...

人工智能 2024-01-28 人工智能

582阅读

使用 Transformers 为多语种语音识别任务微调 Whisper 模型

本文提供了一个使用 Hugging Face ? Transformers 在任意多语种语音识别 (ASR 数据集上微调 Whisper 的分步指南。同时，我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识，...

AIGC 2024-01-18 人工智能

709阅读

大模型系列：OpenAI使用技巧_Whisper提示指南

文章目录与GPT提示的比较设置作为基准，我们将转录NPR播客片段转录遵循提示的风格在提示中传递名称以防止拼写错误 GPT可以生成虚构的提示 OpenAI的音频转录API有一个可选参数称为 prompt。提示旨在帮助拼...

大数据 2024-01-05 人工智能

1207阅读

whisper

Robust Speech Recognition via Large-Scale Weak Supervision 介绍大规模弱监督的训练。先前的方法都是通过大量的无监督学习训练（无监督的数据容易收集，所以通过大量无监督的学习可以训练出一个质量...

生成式AI 2023-12-23 人工智能

514阅读

使用Gradio构建生成式AI应用程序； Stability AI推出Stable Diffusion XL 1.0

? AI新闻 ? Stability AI推出最先进的AI工具Stable Diffusion XL 1.0 摘要：Stability AI宣布推出Stable Diffusion XL 1.0，该版本是其迄今为止最先进的AI工具。Stable D...

AIGC 2023-12-14 人工智能

476阅读

通过Whisper模型将YouTube播放列表中的视频转换成高质量文字稿的项目

项目简介一个通过Whisper模型将YouTube播放列表中的视频转换成高质量文字稿的项目。这个基于 Python 的工具旨在将 YouTube 视频和播放列表转录为文本。它集成了多种技术，例如用于转录的 Fast-Whisper、用于自然语言处理...

生成式AI 2023-12-04 人工智能

529阅读

AI视野：OpenAI官宣奥特曼回归；元象推出3D拍摄与混合编辑插件工具；百度灵医大模型将接入孚宝机器人；together.ai融资7.3亿元

???AI新鲜事 OpenAI官宣Sam Altman回归担任CEO OpenAI正式宣布Sam Altman回归担任CEO，Mira Murati将回到CTO职位，新的董事会由Bret Taylor、Larry Summers和Adam D'Angelo...

人工智能 2023-11-30 人工智能

479阅读

Photoshop安装StableDiffusion插件安装使用教程解决面临高峰需求问题

插件介绍借助 Auto-Photoshop-StableDiffusion-Plugin，您可以直接在 Photoshop 中使用 Automatic1111 Stable Diffusion 的功能，而无需在程序之间切换。这使您可以在熟悉的环境中轻松...

大数据 2023-11-27 人工智能

565阅读

Whisper、React 和 Node 构建语音转文本 Web 应用程序

在本文中，我们将使用 OpenAI 的 Whisper 以及 React、Node.js 和 FFmpeg 构建一个语音转文本应用程序。该应用程序将获取用户输入，使用 OpenAI 的 Whisper API 将其合成为语音，并输出结果文本。Whisper...

人工智能 2023-11-12 人工智能

790阅读