语音转文字 - AIGC资讯

写作卡壳了怎么办？5款AI写作工具，激发你的创造力，灵感源源不断

再不会用AI就out啦！这些国产超实用的免费AI工具你都用过吗？不知道大家有没有发现啊，这两年AI发展是真的猛，现在不管是工作还是学习，要是不会用点AI工具简直都out了。想想别人用AI几十秒干掉了你得做一个上午的工作，这效率差距可不是一星半点，还...

生成式AI 2024-10-05 人工智能

1407阅读

Whisper ASR Webservice 使用教程

Whisper ASR Webservice 使用教程 whisper-asr-webserviceOpenAI Whisper ASR Webservice API项目地址:https://gitcode.com/gh_mirrors/wh/whis...

AIGC 2024-09-30 人工智能

1855阅读

N46Whisper 开源项目使用教程

N46Whisper 开源项目使用教程 N46Whisper Whisper based Japanese subtitle generator 项目地址: https://gitcode.com/gh_mirrors/n4/N46Whispe...

人工智能 2024-09-22 人工智能

1485阅读

真我GT5 Pro手机开始推送新版realme UI 5.0：加入AI传送门、AI大神辅助功能

真我realme副总裁、全球营销总裁、中国区总裁徐起表示，真我GT5 Pro系统新版固件RX3888_14.1.0.803开始陆续推送。此次更新中，加入了AI传送门、AI大神辅助功能，以及音频播放器接入流体云、语音转文字中新增字幕功能等这些较为实用的功能...

人工智能 2024-09-15 人工智能

1397阅读

Whisper Web 开源项目教程

Whisper Web 开源项目教程 whisper-webML-powered speech recognition directly in your browser项目地址:https://gitcode.com/gh_mirrors/wh/whi...

生成式AI 2024-09-15 人工智能

1396阅读

AI编码无需人类插手！Claude工程师摔断右手，竟一周狂肝3000行代码

【新智元导读】一次意外右手骨折，Claude工程师的工作竟被AI挽救了。近两个月的时间，他们一起结对编程，甚至在一周内肝出3000行代码。他疯狂暗示，未来1-3年，就是「AI工程师」的天下。原来，摔断胳膊也是一件幸事...... 当事人表示，「我再也不想...

大数据 2024-08-07 人工智能

1136阅读

中国电信首款AI手机！麦芒30首销：首搭大模型 1999元起

快科技7月25日消息，今日，中国电信首款自主品牌AI手机麦芒30开售，8GB 256GB售价1999元，12GB 256GB售价2199元。麦芒30拥有冰晶蓝、曜金黑、雪域白三种配色，整机约189g重，厚度仅7.98mm。手机正面为6.78英寸双曲屏，...

大数据 2024-07-25 人工智能

894阅读

【V831】智能语音对话：语音识别、文心一言回答、语音合成

1、实验设备 01科技的V831 2、总体概述按下按键，蓝灯亮起，开始定时录音，录音结束，蓝灯熄灭。接着，通过百度的语音识别API进行语音转文字，得到文字后通过百度的文心一言API进行回答，得到的回答通过百度的语音合成API把回答的文字合成为音...

人工智能 2024-06-15 人工智能

1188阅读

Windows部署语音转文字项目_Whisper

Windows部署语音转文字项目_Whisper 一、前置安装准备 Github源仓库，Whisper 下载安装whisper及其依赖项官方有两种部署方法，一种是通过默认pip源拉取安装：以管理员身份运行powershell，输入如下命令p...

生成式AI 2024-06-13 人工智能

1464阅读

开源模型应用落地-语音转文本-whisper模型-AIGC应用探索（一）

一、前言语音转文本技术具有重要价值。它能提高信息记录和处理的效率，使人们可以快速将语音内容转换为可编辑、可存储的文本形式，方便后续查阅和分析。在教育领域，可帮助学生更好地记录课堂重点；在办公场景中，能简化会议记录工作。同时，该技术也为残障人士提...

AIGC 2024-06-06 人工智能

818阅读

whisper之初步使用记录

文章目录前言一、whisper是什么？二、使用步骤 1.安装 2.python调用 3.识别效果评估 4.一点封装 5.参考链接总结前言随着AI大模型的不断发展，语音识别等周边内容也再次引发关注，通过语音转文字再与大模...

人工智能 2024-05-30 人工智能

1165阅读

OpenAI 开源的免费 AI 语音转文字工具 - Whisper，一步一步本地部署运行

Whisper 是 OpenAI 研发的一个通用的语音识别模型，可以把语音转为文本。它在大量多样化的音频数据集上进行训练，同时还是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。一、使用场景语音 => 文字是一个非常实用的功能，...

生成式AI 2024-05-29 人工智能

1937阅读

FastGPT 调用本地Whisper模型进行语音转文字

目录一、部署Whisper模型。二、oneapi配置三、修改镜像中的webservice.py文件，开放跨域请求。四、修改FastGPT代码修改 FastGPT地址:https://github.com/labring/FastGP...

AIGC 2024-05-25 人工智能

2230阅读

AI语音识别工具Universal-1：38秒可以处理60分钟音频比fast Whisper更快

AssemblyAI 最新研究成果展示了他们的 Universal-1模型在多语言环境中的表现，该模型在准确性和鲁棒性方面均取得了行业领先地位。先说结果，Universal-1比Whisper Large-v3更准确，比fast Whisper更快，38秒...

生成式AI 2024-04-07 人工智能

1077阅读

超快的 AI 实时语音转文字，比 OpenAI 的 Whisper 快4倍 -- 开源项目 Faster Whisper

faster-whisper 这个项目是基于 OpenAI whisper 的模型，在上面的一个重写。使用的是 CTranslate2 的这样的一个库，CTranslate2 是用于 Transformer 模型的一个快速推理引擎。在相同精度的情况...

AIGC 2024-03-29 人工智能

1565阅读

使用科大讯飞api以及文心一言模型实现对话

因为比赛要用到人机进行对话所以写以下python代码。以下为3.8 代码中相关api以及密匙都更改过，请自己去获得密匙科大讯飞网址讯飞开放平台-以语音交互为核心的人工智能开放平台 (xfyun.cn 百度千帆文心一言百度智能云千帆大模型 (bai...

生成式AI 2024-03-01 人工智能

1107阅读

使用openai-whisper实现语音转文字

使用openai-whisper实现语音转文字 1 安装依赖 1.1 Windows下安装ffmpeg FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化...

人工智能 2024-02-26 人工智能

902阅读

WhisperFusion：与 AI 无缝语音对话（超低延迟），深入理解用户每句话背后的含义

演示视频里面，那老哥问它问题之后，后面更改问题，依然能很好的记录问题变化的过程并给出答案。 WhisperFusion 是基于 WhisperLive 和 WhisperSpeech 的强大工具，将声音转文字和文字理解融为一体，让你与AI机器人无缝语音对...

生成式AI 2024-02-11 人工智能

1044阅读

实战whisper：本地化部署通用语音识别模型

前言 Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。这里呢，我将给出我的一些代码，来帮助你尽快实现【语音转文字】的服务部署...

生成式AI 2024-02-09 人工智能

2621阅读

20240127在ubuntu20.04.6下配置whisper

20240131在ubuntu20.04.6下配置whisper 2024/1/31 15:48 首先你要有一张NVIDIA的显卡，比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡！】800￥ 2、请正确安装好NVIDIA最新的驱动...

人工智能 2024-02-08 人工智能

4868阅读

20240131在ubuntu20.04.6下使用whisper不同模式的比对

20240131在ubuntu20.04.6下使用whisper不同模式的比对 2024/1/31 16:07 首先你要有一张NVIDIA的显卡，比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡！】 2、请正确安装好NVIDIA最新...

生成式AI 2024-02-06 人工智能

947阅读

openai-whisper

openai-whisper 0. 参数说明 1. 视频语音转文字 demo 1. 提取b站视频中的音频,增加到自己的视频里,并且显示字幕 1. 下载b站视频到电脑 2. 提取视频中的音频 3. 音频转文字 4. 自己的视频去掉音频,增...

大数据 2024-02-05 人工智能

821阅读

AIGC | AIGC工具库梳理（上）

目录 ?大杂烩工具包 ?文本工具 ?对话聊天 ?写作生成 ?营销文本 ? 图像工具 ?图片生成 ?背景移除 ?无损放大 ?优化修复 ?物体抹除 ?音频工具 ?音频合成 ?语音转文字、文字转语音 ?变声工具 ?音频处理 ?...

AIGC 2024-02-03 人工智能

762阅读

AI一点通： OpenAI whisper 在线怎么调用，怎么同时输出时间信息？

OpenAI 语音转文字 whisper API提供了两个端点，即转录和翻译，这基于我们最先进的开源大型v2 Whisper模型。它们可以用来：将音频转录成音频所在的语言。翻译并将音频转录成英文。文件上传目前限制为25 MB，支持以下输入文件类型：...

人工智能 2024-01-28 人工智能

1179阅读

英文视频添加中英双语字幕（基于Whisper语音识别和Google翻译）

第一步：安装配置环境，这一步重要介绍安装的环境依赖，可以看完第二章再来看一遍（1）Whisper环境配置可以参考以下博客的内容讲显卡驱动，CUDA和cudnn的安装比较详细，我建议能用GPU加速就尽量使用，Whisper速度有点慢如何在你的电脑...

大数据 2024-01-21 人工智能

1101阅读

【openAI】Whisper如何高效语音转文字（详细教程）

文章目录前言一、准备二、使用Whisper进行语音转文字三.Whisper转换结果分析总结前言语音转文字在许多不同领域都有着广泛的应用。以下是一些例子： 1.字幕制作：语音转文字可以帮助视频制作者快速制作字幕，这...

AIGC 2024-01-18 人工智能

1045阅读

基于OpenAI的Whisper构建的高效语音识别模型：faster-whisper

1 faster-whisper介绍 faster-whisper是基于OpenAI的Whisper模型的高效实现，它利用CTranslate2，一个专为Transformer模型设计的快速推理引擎。这种实现不仅提高了语音识别的速度，还优化了内存使用效率...

人工智能 2024-01-17 人工智能

2567阅读

请查收使用OpenAI的Whisper进行语音识别的攻略

Whisper是一种令人激动的新型语言模型，采用了全新的语音识别方法，即使是低质量的音频，Whisper也能产生高质量的结果，并且对各种声音和语言的适应性极强，无需进行微调。 Whisper是开源的，有一系列可用的模型尺寸，可以作为众多语音转文字应用的有...

AIGC 2024-01-16 人工智能

1420阅读

Whisper OpenAI开源语音识别模型

介绍 Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whisper 进行了训练...

大数据 2024-01-09 人工智能

2006阅读

本地部署语音转文字（whisper，SpeechRecognition）

本地部署语音转文字 1.whisper 1.首先安装Chocolatey 2.安装 3.使用 2.SpeechRecognition 1.环境 2.中文包 3.格式转化 4.运行 3.效果 1.whisper 1.首先安...

大数据 2024-01-08 人工智能

1216阅读

OpenAI又一神器！Whisper 语音转文字手把手教程

语音转文字在许多不同领域都有着广泛的应用。以下是一些例子： 1.字幕制作：语音转文字可以帮助视频制作者快速制作字幕，这在影视行业和网络视频领域非常重要。通过使用语音转文字工具，字幕制作者可以更快地生成字幕，从而缩短制作时间，节省人工成本，并提高制...

大数据 2024-01-07 人工智能

899阅读

AI平台：标贝悦读-语音合成-在线文字转语音软件-专业的配音网站

标贝悦读-语音合成-在线文字转语音软件-专业的配音网站首页 AI配音声音转换 VIP会员开发者登录 | 注册新用户免费领会员 AI配音合成 AI合成语音，快速、媲美真人，多种发音人可供选择立即体验声音转换像柯南的...

AIGC 2024-01-06 人工智能

1063阅读

2023-12-27 语音转文字的whisper应用部署

点击 <C 语言编程核心突破> 快速C语言入门语音转文字的whisper应用部署前言一、部署`whisper` 二、部署`whisper.cpp` 总结前言要解决问题: 需要一款开源的语音转文字...

人工智能 2024-01-05 人工智能

1156阅读

三星 Galaxy S24 发布会邀请函泄露，活动日期提及 Galaxy AI

三星即将在 2024 年 1 月 17 日于美国举办 Galaxy S24 系列的发布活动，这一消息由泄露者 Evan Blass 在 X 平台（前 Twitter）上发布的一张图片中透露。据泄露的图片显示，下一场 Galaxy Unpacked 活动...

人工智能 2023-12-22 人工智能

881阅读

无脑018——win11部署whisper，语音转文字

1.conda创建环境 conda create -n whisper python==3.9 conda activate whisper 安装pytorch pip install torch==1.8.1+cu101 torchvisio...

人工智能 2023-12-17 人工智能

837阅读

6款实用超火AI工具推荐，ChatGPT，Midjourney ，Notion AI ，Tome ，Descript ，Runway

ChatGPT等6款实用超火AI工具推荐 | 2023绝对称得上是脑洞大开的一年！人工智能的风口由OpenAI旗下的ChatGPT率先引爆。下面6个非常实用的AI工具强烈推荐给大家， [一] ChatGPT ? ChatGPT不但能够写文案、剧本、企划...

大数据 2023-12-16 人工智能

1721阅读

《AI上字幕》基于openAI研发的whisper模型，语音（视频）一键转文本/字幕/带时间轴/支持多语言/自带翻译《桌面版教程》

简介： OpenAI的chatGPT非常火爆，其实OpenAI旗下的另一个模型实力也十分强大，它就是开源免费的Whisper语音转文本模型，目前为止它是较为顶尖的语音转文本模型当前github上也有许多出色的开发者根据此模型开发出桌面版语音转文字...

人工智能 2023-12-14 人工智能

1030阅读

whisper技术部署及简单使用

文章目录安装ffmpeg(解压模式安装python（源码编译模式）安装pytorch 安装whisper whisper命令行使用 python调用whisper pip包离线导出安装 whisper是openai开源的...

生成式AI 2023-12-05 人工智能

892阅读

神经网络实用工具（整活）系列---使用OpenAI的翻译模型whisper实现语音（中、日、英等等）转中字，从此生肉变熟肉---基础篇

最近在做神经网络的研究，偶然间看到OpenAI开源出了一个多国语音转文字的模型，脑海里突然想到余大嘴在华为发布会发布实时语音翻译时满屏弹幕的“？？？”和“！！！”，于是决定做一个多国语音转简体中文字幕的软件来玩一玩。想法是这样的：通过OpenAI最新发...

人工智能 2023-11-30 人工智能

1989阅读

openai的whisper语音识别介绍

openAI发布了chatgpt，光环一时无两。但是openAI不止有这一个项目，它的其他项目也非常值得我们去研究学习。今天说说这个whisper项目 https://github.com/openai/whisper ta是关于语音识别的。它提出了...

大数据 2023-11-27 人工智能

927阅读

ubuntu使用whisper和funASR-语者分离-二值化

文章目录一、选择系统 1.1 更新环境二、安装使用whisper 2.1 创建环境 2.1 安装 2.1.1安装基础包 2.1.2安装依赖 3测试1 3测试2 语着分离创建代码 `报错ModuleNotFoundError: N...

AIGC 2023-11-22 人工智能

1528阅读

Powder利用AI为游戏主播自动剪辑可检测直播间取胜、击杀等重要瞬间

法国初创公司Powder最近推出了一款人工智能驱动的视频剪辑工具，它可以自动从游戏直播和视频中提取精彩片段，大大简化了游戏主播的后期编辑工作。 Powder训练了40多个游戏专用的AI模型，能够分析音频、检测笑声并找到游戏中的亮点时刻，如取胜、击杀等重要...

人工智能 2023-11-21 人工智能

902阅读

whisper执行ffmpeg时，报错： hp, ht, pid, tid = _winapi.CreateProcess(executable, args, 系统找不到指定的文件。

最近在用openai/whisper-small进行语音转文字任务时，想着自己下载模型在本地离线跑，但是遇到了一下问题： import whisper import wave import numpy as np download_root = r"\...

大数据 2023-11-21 人工智能

1011阅读

openai开源的whisper在huggingface中使用例子（语音转文字中文）

openai开源的语音转文字支持多语言在huggingface中使用例子。目前发现多语言模型large-v2支持中文是繁体，因此需要繁体转简体。后续编写微调训练例子 GitHub地址： https://github.com/openai/whispe...

AIGC 2023-11-14 人工智能

857阅读

语音识别模型whisper的参数说明

一、whisper简介： Whisper是一种通用的语音识别模型。它是在各种音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。二、whisper的参数 1、-h, --help 查看whisper的参数...

生成式AI 2023-11-11 人工智能

895阅读

Buzz语音转文字安装使用(含Whisper模型下载)

简介： Transcribe and translate audio offline on your personal computer. Powered by OpenAI’s Whisper. 转录和翻译音频离线在您的个人计算机。由OpenAI的W...

人工智能 2023-11-10 人工智能

1164阅读

语音识别开源框架 openAI-whisper

Whisper 是一种通用的语音识别模型。它是OpenAI于2022年9月份开源的在各种音频的大型数据集上训练的语音识别模型，也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。 GitHub - yeyupiaoling/Whispe...

大数据 2023-11-08 人工智能

1424阅读

脱离传统录音方式？AI配音神器虾果魔音让配音更简单

虾果魔音是中国中芯网络科技有限公司开发的一款引人注目的AI配音神器。该软件以其高度拟人和流畅自然的人声配音功能而著称。用户可以轻松将文字转化为语音，并从近百种不同发音人中选择适合的配音。虾果魔音支持多种情绪和语言，包括中文、英文、童声、方言和广告旁白等10...

人工智能 2023-10-27 人工智能

871阅读

口型几乎完美、还能卡点，霉霉说地道中文的视频火了，背后AI工具原来是它

这两天，美国女歌星霉霉（泰勒・斯威夫特）一则说中文的短视频在各社交平台火了起来。有的播放量已经达到了 600 多万。在视频里，霉霉操着一口流利、地道的中文，神情自若，几乎没有早期译制片女主角的那种腔调，口型也能对得上。图源：微博 @会火还没有看过...

人工智能 2023-10-24 人工智能

941阅读