语音识别第9页 - AIGC资讯

一文读懂 AI Agents 技术

想象一下：软件实体能够自主地与环境交互，根据收集的数据做出决策，并以最少的人为干预执行基于特定场景。幸好，借助 AI Agents 技术，这个现实比你想象的更接近了。这些智能代理正在彻底改变行业，并改变我们的生活方式。但是，大家可能会好奇：AI Agen...

AIGC 2023-11-20 人工智能

869阅读

关于AI和ChatGPT的使用，AI编程（AIGC），AI绘画

对于AI和ChatGPTDE使用是在科技公司实习后才真正运用，虽然在大学时期就有了解，但是由于课程和其他课外活动挤占时间，我当时没能好好研究AI，人工智能，人们往往对它的印象是高大上的，高科技，高门槛，事实真是如此吗？工作以后，受同事等环境...

AIGC 2023-11-20 人工智能

833阅读

whisper.cpp在Windows VS的编译

Whisper是OpenAI开源的一款语音识别的模型，包含有英语和多国语言的模型，根据实际情况来看，其支持的90多种语言的准确率着实表现惊艳，英文甚至可以做到3%左右的误词率，官方图表显示中文的误词率大约是14%，但是实际使用的情况来看，误词率也是相当低，...

人工智能 2023-11-20 人工智能

1365阅读

【C#】Whisper 离线语音识别（微软晓晓语音合成的音频）（带时间戳、srt字幕）...

语音合成&语音识别用微软语音合成功能生成xiaoxiao的语音。用Whisper离线识别合成的语音输出srt字幕。一、语音合成参考这个网址：https://www.bilibili.com/read/cv1906463...

人工智能 2023-11-20 人工智能

999阅读

OpenAI大动作：Whisper large-v3重塑语音识别技术

在最近的OpenAI首届开发者大会上，一个引人注目的技术亮点是Whisper large-v3的发布。这款最新的自动语音识别模型不仅在多语言识别方面取得了显著进步，而且还将很快在OpenAI的API中得到支持。今天，我们就来深入了解这个技术突破，并探讨它如...

AIGC 2023-11-19 人工智能

1651阅读

使用Python轻松识别音频中文字(Whisper)

使用Python轻松识别音频中文字一、前言在开会或是讨论问题的时候，我们总有一些内容需要记录下来。但由于各种原因，我们无法做到全面细致的记录。事后我们可能需要补充这些细节性内容，而回放视频或是录音费时费力，这时候语音识别可以帮助我们轻松解决这一...

大数据 2023-11-18 人工智能

934阅读

ChatGPT + Stable Diffusion + 百度AI + MoviePy 实现文字生成视频，小说转视频，自媒体神器！(二)

ChatGPT + Stable Diffusion + 百度AI + MoviePy 实现文字生成视频，小说转视频，自媒体神器！(二前言最近大模型频出，但是对于我们普通人来说，如何使用这些AI工具来辅助我们的工作呢，或者参与进入我们的生活，就着...

生成式AI 2023-11-18 人工智能

1114阅读

Luca.ai 网站利用 ChatGPT 向有阅读障碍的儿童教授阅读技能

Scott Sosso 因为儿子 Luca 被诊断出患有阅读障碍，经过十年的孜孜不倦探索，而开发了一个名为 Luca.ai 的网站，旨在帮助同样面临这一挑战的人们学习阅读。 Luca.ai 于 11 月 2 日正式上线，囊括了三大核心功能：StoryLa...

生成式AI 2023-11-17 人工智能

908阅读

whisper部署与使用

介绍 whisper介绍 Whisper由OpenAI发布于2022/9/21相较于ChatGPT（2022/11/30 早了两个半月。虽然影响力无法匹敌ChatGPT，但是其内在价值仍不可忽视。 Whisper的核心功能是语音识别，对应生活中可以...

生成式AI 2023-11-17 人工智能

2918阅读

AIGC：使用bert_vits2实现栩栩如生的个性化语音克隆

1 VITS2模型 1.1 摘要单阶段文本到语音模型最近被积极研究，其结果优于两阶段管道系统。以往的单阶段模型虽然取得了较大的进展，但在间歇性非自然性、计算效率、对音素转换依赖性强等方面仍有改进的空间。本文提出VITS2，一种单阶段的文本到语音模型，...

AIGC 2023-11-17 人工智能

1645阅读

Whisper JAX 语音识别本地部署

https://nlpcloud.com/zh/how-to-install-and-deploy-whisper-the-best-open-source-alternative-to-google-speech-to-text.html whispe...

人工智能 2023-11-16 人工智能

941阅读

OpenAI Whisper中文语音识别效果尝试和应用（一）

近期，OpenAI发布了Whisper语音识别模型，声称其在英语语音识别方面已接近人类水平的鲁棒性和准确性。出于对自动语音识别的兴趣，本人对此进行了一些尝试，看看它对中文语音识别的效果。本内容仅供对语音识别有兴趣或者仅仅...

大数据 2023-11-16 人工智能

1121阅读

Whisper.cpp 编译使用

Whisper.cpp 编译使用 whisper.cpp 是牛人 ggerganov 对 openai 的 whisper 语音识别模型用 C++ 重新实现的项目，开源在 github 上，具有轻量、性能高，实用性强等特点。这篇文章主要记录在 wind...

人工智能 2023-11-16 人工智能

1432阅读

基于自然语言处理技术的智能化自然语言生成技术应用于智能写作工具开发

文章目录基于自然语言处理技术的智能化自然语言生成技术应用于智能写作工具开发 1. 引言 2. 技术原理及概念 2.1 基本概念解释 2.2 技术原理介绍：算法原理，操作步骤，数学公式等...

生成式AI 2023-11-16 人工智能

833阅读

本地部署 Whisper 及 WhisperDesktop

本地部署 Whisper 及 WhisperDesktop 1. 什么是 Whisper 2. Github 地址 3. 创建虚拟环境 4. 安装 ffmpeg 5. 部署 Whisper 6. 使用 Whisper (20230514追加 W...

人工智能 2023-11-16 人工智能

2658阅读

微调Whisper语音识别模型和加速推理

前言 OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目，且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务，它们能将各种语言的语音变成文本，也能将这些文本翻译成英文。本项目主要的目的是为了对W...

生成式AI 2023-11-16 人工智能

1339阅读

微软用GPT-4V解读视频，看懂电影还能讲给盲人听，1小时不是问题

世界各地的人们每天都会创造大量视频，包括用户直播的内容、短视频、电影、体育比赛、广告等等。视频是一种多功能媒介，可以通过文本、视觉和音频等多种模态传递信息和内容。如果可以开发出能学习多模态数据的方法，就能帮助人们设计出具备强大能力的认知机器 —— 它不...

生成式AI 2023-11-15 人工智能

1068阅读

.Net 使用OpenAI开源语音识别模型Whisper

.Net 使用OpenAI开源语音识别模型 Whisper 前言 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的 Whisper 神经网络，且它亦支持其它98种语言的自动语音辨识。 Whisper系统所提供的自动语音...

生成式AI 2023-11-15 人工智能

3524阅读

面向企业的人工智能应用程序开发指南

如果开始深入研究人工智能应用程序开发过程，首先要了解这些项目与常规应用程序开发项目有何不同。谈到人工智能，每个问题都需要一个独特的解决方案，即使企业已经开发了类似的项目。一方面，有多种预训练模型和经过验证的方法可用于构建人工智能。此外，人工智能是独一无二...

大数据 2023-11-13 人工智能

875阅读

AIGC入门须知

布道 AI ，让更多普通人意识到新时代已经到来，毕竟早人一步就是红利。一、GPT 介绍一）GPT 概述 GPT 是一种自然语言处理技术的聊天机器人，它能够实现智能对话、回答用户提问、完成任务等功能。具体来说，GPT 能够通过学习语言模式、...

大数据 2023-11-12 人工智能

861阅读

浅谈文心一言

作者简介：辭七七，目前大一，正在学习C/C++，Java，Python等作者主页：七七的个人主页文章收录专栏：七七的闲谈欢迎大家点赞 ? 收藏 ⭐ 加关注哦！?? 文心一言什么是文心一言科技简介主要功能应用领域文...

AIGC 2023-11-12 人工智能

1103阅读

语音识别模型whisper的参数说明

一、whisper简介： Whisper是一种通用的语音识别模型。它是在各种音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。二、whisper的参数 1、-h, --help 查看whisper的参数...

生成式AI 2023-11-11 人工智能

898阅读

OpenAI与第三方机构合作，构建新的AI训练数据集

OpenAI最近宣布了Data Partnerships计划，旨在与第三方机构合作，创建用于AI模型训练的公共和私有数据集。这一举措旨在解决现有AI模型训练数据集中存在的问题，其中包含有毒语言和偏见。 OpenAI的目标是培养更安全、更有益于全人类的AI。...

生成式AI 2023-11-10 人工智能

795阅读

OpenAI 寻求合作伙伴生成用于训练 AI 模型的数据集

IT之家 11 月 10 日消息，OpenAI 发文宣布，将与组织合作生成用于训练 AI 模型的公共 / 私有数据集，数据合作伙伴关系旨在“让更多组织能够帮助引导 AI 的未来”并“从更有用的模型中受益”。 IT之家从博客获悉，OpenAI 称：“为了...

大数据 2023-11-10 人工智能

863阅读

使用 PAI-Blade 优化 Stable Diffusion 推理流程

背景 AIGC是人工智能计算领域里发展迅速的重要业务。Stable Diffusion 是其中最热门的开源模型，受到广泛关注。然而，随着应用场景不断扩大，Stable Diffusion所面临的推理时延和计算成本问题也越来越突出。简介 PAI-Bl...

人工智能 2023-11-10 人工智能

946阅读

AI视野：ChatGPT和API发生重大中断；GPTs分阶段推出计划延迟；中国第二批11个大模型备案获批；阿里将开源720亿参数大模型

???AI新鲜事 ChatGPT和API发生重大中断! 11月9日凌晨，OpenAI在官网发布，ChatGPT和API发生重大中断，导致全球所有用户无法正常使用，宕机时间超过2小时。OpenAI已经找到问题所在并进行了修复，但仍然不稳定，会继续进行安全监控...

生成式AI 2023-11-09 人工智能

965阅读

AIGC技术发展和应用方向

AIGC（Artificial Intelligence Generated Content）是指通过人工智能技术生成的各种文本、图像、音频和视频等多媒体内容。AIGC技术是机器学习和自然语言处理等技术的结合，通过对海量数据的学习和分析，可以让计算机模拟人...

生成式AI 2023-11-09 人工智能

951阅读

语音识别开源框架 openAI-whisper

Whisper 是一种通用的语音识别模型。它是OpenAI于2022年9月份开源的在各种音频的大型数据集上训练的语音识别模型，也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。 GitHub - yeyupiaoling/Whispe...

大数据 2023-11-08 人工智能

1433阅读

万万没想到，我用文心一言开发了一个儿童小玩具

最近关注到一年一度的百度世界大会今年将于10月17日在北京首钢园举办，本期大会的主题是“生成未来（PROMPT THE WORLD）”。会上，李彦宏会做主题为「手把手教你做AI原生应用」的演讲，比较期待 Robin 会怎么展示。据说，大会当天百度还会发布文...

人工智能 2023-11-08 人工智能

909阅读

使用MATLAB对语音信号进行采集以及读写的方法

一、语音信号特点 20世纪90年代以来，语音信号采集与分析在实用化方面取得了许多实质性的研究进展。其中，语音识别逐渐由实验室走向实用化。一方面，对声学语音学统计模型的研究逐渐深入，鲁棒的语音识别、给予语音段的建模方法及隐马尔可夫模型与人工神经网络的结合成为...

AIGC 2023-11-08 大数据

996阅读

语音识别技术发展的驱动力：语音数据的采集和处理

语音识别技术是一项基于人工智能的技术，通过计算机对人的语音进行分析和处理，将语音转化成文字，以此达到自动化处理的目的。语音识别技术的应用广泛，包括智能助手、语音导航、语音搜索、电话自动语音应答等等。但是要实现高质量的语音识别，一个非常重要的因素就是语音数据...

生成式AI 2023-11-08 大数据

1013阅读

通过100个关键词学习法来学习人工智能（AI）

100个关键词学习法是一种高效的学习方法，它的核心思想是围绕关键词（也就是重点）来进行学习。这套方法论最初由冯唐在世界顶级咨询公司中总结出来。具体来说，不论你想学习哪个行业的知识，首先需要掌握这个行业最重要的一百个关键词。这些关键词可以帮助你快速理解并掌...

人工智能 2023-11-07 人工智能

935阅读

想快速进入人工智能领域的Java程序员？你准备好了吗？

引言今天我们来探讨一下作为Java程序员，如何迅速融入人工智能的领域。，当前有一些流行的LLMs选择，例如ChatGPT、科大讯飞的星火、通义千问和文心一言等。如果你还没有尝试过这些工具，那么现在也不失为一个很好的机会，赶快体验一下吧。这些工具不仅能够...

人工智能 2023-11-07 人工智能

936阅读

科普神文，一次性讲透AI大模型的核心概念

图片令牌，向量，嵌入，注意力，这些AI大模型名词是否一直让你感觉熟悉又陌生，如果答案肯定的话，那么朋友，今天这篇科普神文不容错过。我将结合大量示例及可视化的图形手段，为你由浅入深一次性讲透AI大模型的核心概念。引言随着科技公司及国际竞争的不断推进，...

人工智能 2023-11-03 人工智能

1317阅读

vivo推出新助理“蓝心小V” 基于AI大模型打造

vivo宣布推出新助理“蓝心小V”，蓝心小V结合了vivo的AI技术，提供了多种功能，包括文案写作、AI P图、图像识别、语音识别和机器翻译等。蓝心小V支持语音、文字和拖拽三种交互方式，同时还有一个小巧的悬浮态，可以在需要时轻松打开或最小化挂起。蓝心...

AIGC 2023-11-01 人工智能

14955阅读

网络安全中的生物识别技术：加强数据保护

在当今的数字时代，广阔的互联网上不断的信息交换引发了前所未有的网络安全问题。当我们将最敏感的个人数据、金融交易甚至国家安全托付给数字系统时，对强大数据保护的需求比以往任何时候都更加重要。面对不断变化的网络威胁，传统的安全措施往往无法满足要求，例如基于密...

AIGC 2023-10-28 人工智能

921阅读

14.99万起埃安AION S MAX上市：移动大平层前排可完全躺平

快科技10月27日消息，埃安AION S MAX现已正式上市，新车共推出5款车型，售价区间为14.99-20.29万元。埃安AION S MAX整体延续了AION S Plus的造型设计，采用了分体式大灯组，造型更加细长凌厉，搭配封闭式前格栅，更显高级感...

人工智能 2023-10-27 人工智能

776阅读

三星 Galaxy S24、S24+ 和 S24 Ultra 将成为「史上最智能的 AI 手机」

三星电子有望在其即将推出的 Galaxy S24 系列手机中推出更为先进的人工智能（AI）技术，这一系列新机预计将在明年 1 月正式亮相。据 SamMobile 报道称，这三款新机——Galaxy S24、Galaxy S24+和 Galaxy S24...

人工智能 2023-10-24 人工智能

933阅读

从基础到实践，回顾 Elasticsearch 向量检索发展史

1.引言向量检索已经成为现代搜索和推荐系统的核心组件。通过将复杂的对象（例如文本、图像或声音）转换为数值向量，并在多维空间中进行相似性搜索，它能够实现高效的查询匹配和推荐。 Elasticsearch 作为一款流行的开源搜索引擎，其在向量检索方面...

人工智能 2023-10-24 人工智能

1018阅读