语音输出 - AIGC资讯

刚刚，OpenAI开放ChatGPT高级语音模式，会50多种语言！

今天凌晨，OpenAI宣布本周内，向所有ChatGPT Plus和Team用户开放高级语音模式。除了最初功能之外，OpenAI还新增了自定义指令、语音记忆存储、5种新声音、语速以及新增了50多种语音（最初是40种），同时支持中文模式。怪不得昨天Sam...

生成式AI 2024-09-25 人工智能

1218阅读

全能大模型AIGC产品的使用体验、选择倾向与未来展望

随着人工智能技术的迅猛发展，AIGC（人工智能生成内容）领域正迎来前所未有的繁荣。其中，全能大模型产品以其强大的生成能力和广泛的应用场景，吸引了众多用户的关注。腾讯元宝APP的上线更是为这一领域注入了新的活力。本文将从个人使用体验出发，分享对全能大模型...

人工智能 2024-07-18 人工智能

992阅读

OpenAI 升级 ChatGPT 语音，使其能够以不同角色的声音说话

OpenAI正在更新 ChatGPT 的语音功能，允许用户使用各种 AI 生成的声音和声音风格与聊天机器人进行交互。 ChatGPT 目前有四种预设声音，从五种减少，因为在斯嘉丽约翰逊（Scarlett Johansson）提出法律投诉后，它不得不删除...

人工智能 2024-06-11 人工智能

932阅读

Cartesia发布低延迟语音生成模型Sonic 要复刻ChatGPT实时语音聊天？

Cartesia 发布了一个名为 Sonic 的低延迟语音生成模型，该模型以其快速的推理速度和超低的延迟引起了广泛关注。Sonic 的延迟仅为135毫秒，能够生成具有逼真情感和表达能力的语音。用户只需提供10秒的录音，Sonic 即可模仿说话者的韵律、语调...

生成式AI 2024-05-31 人工智能

958阅读

Altman被曝七宗罪，OpenAI竟欲加密GPU合作军方？员工大批离职团队濒临崩溃

【新智元导读】刚刚，有网友仔细总结了OpenAI的七宗罪，对Altman发出愤怒的诘问:为何计划跟踪GPU?为何合作军方?员工滚雪球式离职的消息不断曝出，整个对齐团队已经濒临崩溃，「说谎」「心口不一」的形象愈发鲜明，Altman正在失去民心。 OpenAI...

人工智能 2024-05-24 人工智能

873阅读

OpenAI春季发布会：这是“Moss”的诞生，我们人类究竟该何去何从

今天，OpenAI又又又又开发布会了。在大众心里，现在也基本上都知道，奥特曼是一个贼能PR的人。每一次的PR的时间点，都拿捏的极其到位，精准的狙击其他厂商。比如说上一次Sora，其实你会发现从头到尾就是一个PR的举动，2月16号发的，特么的快3个月了，...

生成式AI 2024-05-14 人工智能

819阅读

GPT搜索引擎原型曝光！新模型GPT4-Lite驱动，虽然鸽了发布会但代码已上传

OpenAI发布会前一天，员工集体发疯中……上演大型套娃行为艺术。与此同时还有小动作不断，比如现在GPT-4的文字描述已不再是“最先进的模型”，而仅仅是“先进的”。以及被鸽掉的GPT搜索引擎，原型代码上传到ChatGPT了。黑客“光头哥”Tib...

大数据 2024-05-13 人工智能

824阅读

Parler-TTS官网体验入口 AI语音生成工具免费使用地址

Parler-TTS是一个由 Hugging Face 开发的轻量级文本转语音（TTS）模型，能够以给定说话者的风格（性别、音调、说话风格等）生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Na...

生成式AI 2024-04-11 人工智能

829阅读

微软升级Azure AI语音服务推出9种更真实的AI语音

微软近期对其Azure AI语音服务进行了重大升级，推出了9种新的更真实的AI语音，旨在为用户带来更加自然和沉浸式的对话体验。这次升级的核心是引入了零样本学习（Zero-shot）的文本到语音(TTS 模型，这些模型在提高合成语音自然度的同时，更好地模仿了...

人工智能 2024-04-02 人工智能

948阅读

GPT-5史诗级更新之前，OpenAI的“新东西”来了，曝定价百万字符15美元，语音克隆引擎让老外说“有口音的”中文

撰稿 | 伊风出品 | 51CTO技术栈（微信号：blog51cto） OpenAI的新动作来了！此前Altman在采访中透露，在GPT-5史诗级的升级发布之前，OpenAI将在未来几个月发布许多“很酷的新东西”。今天，OpenAI语音引擎首次亮...

人工智能 2024-04-01 人工智能

833阅读

OpenAI推出声音克隆新技术：复刻你的声音仅需15秒

快科技3月31日消息，据媒体报道，OpenAI公司最近推出了一项革命性的声音克隆技术Voice Engine”。据悉，Voice Engine通过文本输入和15秒的音频样本，便能生成与原始说话者声音极为相似、情感丰富且自然逼真的语音。这一技术的研发始于...

大数据 2024-03-31 人工智能

801阅读

MyShell AI开发高质量语音合成工具MeloTTS 支持中英混合发音

MeloTTS是由MyShell AI开发的一个高质量的多语言文本到语音（TTS）库。这个库支持英语、西班牙语、法语、中文、日语和韩语等多种语言，使其在全球范围内具有广泛的应用价值。项目地址:https://top.aibase.com/tool/me...

AIGC 2024-02-27 人工智能

906阅读

2023-12-12 AIGC-AI工具的基本工作原理

摘要: 2023-12-12 AIGC-AI工具的基本工作原理 AI工具的基本工作原理 AI工具的基本工作原理涉及到一系列复杂的技术和算法。这些原理可以根据不同类型的AI工具进行概括，包括机器学习、自然语言处理、图像识别等。以下是一些关键的A...

AIGC 2024-02-06 人工智能

1254阅读

ChatLaw：基于LLaMA微调的法律大模型

文章目录动机数据组成模型框架模型评估北大团队发布首个的中文法律大模型落地产品ChatLaw，为大众提供普惠法律服务。模型支持文件、语音输出，同时支持法律文书写作、法律建议、法律援助推荐。 github地址：https://g...

大数据 2024-02-05 人工智能

1575阅读

ElevenLabs官网体验入口 AI语音生成软件app免费在线使用地址

ElevenLabs是一款先进的文本转语音和语音克隆软件，可根据需要生成任何语音、风格和语言的高质量音频。它适用于内容创作者、游戏开发者、出版商等需要通过语音内容传达故事和信息的用户。该软件以其高质量语音合成、语音克隆和多语言支持的强大功能而闻名。现在El...

人工智能 2024-01-25 人工智能

1351阅读

2023 巅峰之作 | AIGC、AGI、GhatGPT、人工智能大语言模型的崛起与挑战

文章目录 01 《ChatGPT 驱动软件开发》内容简介 02 《ChatGPT原理与实战》内容简介 03 《神经网络与深度学习》 04 《AIGC重塑教育》内容简介 05 《通用人工智能》目录 2023年是人工智能大...

人工智能 2024-01-06 人工智能

835阅读

2023年度佳作：AIGC、AGI、GhatGPT、人工智能大语言模型的崛起与挑战

目录前言 01 《ChatGPT 驱动软件开发》内容简介 02 《ChatGPT原理与实战》内容简介 03 《神经网络与深度学习》 04 《AIGC重塑教育》内容简介 05 《通用人工智能》目录前言 202...

AIGC 2024-01-06 人工智能

1051阅读

AIGC + RTE，一个实时互动的应用实践

一夜之间，区块链、元宇宙、Web3、VR等风口似乎都消散了，似乎只有 AI 才是C位。声网 RTC + 云市场各类插件 + AIGC，会迸发出什么样的火花呢？最近，声网内部组织了一次黑客松，经过激烈的角逐，我们团队荣获冠军。接下来，我们来介绍下我们的项...

大数据 2023-12-25 人工智能

806阅读

六大赛道十项技术：智能体、3D生成引爆AI，空间计算开启终端变革

两千年前的古人穿越到一千年前后，需要适应的东西可能不多。而一千前的古人穿越到一百年前，变化也不至于大到难以适应。但如果一百年前的古人穿越到现在，甚至只是有人“冬眠”10年、20年，面对的现实世界的变化，恐怕会是天翻地覆。日新月异的技术进步，正不断带来颠覆...

大数据 2023-12-14 人工智能

813阅读

基于科大讯飞AIGC创作平台，构建数字人虚拟主播

笔者为体验目前数字人虚拟主播创作视频的质量，特意制作了一段测试视频。基于讯飞智作创建总体感受，数字人虚拟主播具有成本低、可定制性强等优点，但是也存在缺乏人情味、技术限制和法律问题等缺点。因此，在使用数字人虚拟主播时需要注意这...

生成式AI 2023-12-01 人工智能

1002阅读

微软Azure文本转语音官网地址入口 AzureAI配音语音朗读怎么使用

微软Azure的文本转语音服务为开发者提供了一个高度可定制、易于集成的解决方案，使应用程序能够具备高质量的语音输出功能。无论是创建交互式应用、增强用户体验还是构建自定义品牌语音，Azure文本转语音都能提供强大的支持。微软Azure文本转语音官网地址入...

AIGC 2023-11-28 人工智能

988阅读

【C#】Whisper 离线语音识别（微软晓晓语音合成的音频）（带时间戳、srt字幕）...

语音合成&语音识别用微软语音合成功能生成xiaoxiao的语音。用Whisper离线识别合成的语音输出srt字幕。一、语音合成参考这个网址：https://www.bilibili.com/read/cv1906463...

人工智能 2023-11-20 人工智能

996阅读

微软发布声音克隆技术Personal Voice 提供1分钟样本即可生成AI语音

微软近日发布了一项名为Personal Voice的新技术，该技术可以克隆用户的声音，并且能够复制出与原声音完全一致的人工智能语音。用户只需提供1分钟的语音样本，Personal Voice就能在几秒钟内生成相应的AI语音。这项技术支持多达100种不同语...

AIGC 2023-11-17 人工智能

974阅读