音频模型 - AIGC资讯

【xinference】（3）：在autodl上，使用xinference部署whisper-tiny音频模型，并成功将语音转换成文本，测试成功，还支持音频直接翻译成英文

1，视频地址 https://www.bilibili.com/video/BV1Z7421K7vL/ 【xinference】（3）：在autodl上，使用xinference部署whisper-tiny音频模型，并成功将语音转换成...

生成式AI 2024-08-09 人工智能

2185阅读

AI日报：字节推王炸级语音生成模型Seed-TTS；Suno新功能被Udio抢跑；腾讯发布开源混元DiT加速库；即梦全量上线实时画布功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、字节推语音生成模型Seed-T...

人工智能 2024-06-06 人工智能

964阅读

Stability AI发布AI音频模型Stable Audio Open：支持文本生成鼓点、乐器等音效

Stability AI 今天发布了 Stable Audio Open1.0，这是其音频领域的新一款生成 AI 模型。Stability AI 以稳定扩散文本到图像生成 AI 技术而闻名，但这只是该公司产品组合的一部分。该公司在2023年首次推出了 St...

AIGC 2024-06-06 人工智能

1083阅读

AI日报：SD 3宣布开源；中文语音AI天花板ChatTTS官网上线；Veo支持单图生成视频；ElevenLabs推多样化AI音频模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、抖音：将打击使用AI技术P图侮...

人工智能 2024-06-03 人工智能

945阅读

ElevenLabs推出创新AI音频模型可生成各种音效

ElevenLabs最近推出了一款创新的AI音频模型，这一技术允许用户仅通过文本提示就能生成各种音效、短乐器曲目、音景和各种角色声音。这项技术的应用范围非常广泛，尤其对以下领域的专业人士来说是一个巨大的福音: 内容创作者:无论是制作YouTube视频、播客...

AIGC 2024-06-03 人工智能

1053阅读

开源模型穷途末路？Stability AI欠下1亿美元，四处找钱

曾经创造出Stable Diffusion系列模型的Stability AI，目前面临前所未有的财务危机。这个曾经有10亿美元估值，却只有180名员工的明星初创公司正在考虑出售，并积极与潜在买家接触。有知情人士表示，Stability AI曾私下联系...

大数据 2024-05-17 人工智能

823阅读

Stability AI发布音频模型 Stable Audio2.0:支持生成多种类型音乐时长达3分钟

著名开源大模型平台 Stability.ai 在官网正式发布了音频模型 Stable Audio2.0。这一版本支持用户通过文本或音频生成多种类型的高质量音乐，时长可达3分钟44.1kHz。相较于之前的版本，Stable Audio2.0采用了 Dif...

人工智能 2024-04-04 人工智能

772阅读

LLM将成历史？开源bGPT或颠覆深度学习范式：直接模拟二进制，开启模拟数字世界新纪元！

微软亚洲研究院推出的最新成果bGPT，这种基于字节的Transformer模型，为我们探索数字世界开辟了新的大门。与传统的基于词表的语言模型不同，bGPT的独特之处在于其对原始二进制数据的直接处理能力，不受特定格式或任务的限制，其目标是全面模拟数字世界...

AIGC 2024-03-13 人工智能

843阅读

不依赖token，字节级模型来了！直接处理二进制数据

最新GPT，不预测token了。微软亚研院等发布bGPT，仍旧基于Transformer，但是模型预测的是下一个字节（byte）。通过直接处理原生二进制数据，bGPT将所有输入内容都视为字节序列，从而可以不受限于任何特定的格式或任务。能预测CPU...

大数据 2024-03-11 人工智能

732阅读

不依赖Token，字节级模型来了！直接处理二进制数据

最新GPT，不预测token了。微软亚研院等发布bGPT，仍旧基于Transformer，但是模型预测的是下一个字节（byte）。通过直接处理原生二进制数据，bGPT将所有输入内容都视为字节序列，从而可以不受限于任何特定的格式或任务。能预测CPU...

大数据 2024-03-11 人工智能

735阅读

720亿参数大模型都拿来开源了！通义千问开源全家桶，最小18亿模型端侧都能跑

「Qwen-72B 模型将于 11 月 30 日发布。」前几天，X 平台上的一位网友发布了这样一则消息，消息来源是一段对话。他还说，「如果（新模型）像他们的 14B 模型一样，那将是惊人的。」有位网友转发了帖子并配文「千问模型最近表现不错」。这句话...

大数据 2023-12-01 人工智能

955阅读

通义千问开源720亿参数大模型Qwen-72B

通义千问在开源领域迎来重大突破，推出了一系列全家桶模型，包括参数从18亿到720亿的多款模型，涵盖了各种应用场景。其中，Qwen-72B模型的开源在性能上实现了突破，成为目前性能最强的开源模型之一。在多个权威基准测评中，Qwen-72B表现出色，超越了同规...

生成式AI 2023-12-01 人工智能

980阅读

AIGC音乐的中场战事：从技术、产品到商业规则

最近，谷歌围绕着AIGC音乐打出了一套“组合拳”。 11月16日，谷歌旗下 DeepMind发布了最新的AIGC音乐生成模型Lyria，并与YouTube合作打造了两个重要应用场景:Dream Track和Music AI tools。同时，谷歌和YouT...

人工智能 2023-11-23 人工智能

884阅读

谷歌 Deepmind 推出 Lyria AI 音频模型，可生成带有乐器和人声的音乐

11 月 21 日消息，Deepmind 日前推出了一款名为 Lyria 的音频模型，可用于生成带有乐器和人声的音乐。此外 Deepmind 还通过与 YouTube 合作，整合 Lyria 模型开发了音乐创作工具 Dream Track，声称可令...

生成式AI 2023-11-21 人工智能

880阅读