Parler-TTS是一个由 Hugging Face 开发的轻量级文本转语音(TTS)模型,能够以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作复现,两位作者分别来自 Stability AI 和爱丁堡大学。与其他TTS模型不同,Parler-TTS完全开源发布,包括数据集、预处理、训练代码和权重。功能包括:生成高质量且自然 sounding 的语音输出、灵活的使用和部署、提供丰富的注释语音数据集。定价:免费。
点击前往Parler-TTS官网体验入口
Parler-TTS是一个优质的新品,提供了生成高质量且自然 sounding 的语音输出的工具。您可以通过定制特定说话者风格来生成自己需要的语音。此工具还提供了丰富的注释语音数据集,让您从中受益。
使用场景示例:
用于定制化说话者风格的语音生成
快速部署并使用自然 sounding 的语音输出
训练和改进TTS模型的丰富资源
产品特色:
生成高质量且自然 sounding 的语音输出
根据给定说话者的风格进行定制
易于使用的安装和部署方法
提供开源注释语音数据集