当前位置:AIGC资讯 > AIGC > 正文

阿里AI项目DreamTalk开源 可让人物头像说话

阿里巴巴宣布其项目DreamTalk已经开源。这个项目可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配。

模型下载地址:https://huggingface.co/damo-vilab/dreamtalk

项目地址:https://top.aibase.com/tool/dreamtalk

这个项目的开源意味着更多的开发者和研究人员可以使用这项技术,为其添加新的功能或者进行改进。DreamTalk的开源将为语音合成技术的发展带来新的动力。

DreamTalk能够生成高质量的动画,使人物脸部动作看起来非常真实。除了逼真的嘴唇动作,它还能展现丰富的表情,使动画更加生动。此外,DreamTalk支持多种语言,无论是中文、英文还是其他语言,都能很好地同步。

另外,DreamTalk还具有说话风格预测的功能,能够根据语音预测说话者的风格,并同步表情,使得动画更加贴近原始音频。此外,该框架适用于多种场景,可以用于歌曲、不同类型的肖像,甚至在嘈杂环境中也能表现良好。

更新时间 2024-01-03