嘴唇运动 - AIGC资讯

【AIGC数字人】EchoMimic:基于可编辑关键点条件的类人音频驱动肖像动画

GitHub：https://github.com/BadToBest/EchoMimic 论文： https://arxiv.org/pdf/2407.08136 comfyui： https://github.com/smthemex/ComfyU...

大数据 2024-10-04 人工智能

1873阅读

小心悄悄话被AI听见!（嘘）最近国外一款可以读唇语的AI软件火了! 具体效果如下: 红毯上布莱克·莱弗利小声说:“好紧张”，笑着说话时肉眼很难分辨唇语，但AI可以。乍一看只能看见一排白牙（bushi）的侃爷，唇语也能被轻松破解。看完后网友们开始纷...

大数据 2024-09-12 人工智能

1301阅读

一张人像、一段音频参考，就能让霉霉在你面前唱碧昂丝的《Halo》。一种名为Hallo的研究火了，GitHub已揽星1k+。话不多说，来看更多效果: 不论是说话还是唱歌，都能和各种风格的人像相匹配。从口型到眉毛眼睛动作，各种五官细节都很自然。单独...

大数据 2024-06-18 人工智能

921阅读

只需一张照片，和一段音频，就能直接生成人物说话的视频！近日，来自谷歌的研究人员发布了多模态扩散模型VLOGGER，让我们朝着虚拟数字人又迈进了一步。论文地址：https://enriccorona.github.io/vlogger/paper.p...

生成式AI 2024-03-28 人工智能

836阅读

1 以DiffusionVideoEditing为baseline：改进方向针对于自回归训练方式可能导致的漂移问题：训练时，在前一帧上引入小量的面部扭曲，模拟在生成过程中自然发生的扭曲。促使模型查看身份帧以进行修正。在像VoxCeleb或L...

人工智能 2024-02-01 人工智能

1035阅读

当你和朋友隔着冷冰冰的手机屏幕聊天时，你得猜猜对方的语气。当 Ta 发语音时，你的脑海中还能浮现出 Ta 的表情甚至动作。如果能视频通话显然是最好的，但在实际情况下并不能随时拨打视频。如果你正在与一个远程朋友聊天，不是通过冰冷的屏幕文字，也不是缺乏表情...

生成式AI 2024-01-07 人工智能

823阅读

概览简介 FaceChain 是一个可以用来打造个人数字形象的深度学习模型工具平台。用户仅需要提供最低一张照片即可获得属于自己的个人形象数字替身。结合不同的风格模型和写真模版，可以生成超乎想象空间的个人写真作品。更有意思的...

人工智能 2023-12-29 人工智能

993阅读

一段音频+一张照片，瞬间照片里的人就能开始讲话了。生成的讲话动画不但口型和音频能够无缝对齐，面部表情和头部姿势都非常自然而且有表现力。而且支持的图像风格也非常的多样，除了一般的照片，卡通图片，证件照等生成的效果都非常自然。再加上多语言的支持，瞬间照...

AIGC 2023-12-13 人工智能

1069阅读

一、概览简介： facechain是一个可以用来打造个人数字形象的深度学习模型工具平台。用户仅需要提供最低一张照片即可获得属于自己的个人形象数字替身。结合不同的风格模型和写真模版，可以生成超乎想象空间的个人写真作品。更有意思的是，facecha...

人工智能 2023-12-10 人工智能

978阅读