音频驱动 - AIGC资讯

AIGC产品对比分析，讯飞智作、曦灵百度、蝉镜、有道小采样数字人

AIGC产品对比分析 AIGC 产品是基于人工智能技术生成的内容，包括文字、图片、音频、视频等。本文分析产品包括：讯飞智作、曦灵-百度、蝉镜、有道小采样数字人。产品价格对比 AIGC 产品以生成视频的时间长度作为计费标准，这一方式在当前...

AIGC 2024-09-25 人工智能

2482阅读

全网最强数字人大盘点，一口气看完！（整合包）

AI绘画的发布者，Stability AI经常传出即将倒闭。国内外大模型的巨头们，更是已经卷成了一锅粥。现在很多大模型的接口调用，已经卷成了白菜价，1块钱就可以生成几本红楼梦，这还咋赚钱呢？！然鹅，数字人在AI圈，那可是实实在在可能带来巨大收益！咱...

生成式AI 2024-08-18 人工智能

1274阅读

一键音频驱动图片数字人项目——EchoMimic(附整合包)

大家好，今天要给大家带来一个数字人相关项目——EchoMimic。该项目是由蚂蚁集团支付宝终端技术部出品，只需要一段音频和一个参考图片，EchoMimic就能让图片中的人物“活”起来。我已制作好一键启动整合包和云端一键部署镜像方便大家快速上手体验！...

大数据 2024-08-17 人工智能

2145阅读

EchoMimic：蚂蚁开源逼真数字人框架，表情口型更生动自然，本地部署包获取

EchoMimic：逼真的音频驱动人像动画 EchoMimic简介近日蚂蚁开源了一款名为：EchoMimic 数字人的框架。EchoMimic能够通过单独的音频文件和一张静态面部标志点的图像生成数字人像视频，也可以通过音频和选定的面部标志点的...

人工智能 2024-08-16 人工智能

1811阅读

免费开源 | AI绘画数字人工具合集大放送！六款超强AI数字人工具使用测评！

在数字化浪潮汹涌澎湃的今天，技术的飞速发展正以前所未有的方式重塑着我们的生活、工作与娱乐体验。其中，“数字人”作为这一时代浪潮中的璀璨明珠，正逐步从科幻电影走进现实，成为连接物理世界与数字世界的桥梁。数字人，这一融合了人工智能、计算机图形学、深度学习、...

人工智能 2024-08-05 人工智能

2546阅读

AIGC生成论文汇总

1.1 无特定身份人物生成（Non-identity Generation） (1 变分自动编码器（Variational Auto-Encoder） 2022, CVPR,Shunyu Yao, RuiZhe Zhong, Yichao Ya...

大数据 2024-07-08 人工智能

961阅读

央视点赞国产AI复活召唤术，兵马俑竟与宝石老舅对唱Rap？

沉睡了两千多年的兵马俑，苏醒了? 一句秦腔开场，将我们带到了黄土高原。如果不是亲眼所见，很多观众可能难以想象，有生之年还能看到兵马俑和宝石 Gem 同台对唱《从军行》。「青海长云暗雪山，孤城遥望玉门关。」古调虽存音乐变，声音依旧动人情: 这场表演背后的...

生成式AI 2024-07-04 人工智能

1121阅读

霉霉开口唱碧昂丝的歌，又是AI！口型不出戏，五官姿态也自然，复旦百度等出品｜GitHub揽星1k+

一张人像、一段音频参考，就能让霉霉在你面前唱碧昂丝的《Halo》。一种名为Hallo的研究火了，GitHub已揽星1k+。话不多说，来看更多效果: 不论是说话还是唱歌，都能和各种风格的人像相匹配。从口型到眉毛眼睛动作，各种五官细节都很自然。单独...

大数据 2024-06-18 人工智能

932阅读

一张图即出AI视频！谷歌全新扩散模型，让人物动起来

只需一张照片，和一段音频，就能直接生成人物说话的视频！近日，来自谷歌的研究人员发布了多模态扩散模型VLOGGER，让我们朝着虚拟数字人又迈进了一步。论文地址：https://enriccorona.github.io/vlogger/paper.p...

生成式AI 2024-03-28 人工智能

843阅读

AniPortrait官网体验入口腾讯AI音频驱动人脸动画生成工具免费使用地址

AniPortrait是一个根据音频和图像输入生成会说话、唱歌的动态视频的项目。它能够根据音频和静态人脸图片生成逼真的人脸动画，口型保持一致。支持多种语言和面部重绘、头部姿势控制。功能包括音频驱动的动画合成、面部再现、头部姿势控制、支持自驱动和音频驱动的视...

生成式AI 2024-03-28 人工智能

1350阅读

VLOGGER官网体验入口 AI视频生成工具在线使用地址

VLOGGER是一种从单张人物输入图像生成文本和音频驱动的讲话人类视频的方法，它建立在最近生成扩散模型的成功基础上。我们的方法包括1 一个随机的人类到3D运动扩散模型，以及2 一个新颖的基于扩散的架构，通过时间和空间控制增强文本到图像模型。这种方法能够生成...

生成式AI 2024-03-14 人工智能

991阅读

商汤用AI复活了汤老师

在商汤2024年年会上，汤晓鸥数字人现身，来了一场跨越时空的重逢。按照以往习惯，每年汤老师都会说上一段脱口秀，已经成为商汤年会保留节目。熟悉汤老师演讲都知道，他是被人工智能事业耽误的“脱口秀大师”，如今以数字人的形象，再度用幽默的方式与我们相见。除了...

AIGC 2024-03-04 人工智能

921阅读

AI视频又炸了！照片+声音变视频，阿里让Sora女主唱歌小李子说RAP

Sora之后，居然还有新的AI视频模型，能惊艳得大家狂转狂赞！图片有了它，《狂飙》大反派高启强化身罗翔，都能给大伙儿普法啦（狗头）。这就是阿里最新推出的基于音频驱动的肖像视频生成框架，EMO（Emote Portrait Alive）。有了它，...

AIGC 2024-02-29 人工智能

890阅读

AIGC音视频工具分析和未来创新机会思考

编者按：相较于前两年，2023年音视频行业的使用量增长缓慢，整个音视频行业遇到瓶颈。音视频的行业从业者面临着相互竞争、不得不“卷”的状态。我们需要进行怎样的创新，才能从这种“卷”的状态中脱离出来？LiveVideoStack 2023上海站邀请到了P...

人工智能 2024-02-18 人工智能

955阅读