-
半年涨粉1000万,这个AI聊天搭子是怎么火的
最近,很多快手用户都能发现,一个名叫「AI小快」的账号格外活跃。 在视频作品的评论区,经常有人跟「AI小快」聊得火热,一个抛梗、一个接梗: 如果你问点严肃问题,AI小快一样有问必答: 没看明白的视频,还能帮忙解读: 甚至还有离谱之中带有一丝合理的扩...
-
清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频
生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。这款模型是国内首个达到Sora级别的视频大模型,标志着中国在视频生成技术领域的重要进展。 Vidu的主要特点和技术创新包括: 模型结构...
-
终局之战!OpenAI Sora大佬专访:AI视频模型仍处在GPT-1时代
【新智元导读】Sora一出,谁与争锋!近日,Sora团队的三位负责人Aditya Ramesh、Tim Brooks和Bill Peebles接受了采访,解读了Sora在模拟现实、预测结果和丰富人类体验等方面带来的变革。 对于视频生成领域,大家一致的看法就...
-
阿里AI模型EMO免费上线通义APP 一张照片即可开口唱歌说话
阿里云宣布,EMO模型成功在通义APP中上线,并且完全开放给所有用户免费使用。 如今,在通义千问APP内,用户只需简单三步操作:选择模版、上传照片、生成视频,即可轻松实现照片中人物演戏唱歌的神奇效果。 通义APP首批上线了多达80个EMO模板,涵盖了热门歌...
-
AI日报:阿里对口型视频项目EMO开启内测;苹果官宣端侧小模型OpenELM;Open-Sora偷偷升级;微信发布AI工具小微助手
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、阿里对口型项目EMO开启内测...
-
Open-Sora全面开源升级:支持16s视频生成和720p分辨率
Open-Sora 在开源社区悄悄更新了,现在支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。我们来试试效果。 生成个横屏圣诞雪景,发b站 再生成个竖屏,发...
-
AI视频生成工具ID-Animator:可保持角色一致生成视频动画
近年来,生成具有指定身份的高保真人类视频引起了广泛关注。然而,现有技术在训练效率和身份保持之间往往难以取得平衡,要么需要繁琐的逐案微调,要么在视频生成过程中通常会丢失身份细节。研究提出了一种名为 ID-Animator 的零样本人类视频生成方法,可以在无需...
-
AI电影制作平台Morph Studio正式向候补用户开放访问权限
今日起,备受期待的AI电影制作平台Morph Studio开始向候补用户开放访问权限。这一消息一出,立即引发了广大用户的热烈反响。 Morph Studio官方表示,该平台将很快加入视频生成角色一致性和配音生成功能。这两个功能的加入,无疑将为平台的用户体验...
-
AI刘强东007带货,背后大模型也就10亿参数,京东:我家数字人平均水平
京东创始人刘强东啊,他昨天又加班了。 准确来说,是他的AI数字人形象“采销东哥”,昨晚开启了自己生涯第四场直播。 这次东哥干的是图书采销工作。 与上两次直播不同,这一回直播间不仅有了数字人助理,还有多机位切换等展现方式。与此同时,和留言区及屏幕前观众的互...
-
商汤港股涨超34% 昨日推出AI大模型“日日新5.0”
商汤港股今日表现强势,涨幅显著扩大至34%,股价报0.820港元,总市值跃升至274.45亿港元。这一涨幅不仅彰显了市场对商汤科技的强烈信心,也反映出其业务的持续发展和强大潜力。 就在昨日,商汤科技在北京盛大举行新品发布会,正式推出了人工智能大模型“日日...
-
这个AI赛道,一个月内融资4笔,一大半的创始人是华人
声明:本文来自微信公众号“白鲸出海”(ID:baijingapp),作者:张凯然,授权站长之家转载发布。 仅在2024年3月一个月,就有三个华人创立的 AI 视频生成创企获得了融资,而且融资额都过了千万美金。 1、3月7日,总部位于英国伦敦的Haiper宣...
-
PR+AI重新定义视频剪辑,Sora、Pika全接入,AI视频创企还有的玩吗?
还记得网友们用PS的Generative Fill花式整活的盛况吗? 接下来,被网友玩坏的可能要轮到PR了。 无论你是专业的视频剪辑师,还是业余爱好者,对Premiere Pro(简称PR)这款软件都一定不陌生。 前几天,Adobe官方发布了一条视频,快...
-
AI日报:Model3模型重磅发布;阿里云全面支持Llama 3训练推理;Gorq推出iOS应用;批量去水印工具VSR来了
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Blockade Labs发布...
-
商汤科技将发布「日日新 SenseNova 5.0」大模型
商汤科技宣布,将于明日推出全新版本的「日日新5.0」,继续带来技术的创新和突破。 日日新(SenseNova)是商汤科技推出的大模型体系,包括自然语言处理模型 “商量”(SenseChat 、文生图模型 “秒画” 和数字人视频生成平台 “如影”(Sens...
-
Krea AI将推视频生成功能 界面更加简洁美观了
Krea AI即将推出的视频生成功能,无疑将为设计领域带来新的革命。这个功能的推出,将使得用户能够轻松地生成高质量的视频内容,无论是用于广告、电影、游戏概念设计,还是用于社交媒体分享,都将变得非常方便。 产品入口:https://top.aibase.c...
-
LiDAR仿真新思路 | LidarDM:助力4D世界生成,仿真杀器~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:LidarDM: Generative LiDAR Simulation in a Generated World 论文链接:https://arxiv.org/pdf/2404.02903....
-
Adobe以每分钟3美元的价格购买视频,构建AI模型
Adobe公司最近开始采购视频,用于构建其人工智能文本到视频生成器,此举是为了在OpenAI展示出类似技术之后与竞争对手保持同步。 据了解,该软件公司向其摄影师和艺术家网络提供报酬,以提交涉及人们进行日常活动(如行走)或表达情感(包括喜悦和愤怒 的视频,以...
-
好低调!字节Dreamina全面开放内测了,效果够惊艳吗?Ta眼中的“Sora女士”原来是这样!
字节Dreamina的内测范围扩大了!一个月前小编填写过一次内测收集问卷,当时并未拿到初始100人(据说)的名额。 图片 但在今天上午再次申请后,下午便惊喜地发现已经开通了Dreamina的文生视频功能! 再次申请只需选择两个问题,一是有无AI视频产品的...
-
MagicTime官网体验入口 AI生成延时视频软件使用地址
MagicTime是一种基于文本描述生成高质量变化视频的模型。它通过学习时间流逝视频中的物理知识,实现了高度逼真的变化过程模拟。该模型包括MagicAdapter、Dynamic Frames Extraction和Magic Text-Encoder三个...
-
OpenAI 寻求联合好莱坞,开拓电影产业
人工智能初创公司 OpenAI 正努力进军电影行业。据知情人士透露,OpenAI 已安排在下周洛杉矶与好莱坞工作室、媒体高管和经纪人会面,以建立在娱乐产业的合作伙伴关系,并鼓励电影制片人将其新的 AI 视频生成器融入作品中。 图源备注:图片由AI生成,图...
-
“音乐版Sora”首批演示泄露,网友:比写《宫保鸡丁》的Suno好10倍
这两天,一个神秘的“音乐版Sora”产品被盛传即将发布,Suno和它比起来都不算什么。 知情者评价be like: 比Suno强两倍。 模型相当强悍。 人工智能音乐很快就会席卷全球。 (Suno:刚刚火爆的一款AI音乐创作工具,火到200多名音乐人...
-
DreaMoving可控制AI视频生成框架使用地址 阿里dreamoving官方入口
DreaMoving是什么? DreaMoving是阿里一个基于扩散模型的可控制视频生成框架,用于生成高质量的定制人类舞蹈视频。通过给定目标身份和姿势序列,DreaMoving可以生成一个目标身份的视频,驱动姿势序列在任何地方跳舞。该模型易于使用,并可适...
-
攻陷短视频后,Sora将需要72万块H100 GPU
OpenAI 推出的 Sora 模型能够在各种场景下生成极其逼真的视频,吸引了全世界的目光。 近日,投资机构 factorial funds 发表了一篇博文,深入探讨了 Sora 背后的一些技术细节,并对这些视频模型可能产生影响进行了探讨。 最后,文中还...
-
值得你花时间看的扩散模型教程,来自普渡大学
想了解更多AIGC的内容: 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 扩散模型(Diffusion Model)是图像生成模型的一种。有别于此前 AI 领域大名鼎鼎的 GAN、VAE 等算法,扩散模型另辟...
-
谷歌发布超强AI视频编辑工具!施展魔法的VLOGGER,音频加图片就搞定唇形和手势,还把表情编辑玩出花了!
出品 | 51CTO技术栈(微信号:blog51cto) 编译丨伊风 视频生成模型的脚步永不停歇! 图片 4月2日,谷歌刚刚发布了强到可怕的AI视频编辑工具VLOGGER。VLOGGER就像收集了很多视频生成领域的前沿AI技能,而打造出的一款百宝箱...
-
首个开源世界模型!百万级上下文,长视频理解吊打GPT-4,UC伯克利华人一作
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 首个开源「世界模型」来了! 来自UC berkeley的研究人员发布并开源了LWM(LargeWorldModel)系列模型: 论文...
-
社交媒体与AIGC:如何改变内容创作与推荐
1.背景介绍 社交媒体平台已经成为现代人们交流、分享和获取信息的重要来源。随着人工智能(AI 和机器学习技术的发展,社交媒体平台也开始广泛地采用这些技术来改善内容创作和推荐。这篇文章将探讨如何将人工智能生成式(AIGC 技术与社交媒体平台结合,从...
-
这5款国内可用的宝藏AI绘画工具,不允许有人还不知道!
分享 5 个国内热门的 AI 绘画工具。 目前国内的 AI 创作工具已经非常多了。今天单就 AI 在线图片创作这个方向,挖一下国内有哪些热门的 AI 创作工具。 通过整理,发现有一些 AI 工具,还真的挺好用的,分享给大家。 一、奇域AI 奇域A...
-
居然才发现!字节跳动旗下国产AI绘画工具Dreamina,这么好用居然还免费!(强烈推荐)
昨天看到群里说,剪映旗下类似 Sora 的 AI 视频生成工具 Dreamina 开放内测申请了,于是申请了下,顺道发现 Dreamina 还是一个宝藏的 AI 绘画工具。 Dreamina 是剪映旗下的一个 AI 创作平台,目前支持「图片生成」功能,也...
-
腾讯开源视频生成新工具,论文还没发先上代码的那种
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 先上代码再发论文,腾讯新开源文生视频工具火了。 名为MuseV,主打基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成。 老规矩,先看...
-
MuseV官网体验入口 虚拟人AI视频生成软件使用地址
MuseV是一个基于扩散模型的虚拟人视频生成框架,支持无限长度视频生成,采用了新颖的视觉条件并行去噪方案。它提供了预训练的虚拟人视频生成模型,支持Image2Video、Text2Image2Video、Video2Video等功能,兼容Stable Di...
-
更智能的广告素材生成!看A/B测试如何驱动AIGC素材调优
更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 前言:AIGC 大爆发,引发广告营销行业变革 ChatGPT 等 AI 产品引发的 AIGC 大爆发引起了各行业的震动,其中以图片生成甚至视频生成技术的效果和...
-
抵制过AI的好莱坞能接受Sora?
AI生成视频模型Sora刚诞生一个月,创建者OpenAI计划将之推向好莱坞,建议将Sora应用到电影制作中。最近几周,OpenAI一直与洛杉矶多家影视公司和媒体的高管积极沟通。 先是2月中旬OpenAI公布Sora期间,一些影视行业从业者获得了该模型的内测...
-
52个AIGC视频生成算法模型介绍
基于Diffusion模型的AIGC生成算法日益火热,其中文生图,图生图等图像生成技术普遍成熟,很多算法从业者开始从事视频生成算法的研究和开发,原因是视频生成领域相对空白。 AIGC视频算法发展现状 从2023年开始,AIG...
-
AIGC工具系列之——基于OpenAI的GPT大模型搭建自己的AIGC工具
今天我们来讲讲目前非常火的人工智能话题“AIGC”,以及怎么使用目前的AI技术来开发,构建自己的AIGC工具什么是AIGC? AIGC它的英文全称为(Artificial Intelligence Generated Content ,中文翻译过来就是“人...
-
太卷了!字节最新AI神器Dreamina开放试用 4秒AI视频生成国内最强(附Dreamina详细使用教程)
最近,字节的生成式视频软件Dreamina正式开始内测,小编昨天也通过了审核,可以体验Dreamina的视频生成功能。 小编简单体验了下,Dreamina整体的操作会比较简单,对小白也比较友好,可以说是国内4秒A...
-
Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩
近日,由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作 Champ 火爆全网。该模型仅开源 5 天 GitHub 即收获 1k 星,在 Twitter 更是「火出圈」,吸引了大量博主二创,浏览量总量达到 300K。 目前 Champ 已经开源...
-
一张图即出AI视频!谷歌全新扩散模型,让人物动起来
只需一张照片,和一段音频,就能直接生成人物说话的视频! 近日,来自谷歌的研究人员发布了多模态扩散模型VLOGGER,让我们朝着虚拟数字人又迈进了一步。 论文地址:https://enriccorona.github.io/vlogger/paper.p...
-
NoLang官网体验入口 AI技术自动生成解释视频工具软件免费使用地址
NoLang是一款基于AI技术的解释视频生成工具。用户可以根据输入的文本或文档内容,实时生成解释性的视频。主要功能包括:文本到视频的实时转换,PDF文件等资料的自动视频化汇总,可持续对话形式生成视频,通过浏览器扩展程序随时调用使用。NoLang的优势在于让...
-
AniPortrait官网体验入口 腾讯AI音频驱动人脸动画生成工具免费使用地址
AniPortrait是一个根据音频和图像输入生成会说话、唱歌的动态视频的项目。它能够根据音频和静态人脸图片生成逼真的人脸动画,口型保持一致。支持多种语言和面部重绘、头部姿势控制。功能包括音频驱动的动画合成、面部再现、头部姿势控制、支持自驱动和音频驱动的视...
-
Stable Diffusion~自注意力替换技术
在这篇文章中,作者展示了一个较为复杂的基于 Diffusers 开发的自注意力替换示例项目,用于提升 SD 视频生成的一致性。在这个过程中,作者讲述了 AttentionProcessor 相关接口函数的使用,并了解了如何基于全局管理类实现一个代码可维护性...
-
两分钟1200帧的长视频生成器StreamingT2V来了,代码将开源
广阔的战场,风暴兵在奔跑…… prompt:Wide shot of battlefield, stormtroopers running... 这段长达 1200 帧的 2 分钟视频来自一个文生视频(text-to-video)模型,尽管 AI 生成...
-
详解Latte:去年底上线的全球首个开源文生视频DiT
随着 Sora 的成功发布,视频 DiT 模型得到了大量的关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域的研究重点。DiT [1] 的成功为图像生成的规模化提供了可能性。 然而,由于视频数据的高度结构化与复杂性,如何将 DiT 扩展到视频生成领...
-
AIGC专题:Sora实现文生视频跨越式突破,AIGC持续正反馈
今天分享的是AIGC专题系列深度研究报告:《AIGC专题:Sora实现文生视频跨越式突破,AIGC持续正反馈》。 (报告出品方:国联证券) 报告共计:16页 来源:人工智能学派 Sora 模型实现众多突破 2 月 16 日,OpenAI 发布了文...
-
【精华】AIGC启元2024
文章目录 AIGC 前沿 (1 Gemini 1.5 Pro(谷歌新一代多模态大模型) (2 Sora(文本生成视频大模型) (3 EMO(阿里生成式AI模型) (4 Playground v2.5(文生图大模型) (5 VSP-L...
-
等不及公开了!最新Sora模型细节揭秘:预计峰值需要72万块H100!每月至少4200块H100!缩放定律依旧有效!
作者 | Matthias·Plappert 翻译 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI的Sora模型能够生成各种场景的极其逼真的视频,令世界惊叹不已。除了一篇公开的技术报告和TikTok上放出的酷炫视频,就...
-
超越Sora!AI视频模型StreamingT2V可生成120秒超长视频
近日,UT奥斯丁等机构提出的StreamingT2V技术引发了广泛关注,将AI视频生成推向了新的高度。这项技术突破了以往视频长度的限制,实现了生成高度一致且长度可扩展的视频。 StreamingT2V技术的核心构架包括条件注意力模块(CAM)和外观保持模...
-
突破性的百万级视频和语言世界模型:Large World Model~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在探索如何让AI更好地理解世界方面,最近的一项突破性研究引起了广泛关注。来自加州大学伯克利分校的研究团队发布了“Large World Model, LWM”,能够同时处理百万级长度的视频和语言序列,...
-
OpenAI进军好莱坞:电影制作用Sora指日可待
自从 OpenAI 推出自动生成视频的 Sora 以后,很多人预测好莱坞可能要被 AI 代替了。现在,这家公司可能真的要走上这条路了。 彭博社本周五报道,有知情人士透露,OpenAI 计划下周在洛杉矶与好莱坞电影公司、媒体高管和人才机构举行会议,以在娱...
-
复刻Sora的通用视频生成能力,开源多智能体框架Mora来了
Sora 是首个引起社会广泛关注的大规模通用视频生成模型。自 OpenAI 在 2024 年 2 月推出以来,没有其他视频生成模型能够在性能或支持广泛视频生成任务的能力上与 Sora 匹敌。此外,完全公开的视频生成模型寥寥无几,大多数都是闭源的。 为了弥...