-
2024年AIGC行业研究:多模态大模型与商业应用
2024年2月,OpenAI发布其首款视频生成模型Sora,用户仅需输入一段文字即可生成长达一分钟场景切换流畅、细节呈现清晰、情感表达准确的高清视频,与一年前的AI生成视频相比,在各维度均实现了质的提升。这一突破再次将AIGC推向大众视野。AIGC即通过大...
-
中国AIGC最值得关注企业&产品榜单揭晓!首份应用全景图谱发布
组委会 发自 凹非寺 量子位 | 公众号 QbitAI “你好,新应用!” 站在大模型落地元年,是时候喊出这句话了。 从软件APP、智能终端乃至具身智能等等,AIGC开始席卷一切。 大模型玩家、互联网巨头、终端厂商、垂直场景玩家纷纷入场,办公、创作...
-
代码实战:使用Stable Diffusion完成虚拟模特换衣任务
Diffusion Models专栏文章汇总:入门与实战 前言:之前在博客《解读DreamPose:基于Diffusion Models的模特视频生成》中介绍了如何生成模特换衣的视频,在电商场景下得到了广泛的应用。由于视频生成的技术还不太成熟,...
-
AI日报:快手版Sora可灵开放测试;阿里悄悄开源Qwen2系列模型;Grok 1.5V或将接入Midjourney;柯南动画风AI特效刷屏抖音
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、媲美Sora?快手文生视频模型...
-
AI时代的服装设计师--AIGC
AI时代的服装设计师--AIGC AIGC AIGC设计能替代真正的设计师吗 森马T恤设计 AIGC优势、优化 本文记录于去年参加的一次森马T恤设计活动的感受。 AIGC 可以说,近期以来,随着ChatGPT的不断发展,从Ch...
-
AI视频生成工具Pika Labs获8000万美元融资 估值4.7亿美元
AI 视频生成器 Pika Labs 近日宣布获得了8000万美元的融资。这家初创公司的估值在这轮融资后达到了4.7亿美元,虽然仍远远落后于 Runway 的15亿美元估值,但也是一笔不小的金额。Pika Labs 的团队由来自 Google、Meta 和...
-
快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
什么?疯狂动物城被国产AI搬进现实了? 与视频一同曝光的,是一款名为「可灵」全新国产视频生成大模型。 它采用了Sora相似的技术路线,结合多项自研技术创新,生成的视频不仅运动幅度大且合理,还能模拟物理世界特性,具备强大的概念组合能力和想象力。 数据上看...
-
可灵大模型有哪些功能免费吗?快手视频生成模型怎么使用方法详细教程指南
可灵大模型 是什么? 可灵大模型(Kling)是快手大模型团队自研打造的先进视频生成模型,具备3D时空联合注意力机制,能够生成符合运动规律的视频内容,支持长达 2 分钟的视频生成,帧率达到30fps。它基于自研模型架构和强大的Diffusion Tran...
-
快手发布视频生成大模型「可灵」:已开放邀测 效果对标Sora
近日,快手发布了一款名为「可灵」的视频生成大模型,该模型效果对标了之前发布的 Sora,同时已在快手旗下的快影 App 开放邀测体验。 可灵大模型具有多项优势,包括能够生成大幅度的合理运动、模拟物理世界特性、具备强大的概念组合能力和想象力,以及支持高分辨率...
-
GPT-4o 的高阶用法,效率飞升!
大家好,我是老渡。 GPT-4o 已经是非常强的大模型了,这么强大的模型,如果再配上优秀的 prompt(提示词) 和工具,分分钟构造出更强大的智能体。 智能体 = prompt + LLM + 工具 先来说说如何写出优秀的 prompt,以下面这个 p...
-
当前时机是否适合进入AIGC行业:行业发展阶段与市场需求的深度探讨
人工智能生成内容(AIGC,Artificial Intelligence Generated Content)正在迅速崛起,成为技术创新和商业应用的热门领域。AIGC涵盖文本生成、图像生成、视频生成等多个方面,广泛应用于新闻写作、广告设计、影视制作等...
-
港科大最新!Vista:一种具有高保真度和多功能可控的世界模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability 论文链接...
-
AIGC视频生成-CameraCtrl
0. 资源链接 论文: CameraCtrl: Enabling Camera Control for Text-to-Video Generation 项目: https://hehao13.github.io/projects-CameraC...
-
AI绘画AnimateDiff-Lightning让文生视频生成速度提升多倍!【含模型及工作流获取】
大家好,我是程序员晓晓 视频生成模型一直很受到大家的关注,近年来在深度学习技术的推动下取得了显著进展。传统的动画生成方法往往面临效率低下和质量不高等问题,而深度学习模型通过学习和理解大量的数据,能够生成更加逼真、流畅的动画视频。尤其是近两年,更是“百模”...
-
ChatGPT成知名度最高生成式AI产品,使用频率却不高
本文经AIGC开放社区公众号授权转载,转载请联系出处。 想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 5月29日,牛津大学、路透社新闻研究所联合发布了一份生成式AI(AIGC)...
-
AI大模型日报#0422:深扒「全球TOP 10大模型团队」、扎克伯格 Llama 3访谈
导读: 欢迎阅读《AI大模型日报》,内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了每条资讯的摘要。 标题: 文本生成8K、360度全景世界!Model 3重磅发布 摘要: Blockade Labs发布了新模型Model 3,...
-
国产开源Sora上新:全面支持国产AI算力,可用ReVideo视频编辑,北大-兔展团队出品
北大-兔展联合发起的Sora开源复现计划Open-Sora-Plan,今起可以生成最长约21秒的视频了! 生成的视频水平,如下展示。先看这个长一点的,9.2s: 当然了,老规矩,这一次的所有数据、代码和模型,继续开源。 目前,Open-Sora-Plan在...
-
关于AIGC发展历程的研究报告(原创文章)
摘要: 2022年,Chat GPT和Stable Diffusion展现了AIGC强大的技术实力,拉开了AIGC时代的帷幕。2023年,GPT-4、Midjourney V5等又掀起了人工智能的热潮,2024年2月15日(美国当地时间)正...
-
AIGC-3D数字人技术:高效助推各行业数字化水平升级
从“互联网+”到“人工智能+”,数字员工作为一种全新的交互形式,对企业有着重要的作用,企业、品牌通过数字人的AI语音交互、AI播报等核心功能,可以有效推动企业提升数字水平。 作为3D、AI虚拟数字人技术服务商及方案提供商,广州虚拟动力推出AIGC数字...
-
AIGC的崛起:定义未来内容创作的新纪元
?文章目录 ?AIGC简介 ? AIGC的相关技术与特点 ?AIGC有哪些应用场景? ?AIGC对其他行业影响 ?面临的挑战与问题 ?AIGC未来发展 ?AIGC十大热门网站推荐: 文心一言:https://aigc.izzi.c...
-
通用世界模型问世:不学习就能生成新领域视频,可实时控制
随着 OpenAI 今年 2 月发布 Sora,世界模型(World Model)再次成为了 AI 领域的热门。 世界模型,即通过预测未来的范式对数字世界和物理世界进行理解,一直以来被认为是通往通用人工智能(AGI)的关键路径之一,与当前大模型推崇的智能...
-
Krea AI视频生成工具向所有人开放 Krea Video正式进入公测
视频来自Krea AI官方 Krea AI 最近宣布其视频生成工具Krea Video已经向所有人开放,正式进入公测阶段。这个新工具结合了关键帧和文本提示,让用户能够更灵活地创建视频。 使用Krea Video,用户可以在时间线中添加关键帧和文本提示,这两...
-
社交媒体嘲笑谷歌AI失误:人工智能产品质量再遭质疑
近日,谷歌的新人工智能搜索功能引发了一波网络热议。该功能从一个喜剧博客上抓取了一个关于"拿着剪刀跑步"的回答,认为这是一项有氧运动,可以改善毛孔,给人力量。这一失常回答在社交媒体上广为流传,令人啼笑皆非。 事实上,这是谷歌人工智能在推出新产品时出现的一个典...
-
【活动】AIGC 技术的发展现状与未来趋势
?个人主页: 鑫宝Code?热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ?个人格言: "如无必要,勿增实体" 文章目录 AIGC 技术的发展现状与未来趋势 引言 AIGC技术的发展现状 文本生成...
-
TikTok 推出生成 AI 套件,助力广告业务
短视频平台 TikTok 最新加入生成 AI 技术,宣布推出名为 “TikTok Symphony” 的全新 AI 套件,旨在为品牌提供更多广告创意和优化方案。 该套件包含了名为 “Symphony Creative Studio” 的新型 AI 视频生成...
-
AI日报:讯飞星火Lite API永久免费;李开复称大模型疯狂降价是双输;AI特效末日滤镜抖音爆火;AI音乐Suno 融资1.25亿美元
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、科大讯飞:讯飞星火Lite A...
-
AI日报:viva发布类Sora视频生成模型;Open AI 宫斗第二季详解;索尼禁止未授权使用其音乐“炼丹”:Coze上线Web SDK
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、viva发布类Sora视频生成...
-
Stability AI与Facebook前总裁等投资人进行筹款谈判
一位直接参与交易谈判的人士透露,包括 Facebook 前总裁 Sean Parker 在内的一组投资者正与 Stability AI 进行筹款谈判。Stability AI 是一家开发基于开源图像生成器 Stable Diffusion 的产品的初创公司...
-
腾讯混元升级模型矩阵,云上推出256k长文模型
大模型落地加速,“产业实用”成为发展共识。 2024年5月17日,腾讯云生成式AI产业应用峰会在北京召开,公布大模型研发、应用产品的系列进展。 腾讯混元大模型能力持续升级,多个版本模型hunyuan-pro、hunyuan-standard、hunyua...
-
腾讯混元大模型支持生成16s视频 并推出AI智能体平台腾讯元器
在腾讯云生成式AI产业应用峰会上,腾讯公司展示了其最新的AI创新成果——腾讯元器。这是一个一站式的AI智能体创作与分发平台,它基于腾讯的混元大模型构建,为企业提供了一个全新的解决方案。 通过腾讯元器,企业和开发者现在可以直接创建智能体,并利用腾讯官方提供的...
-
周鸿祎称留给谷歌的时间不多了 建议所有产品开源对抗OpenAI
在本周的谷歌I/O204开发者大会上,谷歌发布了Gemini1.5Flash、文生图工具Imagen3以及视频生成模型Veo等一系列创新产品。然而,这场技术盛宴并未得到360集团创始人周鸿祎的完全认可。近日,周鸿祎通过微博发表长文,对谷歌I/O大会进行了深...
-
“全家桶”战士归来,谷歌自我革命!
编辑 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 5月与6月,旧金山硅谷各大新贵旧王正在激烈角逐,主战场无疑则是AI。 就在昨天凌晨GPT-4o发布的24小时后,Google I/O大会也交卷了。 有意思的是,谷歌掌舵人皮查伊,好...
-
谷歌隐形AI数字水印技术可辅助识别生成的文本和视频
谷歌在今天宣布的一系列新的 AI 模型和工具中,还将其 AI 内容水印技术扩展到了两个新的媒介。谷歌旗下的 DeepMind 首执行官 Demis Hassabis 在周二的 Google I/O 开发者大会上首次登台,不仅介绍了团队的新 AI 具(如 V...
-
谷歌反击:Project Astra正面硬刚GPT-4o、Veo对抗Sora、新版Gemini变革搜索
通用的 AI,能够真正日常用的 AI,不做成这样现在都不好意思开发布会了。 5 月 15 日凌晨,一年一度的「科技界春晚」Google I/O 开发者大会正式开幕。长达 110 分钟的主 Keynote 提到了几次人工智能?谷歌自己统计了一下: 是的,...
-
谷歌硬刚GPT-4o!60秒视频生成模型虽迟但到,上下文窗口达200万
OpenAI出手再次惊艳世界,谷歌果然坐不住了。 GPT-4o掀起的一片“AGI已至”的惊呼声中,刚刚,Google DeepMind首席执行官哈萨比斯亲自携谷歌版《Her》登场。 同样能会还有,不仅能几乎没有延迟地和人类流畅交流,通过摄像头,这个名为P...
-
被追问Sora是否使用YouTube数据,OpenAI高管又语塞了
OpenAI 的另一位高管在被问及 Sora 视频生成器是否使用了 YouTube 数据时,同样陷入了困境。在最近举行的 Bloomberg 科技峰会上,OpenAI 席运营官 Brad Lightcap 在回答记者 Shirin Ghaffary 的问题...
-
腾讯和字节的幽灵在中国AI的上空徘徊
2023 年 4 月,产品经理松鹅(化名)从腾讯离职两天后,就从深圳来到北京,加入一家基座大模型的初创公司。彼时,这家公司还没什么资本追捧和用户声量,只有一个听起来挺拗口的中文名字:月之暗面。 那时候这家公司的产品团队,只有松鹅一个人。 同月,曾经在字节跳...
-
扩散模型与文生视频
一、快速发展的文生视频 在当前的人工智能领域,文生视频技术有着引人注目的进展。该技术的核心任务非常明确,就是利用文本指令来控制视频内容的生成。具体而言,用户可以输入特定文本,系统则根据这段文本生成相应的视觉画面。这一过程并不局限于单一的输出,相同的文本可...
-
剪映上线即梦AI:输入简单指令生成视频
快科技5月9日消息,剪映Dreamina官宣其品牌正式更名为中文即梦”,同时宣布其AI作图和AI视频生成功能已全量上线。 即梦”作为一个全新的品牌,其核心功能包括图片生成、智能画布和视频生成,旨在为用户提供更为便捷、智能的创作体验。 在图片生成方面,即梦”...
-
Krea AI正式发布视频生成功能 可自定义视频首尾帧
Krea AI 正式发布了其最新的视频生成功能,这一更新包括了自定义视频首尾帧和为每张图片定义提示词的能力。这些新功能在易用性上进行了显著改进,并且现在可以自动将生成的视频高清化,但仅限会员使用。 产品入口:https://top.aibase.com/...
-
即梦Dreamina:AI创作与智能设计的完美结合 - 使用教程与免费体验入口
即梦Dreamina 是什么? 即梦Dreamina是一款革命性的在线创作平台,它将人工智能技术与创意设计无缝结合,为用户提供了一个全新的视觉作品创作空间。通过即梦Dreamina,用户可以轻松地将他们的创意转化为引人入胜的图片、视频和故事内容。这款产品...
-
Dreamina正式更名为“即梦” AI绘画和AI视频功能全量上线
今天,剪映Dreamina官方宣布其品牌正式更名为中文「即梦」,同时宣布其AI作图和AI视频生成功能已全量上线。用户现在可以通过电脑浏览器访问新域名来体验这些功能。 即梦入口:https://top.aibase.com/tool/jimengdream...
-
硬核解决Sora的物理bug!美国四所顶尖高校联合发布:给视频生成器装个物理引擎
Sora刚发布后没多久,火眼金睛的网友们就发现了不少bug,比如模型对物理世界知之甚少,小狗在走路的时候,两条前腿就出现了交错问题,让人非常出戏。 对于生成视频的真实感来说,物体的交互非常重要,但目前来说,合成真实3D物体在交互中的动态行为仍然非常困难。...
-
看透物体的3D表示和生成模型:NUS团队提出X-Ray
项目主页:https://tau-yihouxiang.github.io/projects/X-Ray/X-Ray.html 论文地址:https://arxiv.org/abs/2404.14329 代码地址:https://github.com...
-
强大到不敢给普通人用!史诗级大模型 Sora 如何让众行业一夜变天?
1视频生成模型“新王登基”,Sora 何以成为全球焦点? 2023年以来,多模态视频生成技术取得了显著的进展和突破,从 Runway 到 Pika 再到年末的 VideoPoet,视频生成模型进入到加速阶段。2024年2月,OpenAI 旗下视频生成模型...
-
“地表最强”文生视频模型?Sora 背后有何秘密?
自 2022 年底 ChatGPT 的横空出世,人工智能再度成为全世界的焦点,基于大语言模型(LLM)的 AI 更是人工智能领域的“当红炸子鸡”。此后的一年,我们见证了 AI 在文生文、文生图领域的飞速进展,但在文生视频领域发展相对较慢。而在 2024 年...
-
Sora爆火短频“气球人”制作者亲述优缺点:视频其实都是专业制作,Sora占一小部分;一致性不能很好控制;似有识别版权问题的机制
整理 | 言征 OpenAI 的视频生成工具 Sora在2月份让业界大吃一惊,其流畅、逼真的视频似乎远远领先于竞争对手。然而这场精心策划的首次亮相,留给了大众太多不为人知的细节。 近日, OpenAI 大火的宣传短片的制作团队之一的Shy Kids...
-
写真视频击败Sora?人大自研全新多模态大模型Awaker 1.0震撼登场
在人工智能领域,人大系初创公司智子引擎近日发布了一款名为Awaker1.0的全新多模态大模型,标志着向通用人工智能(AGI)迈出了重要一步。该模型在写真视频效果上超越了Sora,展现了其在视觉生成方面的卓越能力。 4月27日,在中关村论坛的通用人工智能平...
-
超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题
哭死啊,全球狂炼大模型,一互联网的数据不够用,根本不够用。 训练模型搞得跟《饥饿游戏》似的,全球AI研究者,都在苦恼怎么才能喂饱这群数据大胃王。 尤其在多模态任务中,这一问题尤为突出。 一筹莫展之际,来自人大系的初创团队,用自家的新模型,率先在国内把“模...
-
无界AI算法总监邹国平:Midjourney领跑,没有标准答案的文生图,下半场还能怎么卷?
撰稿 | 李美涵 采访 | 云昭 嘉宾 | 邹国平 出品 | 51CTO技术栈(微信号:blog51cto) 进入2024,AI应用落地的步伐悄然加速。 AI文生图产品——连接着千行百业的设计需求,极大地压缩了创意实现的周期——正成为快速掘金的AI领域之...