-
AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law
《黑神话·悟空》的火爆,带火的不仅是3D游戏本身,还有背后暗潮汹涌的AI3D生成技术。 一直以来,外界对3D大模型赛道的关注度都稍逊于语言模型和视频模型。然而,全球3D大模型选手们则都在暗中较量、默默发力,从a16z押注的Yellow,到李飞飞的World...
-
AI日报:GPT-4o加持!苹果全线产品进入生成式AI时代;腾讯支持生成多人视频;ChatGPT语音功能升级
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、苹果WWDC放出深水炸弹 GP...
-
AI日报:字节推王炸级语音生成模型Seed-TTS;Suno新功能被Udio抢跑;腾讯发布开源混元DiT加速库;即梦全量上线实时画布功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、字节推语音生成模型Seed-T...
-
彻底火了!《AIGC 面试宝典》圈粉无数!
2022 年下半年以来,文本生成图像快速出圈,多款应用持续火爆。 国外文生图代表:Midjourney、Stable Diffusion、OpenAI 的 DALL-E: 海外模型SD开源,进一步促进了国内大厂的研究热情和应用落地: 随着多模态技术迭...
-
AI日报:viva发布类Sora视频生成模型;Open AI 宫斗第二季详解;索尼禁止未授权使用其音乐“炼丹”:Coze上线Web SDK
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、viva发布类Sora视频生成...
-
腾讯混元大模型支持生成16s视频 并推出AI智能体平台腾讯元器
在腾讯云生成式AI产业应用峰会上,腾讯公司展示了其最新的AI创新成果——腾讯元器。这是一个一站式的AI智能体创作与分发平台,它基于腾讯的混元大模型构建,为企业提供了一个全新的解决方案。 通过腾讯元器,企业和开发者现在可以直接创建智能体,并利用腾讯官方提供的...
-
GPT-4o 17人Omni金牌团队首揭秘!清北上交中科大6位华人领衔
几天前的发布会上,OpenAI再次向全世界证明,它永远走在AI领域的最前沿。 眼看着《Her》中的Samantha在自己眼前成真,那一刻,全世界为之振奋。 就在刚刚,GPT-4o的关键团队信息,也被公布了出来。 就是这个名为「omni」的团队,发挥出了不可...
-
GPT-4o再秀神操作,“复现”OpenAI总裁讲课,网友当真了
OpenAI总裁兼联合创始人Greg再次大秀GPT-4o操作,结果网友直接缅怀DALL-E。 图片 直接看效果。 图片 文本拼写达到惊人的一致!手部细节、光照全都有,甚至后背上的Logo也完全正确。 有网友表示:恍惚间还以为真的是本人在讲课。 图片 也有...
-
GPT-4o 17人Omni金牌团队首揭秘!清北上交中科大六位华人领衔
几天前的发布会上,OpenAI再次向全世界证明,它永远走在AI领域的最前沿。 眼看着《Her》中的Samantha在自己眼前成真,那一刻,全世界为之振奋。 就在刚刚,GPT-4o的关键团队信息,也被公布了出来。 就是这个名为「omni」的团队,发挥出了不...
-
VQAScore官网体验入口 AI文本到视觉生成评估工具使用地址
VQAScore是一种新的评估指标,旨在更好地评估复杂的文本到视觉生成效果。这一指标结合了CLIP-FlanT5 模型,能够在文本到图像/视频/3D生成评估中实现最佳性能,是评估和优化文本到视觉生成模型的强大工具。同时,VQAScore引入了GenAI-B...
-
Stability AI开源上新:3D生成引入视频扩散模型,质量一致性up,4090可玩
Stable Diffusion背后公司Stability AI又上新了。 这次带来的是图生3D方面的新进展: 基于Stable Video Diffusion的Stable Video 3D(SV3D),只用一张图片就能生成高质量3D网格。 Stab...
-
生数科技「多模态大模型」正式通过备案
近日,生数科技「多模态大模型」正式通过国家《生成式人工智能服务管理暂行办法》备案。 成立于2023年3月,生数科技是一家全球领先的自主研发多模态通用大模型的人工智能企业 ,布局MaaS(模型即服务)与应用级产品,面向艺术设计、游戏制作、影视动画、社交娱乐等...
-
今日AI:多模态大模型Claude3发布;Gorq API开放申请;ChatGPT新增朗读功能;Stability AI发布SD3技术报告
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI应用 Claude3正式...
-
CVPR2024|AIGC(图像生成,视频生成等)相关论文汇总(附论文链接/开源代码/解析)【持续更新】
CVPR2024|AIGC相关论文汇总(如果觉得有帮助,欢迎点赞和收藏) Awesome-CVPR2024-AIGC 1.图像生成(Image Generation/Image Synthesis ECLIPSE: A Resource-E...
-
NeRF成为过去?三维重建迈向3D GS新时代!(复旦大学最新综述)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 3D Gaussian Splatting(3D-GS)已成为计算机图形学领域的一个重大进步,它提供了明确的场景表示和新颖的视图合成,而不依赖于神经网络,如神经辐射场...
-
谁能想到,一款3D建模AI工具成了Ins网红的视频创作利器
近期话题热度拉满的《幻兽帕鲁》AI抄袭瓜,想必各位一线冲浪玩家已经略有耳闻了。 背后最大的争议之一在于,无经验的小团队快速开发出3D游戏大作,遥遥领先以往同类项目的生产力。 多方争议之下,《幻兽帕鲁》AI抄袭瓜尚无定论。 但3D内容制作确实正变得前所未有的...
-
3DTopia官网体验入口 AI快速生成文本到3D模型软件在线使用地址
3DTopia是一款先进的文本到3D生成模型,通过两阶段的处理,能在短短 5 分钟内实现高质量的文本到3D模型的生成。这一创新工具的应用范围广泛,特别适合那些需要快速生成3D物体、进行文本图像转换、以及从事3D设计的用户。 点击前往3DTopia官网体验...
-
「文生图」再升级!学习个性化参照,无限生成多样图片,轻松设计玩具建筑
最近,来自南加州大学、哈佛大学等机构的研究团队提出了一种全新的基于提示学习的方法——DreamDistribution。 这种方法可以让任何基于文字提示的生成模型(比如文生图、文生3D等),通过一组参照图片来学习对应的视觉属性共性和变化的文本提示分布。...
-
只需2分钟,单视图3D生成又快又好!北大等提出全新Repaint123方法
将一幅图像转换为3D的方法通常采用Score Distillation Sampling(SDS)的方法,尽管结果令人印象深刻,但仍然存在多个不足之处,包括多视角不一致、过度饱和、过度平滑的纹理,以及生成速度缓慢等问题。为了解决这些问题,北京大学、新加坡...
-
1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品
只需两分钟,玩转图片转3D! 还是高纹理质量、多视角高一致性的那种。 不管是什么物种,输入时的单视图图像还是这样婶儿的: 两分钟后,3D版大功告成: △上,Repaint123(NeRF);下,Repaint123(GS) 新方法名为Repaint...
-
AI向百万薪资 高级原画师开刀?!爆Midjourney入局3D模型生成
来源 SoulofArt | ID Soul_Art 现在AI向高级原画师和3D开刀了? 网传爆料AI已入局3D模型生成... 这进化速度放在整个行业都十分炸裂 4月,Midjourney进一步宣布推出Niji-journey V5...
-
【AIGC核心技术剖析】用于高效 3D 内容创建生成(从单视图图像生成高质量的纹理网格)
3D 内容创建的最新进展主要利用通过分数蒸馏抽样 (SDS) 生成的基于优化的 3D 生成。尽管已经显示出有希望的结果,但这些方法通常存在每个样本优化缓慢的问题,限制了它们的实际应用。在本文中,我们提出了DreamGaussian,这是一种新颖的3D内容生...
-
AI视野:Midjourney V6史诗级升级;ChatGPT新增存档聊天记录功能;阿里DreaMoving开源;百度千帆AppBuilder开放
???AI新鲜事 Midjourney V6史诗级升级,网友惊呼太逼真! 网友在Midjourney V6第二次社区评价中惊叹其逼真神图,光影效果出众,上线倒计时,可能在今明两天内发布。 ChatGPT新增存档聊天记录功能 12月21日,OpenAI在...
-
六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革
两千年前的古人穿越到一千年前后,需要适应的东西可能不多。而一千前的古人穿越到一百年前,变化也不至于大到难以适应。但如果一百年前的古人穿越到现在,甚至只是有人“冬眠”10年、20年,面对的现实世界的变化,恐怕会是天翻地覆。日新月异的技术进步,正不断带来颠覆...
-
视频字幕处理+AI绘画,Runway 全功能超详细使用教程(4)
runway的视频字幕处理、AI绘图功能介绍,感觉完全就是为了做电影而布局,一整套功能都上线了!想系统学习的必收藏! 在深度研究Runway各个功能后,无论是AI视频生成及后期处理技术,还是AI图像生成技术,Runway都很能打,AI视频领域大有可为...
-
Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快
Stable Diffusion官方终于对视频下手了—— 发布生成式视频模型Stable Video Diffusion(SVD)。 Stability AI官方博客显示,全新SVD支持文本到视频、图像到视频生成: 并且还支持物体从单一视角到多视角的...
-
文本生成高精准3D模型,北京智源AI研究院等出品—3D-GPT
北京智源AI研究院、牛津大学、澳大利亚国立大学联合发布了一项研究—3D-GPT,通过文本问答方式就能创建高精准3D模型。 据悉,3D-GPT使用了大语言模型的多任务推理能力,通过任务调度代理、概念化代理和建模代理三大模块,简化了3D建模的开发流程实现技术民...