-
AI日报:Runway推出“Video to Video”功能;腾讯推AI游戏生成模型 GameGen-O;HeyGen推出Avatar 3.0;OpenAI新模型o1虚有其名?
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Runway推出“Video...
-
B站前副总裁做了款AI游戏助手,二次元却用它来谈恋爱?
最近,身边的同事都在讨论“65岁退休",虽说尚无官方认证,但热度之高连微博话题#90后男女都65岁以后退休系网民推估#的阅读量都超过了1.3亿。 可见无论结果如何,退休生活都是这届年轻人最关心的事之一了…… 为趁早打算,我最近搜罗了不少"摸鱼搭子",并将目...
-
清华「天眸芯」登Nature封面:全球首款类脑互补视觉芯片
在开放世界中,智能系统不仅要处理庞大的数据量,还需要应对各种「长尾问题」,如自动驾驶中面临的突发危险、出入隧道的剧烈光线变化、夜间强闪光干扰等。在这类任务上,传统视觉感知芯片由于受到「功耗墙」和「带宽墙」的限制,往往面临失真、失效或高延迟的问题,严重影响...
-
和GPT-4这些大模型玩狼人杀,人类因太蠢被票死,真·反向图灵测试
「你看,人类一败涂地了」 这是一次「反向图灵测试」,几个全球最先进的大模型坐在一起,坐着火车唱着歌,但其中混进了人类: 而 AI 的任务,是把这个人类揪出来。 最近,一位昵称「Tore Knabe」的网友在 X 平台发布的一段视频引发了人们的讨论。在视频中...
-
用AI陪玩家玩《我的世界》,华人AI创业者融资千万美金
近日,由华人 Robert Yang 创立的 AI 创企 Altera 推出了一个可以陪玩《Minecraft》的 AI Agent「Altera Bots」,并宣布完成900万美元种子轮融资,加上之前融到的200万美元,公司的融资额已经过了千万美金。 与...
-
Kimi平替?最神秘国产大模型团队阶跃星辰冒泡 一出手就是两个王炸!
国内基础大模型创业公司阶跃星辰近日正式亮相,由微软前全球副总裁姜大昕创立。该公司专注于多模态融合和Scaling Law,已经开发出千亿参数的ToC产品,并在万亿模型研发上取得显著进展。阶跃星辰的产品包括两款面向C端市场的应用:跃问和冒泡鸭,均已全面开放使...
-
阶跃星辰宣布推出 Step 系列通用大模型
阶跃星辰团队宣布推出了 Step 系列通用大模型,包括 Step-1千亿参数语言大模型、Step-1V 千亿参数多模态大模型,以及 Step-2万亿参数 MoE 语言大模型的预览版。 据悉,阶跃星辰成立于2023年4月,以 “智能阶跃,十倍每一个人的可...
-
一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE
近年来,LLM 已经一统所有文本任务,展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力,其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务,目前...
-
游戏人入局、资本疯抢,谁会是下一个AI独角兽?
资本永远在追逐风口,从二次元、元宇宙、AI到短剧……每一次技术革新与新赛道的崛起将掀起投资狂潮。而自2022年底就异常火爆的AI大模型及应用,随着新技术的不断推出(如Sora的问世),至今依然备受瞩目。 当下的AI产业吸引着无数互联网从业者的目光。无论是游...
-
北大具身智能成果入选CVPR'24:只需一张图一个指令,就能让大模型玩转机械臂
只靠一张物体图片,大语言模型就能控制机械臂完成各种日常物体操作吗? 北大最新具身大模型研究成果ManipLLM将这一愿景变成了现实: 在提示词的引导下,大语言模型在物体图像上直接预测机械臂的操作点和方向。 进而,得以操控机械臂直接玩转各项具体的任务: 例...
-
给AI Agent完整的一生!港大NYU谢赛宁等最新智能体研究:虚拟即现实
【新智元导读】近日,来自香港大学的Jihan Yang和纽约大学的谢赛宁等人发表了新的成果,将真实世界的地图、街景等各种信息融入Agent所在的虚拟世界,为智能体的未来赋予了无限可能。 怎样能构建更强大的AI Agent? 答案是给他们一个完整而真实的世界...
-
清华叉院、理想提出DriveVLM,视觉大语言模型提升自动驾驶能力
与生成式 AI 相比,自动驾驶也是近期 AI 最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统,人们面临的主要挑战是 AI 的场景理解,这会涉及到复杂、不可预测的场景,例如恶劣天气、复杂的道路布局和不可预见的人类行为。 现有的自动驾驶系统通常包括...
-
Windows、Office直接上手,大模型智能体操作电脑太6了
当我们谈到 AI 助手的未来,很难不想起《钢铁侠》系列中那个令人炫目的 AI 助手贾维斯。贾维斯不仅是托尼・斯塔克的得力助手,更是他与先进科技的沟通者。如今,大模型的出现颠覆了人类使用工具的方式,我们或许离这样的科幻场景又近了一步。想象一下,如果一个多模...
-
OpenAI为ChatGPT加入记忆功能!可以记住你的提问内容啦
2月14日凌晨,OpenAI在官网宣布,正在测试ChatGPT记住用户提问内容的能力,同时可以自由控制其内存。 该功能使用户不必频繁地提问相同的内容,ChatGPT都将记住那些内容并对长对话、个性化聊天等,例如,写长文小说;长期健康追踪;个性化编程习惯等,...
-
Depth Anything:释放大规模无标注数据的深度估计
本文经自动驾驶之心公众号授权转载,转载请联系出处。 24年1月论文“Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data“,来自香港大学、字节、浙江实验室和浙江大学。 这项...
-
幻兽帕鲁5天创收15亿 被指用AI量产设计
上周,一款名为《幻兽帕鲁》(Palworld)的游戏在24小时内销售额超过了200万,创下了185万的历史在线人数峰值。该游戏通过收集神奇生物“帕鲁”融合了塞尔达的开放世界探索和宝可梦的捕捉体系等多个热门游戏玩法。 然而,一些网友质疑这款游戏是否采用了AI...
-
CMU华人18万打造高能机器人,完爆斯坦福炒虾机器人!全自主操作,1小时学会开12种门
比斯坦福炒虾机器人还厉害的机器人来了! 最近,CMU的研究者只花费2.5万美元,就打造出一个在开放世界中可以自适应移动操作铰接对象的机器人。 论文地址:https://arxiv.org/abs/2401.14403 厉害之处就在于,它是完全自主完成操作...
-
《幻兽帕鲁》使用了哪些人工智能技术?palworld如何应用AI技术
《幻兽帕鲁》是一款开放世界生存游戏,玩家可以收集和利用各种神奇的生物“帕鲁”。这款游戏引起了很多关注,也引发了一些争议,有人质疑它是否使用了生成式AI技术来设计游戏内容。 点击前往AI:Art Impostor体验入口 与《幻兽帕鲁》有关的AI产品或服务...
-
《幻兽帕鲁》爆火,大厂坐不住了:这游戏是AI设计的?
最近,很多社交网络平台都被一款开放世界生存游戏刷了屏。 《幻兽帕鲁》(Palworld)是当下最热门的话题之一,它在1月19日于 Steam 上线抢先体验版本,24小时之内销量就超过了200万份,几天之内就突破了600万。 在1月23日,幻兽帕鲁的 Ste...
-
首个通用双向Adapter多模态目标追踪方法BAT,入选AAAI 2024
目标跟踪是计算机视觉的一项基础视觉任务,由于计算机视觉的快速发展,单模态 (RGB 目标跟踪近年来取得了重大进展。考虑到单一成像传感器的局限性,我们需要引入多模态图像 (RGB、红外等 来弥补这一缺陷,以实现复杂环境下全天候目标跟踪。 然而,现有的多...
-
爆火《幻兽帕鲁》被指用AI缝合宝可梦,开发者自曝传奇经历:是人类的奇迹
4天卖出600万份,爆火游戏《幻兽帕鲁》最高180万人同时在线,直接登顶。 这个成绩,甚至在整个Steam游戏平台历史上也能排到第二,连平台自家王牌CS2都被挤下去了。 同时,玩家好评率也高达93%。 《幻兽帕鲁》为什么能叫好又叫座? 借鉴了“全球最赚...
-
超越BEVFusion!又快又好的极简BEV融合部署方案
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 在算法开发中,激光雷达-相机3D目标检测遇到了过度拟合问题,这是由于违反了一些基本规则。在数据集构建的数据标注方面,本文参考了理论补充,并认为回归任务预测不应涉及来自...
-
AIGC和ChatGPT推进百度、阿里、腾讯、华为大模型技术创新
AIGC | PC集群 | PC Farm | GPU服务器 生成式AI | Stable Diffusion | ChatGPT 2022 年 12 月,OpenAI 推出了 ChatGPT,这是一种高性能计算的大型语言生成模型。它的出现推动了人...
-
国内多所高校共建开源社区LAMM,加入多模态语言模型大家庭的时候到了
ChatGPT问世以来,大语言模型(LLM)实现了跳跃式发展,基于自然语言进行人机交互的AI范式得到广泛运用。然而,人类与世界的交互中不仅有文本,其他诸如图片、深度等模态也同样重要。然而,目前的多模态大语言模型(MLLM)研究大多数闭源,对高校和大多数研...
-
斯坦福炒虾机器人爆火全网!华人团队成本22万元,能做满汉全席还会洗碗
今天,会做一大桌子菜的斯坦福机器人Mobile ALOHA刷屏全网。 滑蛋虾仁、干贝烧鸡、蚝油生菜,色香味俱全,看着很诱人。 就拿滑蛋虾仁这道菜来说,Mobile ALOHA在烧水的过程中先打上3颗鸡蛋,然后把虾仁放到水中焯熟,平底锅倒入鸡蛋液再加入...
-
《我的世界》化身AI小镇,NPC居民角色扮演如同真人
注意看,这个方块人正在快速思考面前几位“不速之客”的身份。 原来她是遇到了危险,意识到这一点之后,她马上开始在脑海中搜索策略。 最终,她的方案是先逃跑然后寻求帮助,并马上付诸行动。 与此同时,对面的人也在进行着和她一样的思考…… 这样的一幅场景出现...
-
基础模型+机器人:现在已经走到哪一步了
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。近日,CMU 的 Yonatan Bisk 和 Google DeepMind...
-
一篇综述,看穿基础模型+机器人的发展路径
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。 近日,CMU 的 Yonatan Bisk 和 Google DeepMind...
-
逆天!AI也能做游戏?百度智算大会上的这个项目“靓”了
没有代码,没有游戏开发工程,你想象过20分钟内可以制作出一款游戏吗? AI可以创作出爆款文案,写小说,搞视频脚本,写代码,出海报,还能生成3D空间。如今又有一个项目将AI+的应用场景延伸到了新领域。 没有代码,没有游戏开发工程,你想象过20分钟内可以制作出...
-
掌趣科技:AI游戏创作平台还在加紧开发过程中
掌趣科技在12月18日的互动平台上宣布,公司已与北京悠米互动娱乐科技有限公司达成业务合作,共同开发AI游戏创作平台。该平台旨在降低开放世界游戏的开发门槛,让个人和小团队也能开发大规模的开放世界游戏,并通过该平台分享游戏成果,实现AI+UGC。 作为创新性较...
-
首个「创造式任务」基准来了!北大清华联手发布Creative Agents:专为想象力而生!
近年来,许多研究通过训练服从自然语言指令的智能体,让智能体具有了解决各种开放式任务的能力。 例如,SayCan[1]利用语言模型实现了根据语言描述解决各种室内机器人任务的智能体,Steve-1[2]训练端到端的策略实现了能够在《我的世界》(Minecra...
-
当GPT-4V充当机器人大脑,可能你都没AI会规划
GPT-4V 已经能帮我们设计网站代码,控制浏览器,这些应用集中在虚拟数字世界中。假如我们把 GPT-4V 带入现实世界,让它作为控制机器人的大脑,会有什么有趣的结果呢? 最近,来自清华大学交叉信息研究院的研究者提出「ViLa」算法,实现了让 GPT-4...
-
北大等发布最新AI智能体Jarvis-1,制霸「我的世界」
智能体研究又取得了新成绩! 最近,来自北大、北邮、UCLA和BIGAI的研究团队联合发表了一篇论文,介绍了一个叫做Jarvis-1的智能体。 论文地址:https://arxiv.org/pdf/2311.05997.pdf 从论文标题来看,Jarvi...
-
Open Vocabulary Detection 开放世界目标检测竞赛 2023获胜团队方案分享
OVD技术简介 目标检测是计算机视觉领域中的一项核心任务,其主要目标是让计算机能够自动识别图片中目标的类别,并准确标示每个目标的位置。目前,主流的目标检测方法主要针对闭集目标的开发,即在任务开始之前需要对待检测目标进行类别定义,并进行人工数据标注,通...
-
每日学术速递1.30
CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 更多Ai资讯: 今天带来的arXiv上最新发表的3篇文本图像的生成论文。 Subjects: cs.LG、cs.Cv、cs.AI、c...
-
糟糕!玩脱了!B站UP主将ChatGPT接入《原神》游戏 视频播放超67万
最近,B站UP主“Risd_锐小杜”尝试将ChatGPT接入《原神》游戏,引发了广泛关注。在AI的驱动下,游戏中的角色和NPC呈现出更加灵活和智能的对话,不再受限于重复的固定台词,同时能够超越程序设定的活动范围。这意味着玩家可以与固定地点的角色结伴而行,通...
-
通用异常检测新曙光:华科大等揭秘GPT-4V的全方位异常检测表现
异常检测任务旨在识别明显偏离正常数据分布的异常值,在工业检验、医学诊断、视频监控和欺诈检测等多个领域都发挥了重要作用。传统的异常检测方法主要依赖于描述正常数据分布以进行正异常样本的区分。然而,对于实际的应用而言,异常检测也需要理解数据的高层语义,从而深入...
-
ChatGPT只算L1阶段,谷歌提出AGI完整路线图
AGI应该如何发展、最终呈什么样子? 现在,业内第一个标准率先发布: AGI分级框架,来自谷歌DeepMind。 该框架认为,发展AGI必须遵循6个基本原则: 关注能力,而非过程 同时衡量技能水平和通用性 专注于认知和元认知任务 关注最高潜力,而非...
-
让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider
大语言模型因其强大而通用的语言生成、理解能力,展现出了成为通用智能体的潜力。与此同时,在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此,大语言模型如何适配开放世界是一个重要的研究问题。 北京大学和北京智源人工智能研究院的团队针对这个问题提出了...
-
北大&智源提出训练框架LLaMA-Rider 让大模型自主探索开放世界
北京大学和北京智源人工智能研究院的团队提出了名为LLaMA-Rider的训练框架,旨在让大型语言模型在开放世界中具备自主探索和学习任务的能力。这个框架通过反馈-修改机制来实现主动探索,使模型在环境中接收反馈信息,不断调整决策,从而逐渐适应开放环境。 项目...
-
北大具身智能新成果:无需训练,听指令就能灵活走位
北京大学董豪团队具身导航最新成果来了: 无需额外建图和训练,只需说出导航指令,如: Walk forward across the room and walk through the panty followed by the kitchen. Stan...
-
GameGPT:使用AI实现游戏开发自动化
译者 | 布加迪 审校 | 重楼 如今,从事游戏开发如同走钢丝。游戏行业处于一种怪异的境地:游戏变得越来越酷,越来越有开创性,但同时也变得越来越让人头疼:更大的团队、更长的工作时间以及巨额预算。相信我,我知道从事这个行当有多难:我和好友Jim花了两年多...
-
让大模型看图比打字管用!NeurIPS 2023新研究提出多模态查询方法,准确率提升7.8%
大模型“识图”能力都这么强了,为啥还老找错东西? 例如,把长得不太像的蝙蝠和拍子搞混,又或是认不出一些数据集中的稀有鱼类…… 这是因为,我们让大模型“找东西”时,往往输入的是文本。 如果描述有歧义或太偏门,像是“bat”(蝙蝠还是拍子?)或“魔鳉”(Cy...