-
DriveWorld:一个预训练模型大幅提升检测+地图+跟踪+运动预测+Occ多个任务性能
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 以视觉为中心的自动驾驶技术近期因其较低的成本而引起了广泛关注,而预训练对于提取通用表示至关重要。然而,当前的以视觉为中心的预训练通常依赖于2D或3D预训练任务,忽视了自动驾驶作为4D场景理解...
-
LLM全搞定!OmniDrive:集3D感知、推理规划于一体(英伟达最新)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 这篇论文致力于解决当前多模态大语言模型 (MLLMs 在自动驾驶应用中存在的关键挑战,尤其是将MLLMs从2D理解扩展到3D空间的问题。由于自动驾驶车辆 (AVs ...
-
LidaRF:研究用于街景神经辐射场的激光雷达数据(CVPR'24)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 光真实感模拟在自动驾驶等应用中发挥着关键作用,其中神经辐射场(NeRFs)的进步可能通过自动创建数字3D资产来实现更好的可扩展性。然而,由于街道上相机运动的高度共线性和在高速下的稀疏采样,街景的重建质...
-
2024年,端到端自动驾驶在国内是否会有实质性的突破和进展?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 毫不意外,随着Tesla V12在北美大范围推送以及凭借其良好的表现开始获得越来越多用户的认同,端到端自动驾驶也成为了自动驾驶行业里大家最为关注的技术方向。最近有机会和很多行业中的一流工程师,产品经理,...
-
一览Occ与自动驾驶的前世今生!首篇综述全面汇总特征增强/量产部署/高效标注三大主题
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 近年来,自动驾驶因其在减轻驾驶员负担和提高驾驶安全方面的潜力而越来越受到关注。基于视觉的三维占用预测是一种新兴的感知任务,适用于具有成本效益的自动驾驶感知系统,它可以...
-
美国空军高调展示首个AI战斗机!部长亲自试驾全程未干预,10万行代码试飞21次
最近,军事圈被这个消息刷屏了:美军的战斗机,已经能由AI完成全自动空战了。 是的,就在最近,美军的AI战斗机首次公开,揭开了神秘面纱。 这架战斗机的全名,是可变稳定性飞行模拟器测试飞机(VISTA),由美空军部长亲自搭乘,模拟了一对一的空战。 5月2日...
-
LeCun哈佛演讲PPT放出:唱衰自回归LLM,指明下一代AI方向
机器如何能像人类和动物一样高效地学习?机器如何学习世界运作方式并获得常识?机器如何学习推理和规划…… 当一系列问题被提出时,有人回答自回归 LLM 足以胜任。 然而,知名 AI 学者、图灵奖得主 Yann LeCun 并不这么认为,他一直唱衰自回归 LL...
-
OmniDrive: 一个关于大模型与3D驾驶任务对齐的框架
本文经自动驾驶之心公众号授权转载,转载请联系出处。 从一个新颖的3D MLLM架构开始,该架构使用稀疏查询将视觉表示提升和压缩到3D,然后将其输入LLM。 题目:OmniDrive: A Holistic LLM-Agent Framework for...
-
AI 画饼,马斯克不如库克
汽车项目关停、Vision Pro短时间难挑大梁,苹果的新希望还得靠AIGC。 “我们继续看好AIGC带来的收入,很快分享令人兴奋的动态,我们相信AIGC的优势,将让苹果脱颖而出。” 北京时间5月3日凌晨的苹果2024财年第二财季(即2024年度第一季度)...
-
AI 正在改变编程的教学方式:教授们正从语法转向强调更高层次技能
生成式人工智能正在改变软件开发行业。AI 驱动的编程工具正在协助程序员完成他们的工作流程,同时 AI 领域的工作岗位也在持续增加。但这种转变在学术界也很明显——学术界是下一代软件工程师学习编程的主要途径之一。 计算机科学的学生正在拥抱这项技术,使用生成式...
-
具身智能占领中国硅谷?1.23万AI学者集结海淀,填补全球百亿人形机器人空缺
这几天的中关村,已经被机器人占领了! 在2024中关村论坛年会的会场前台,这两位美女机器人的出现,把央视主持人都惊到了。 图片 逼真的动作,灵活的手指,连口型都是搭配的,两位美女机器人给到来的游客们耐心介绍着AI主题日的相关信息,在人群中分外吸睛。 往...
-
闭环永动机!NeuroNCAP:彻底打通端到端闭环仿真链路,已开源!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文提出了一种用于测试自动驾驶(AD)软件系统的多功能基于NeRF的仿真器,其设计重点是传感器真实闭环评估和安全关键场景的创建。仿真器从真实世界的驾驶传感器数据序列中...
-
Nvidia CEO 表示人类工作不会仅因 AI 而消失
Nvidia 首席执行官 黄仁勋认为人类工作不会仅仅因为人工能的兴起而消失。在接受 CBS News 的 “60分钟” 节目采访时,黄仁勋 表示,虽然人工智能正在改变世界,但他并不认为人类的工作岗位会突然消失。他认为随着人工智能助力企业,工作岗位将自然而然...
-
特斯拉今年将投100亿美元加码AI 马斯克:否则无法参与竞争
快科技4月29日消息,特斯拉CEO马斯克在社交媒体上表示,今年特斯拉将会投资约100亿美元用于AI的训练和推理,而推理主要用于汽车。 马斯克补充道,任何公司如果不能达到这一水平的支出,且不能高效地进行支出,就无法参与竞争。 此前,马斯克就曾在不同场合提及特...
-
Gaussian-LIC:首个多传感器融合3DGS-SLAM系统(浙大&TUM)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 多传感器与3DGS的结合 NeRF-based SLAM的隐式神经表示法需要基于3D空间中的采样进行计算密集型的体积渲染,从而削弱了SLAM应用所必需的实时能力。3DGS以其快速的渲染速度和优越的视觉...
-
最新综述!万字长文彻底搞懂单目3D车道线检测
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 3D车道检测在自动驾驶中起着至关重要的作用,通过从三维空间中提取道路的结构和交通信息,协助自动驾驶汽车进行合理、安全和舒适的路径规划和运动控制。考虑到传感器成本和视觉数...
-
图灵诺奖得主等大佬齐聚海淀!清华版Sora震撼首发,硬核AI盛会破算力黑洞
中关村论坛举办以来的首个主题日活动:「人工智能主题日」今日开启! 到场嘉宾,也是星光熠熠,大佬云集,还有着浓浓的国际范儿,与世界顶尖水平接轨。 一共161位嘉宾,近一半是外籍AI大佬和从业者。 而嘉宾阵容也是非常豪华,汇集了国内外30多名院士,还有诺奖、...
-
FisheyeDetNet:首个基于鱼眼相机的目标检测算法
本文经自动驾驶之心公众号授权转载,转载请联系出处。 目标检测在自动驾驶系统当中是一个比较成熟的问题,其中行人检测是最早得以部署算法之一。在多数论文当中已经进行了非常全面的研究。然而,利用鱼眼相机进行环视的近距离的感知相对来说研究较少。由于径向畸变较大,标...
-
什么是边缘人工智能和边缘计算?
边缘人工智能是人工智能领域最值得关注的新领域之一,它旨在让人们运行人工智能流程,而不必担心隐私或数据传输导致的速度减慢。边缘人工智能正在使人工智能的使用范围更广、更广泛,让智能设备无需访问云即可快速响应输入。虽然这是边缘人工智能的快速定义,但让我们花点...
-
OpenAI 对手xAI即将融资60亿美元 估值180亿美元
据techcrunch报道,一位了解该交易的可信消息人士透露,xAI 是埃隆·马斯克 (Elon Musk) 成立10个月以来人工智能巨头 OpenAI 的竞争对手,即将完成融资60亿美元,投前估值为180亿美元。除非交易条款发生变化,否则这笔交易将让投资...
-
模糊图像重建重大进展!DeblurGS:相机位姿不准也能极致渲染!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 尽管在从运动模糊图像中重建清晰的3D场景方面取得了重大进展,但向现实世界应用的过渡仍然具有挑战性。主要障碍源于严重的模糊,这导致通过“Structure-from-M...
-
ChatGPT可以开车吗?分享大型语言模型在自动驾驶方面的应用案例
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 人工智能技术如今正在快速发展和应用,人工智能模型也是如此。拥有100亿个参数的通用模型的性能正在碾压拥有5000万个参数的任务特定模型...
-
百度:AI专利申请量、授权量国内第一
快科技4月26日消息,在第24个世界知识产权日来临之际,百度昨日举办专利运用赋能AI产业高质量发展”论坛。 在论坛上,百度首席技术官透露,百度在以大模型为核心的人工智能领域,其专利申请量和授权量在国内均位居第一,且在全球范围内处于领先地位。 特别是在深度学...
-
为人工智能改变建筑行业做好准备
第一代人工智能,即ANI或狭义人工智能,从汽车的制动系统到飞机的导航以及自动驾驶仪,第一代人工智能都无处不在。 这些工具已经改变了我们的生活方式以及我们与世界和彼此互动的方式。还记得30年前的世界吗?那是一个没有互联网、没有电子邮件、没有社交媒体、没有...
-
在线地图还能这样?MapTracker:用跟踪实现在线地图新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 太强了,在线高精地图还能用跟踪的方式来做!!!本文提出了一种矢量HD建图算法,该算法将在线高精建图公式化为跟踪任务,并使用memory latents的历史来确保随着时...
-
Nvidia CEO黄仁勋亲自向OpenAI交付第一台DGX H200
Nvidia CEO 黄仁勋亲自将首个 Nvidia DGX H200交付至旧金山的 OpenAI 办公室,这一举动彰显了人工智能行业两大巨头之间紧密的联系。OpenAI 总裁兼联合创始人 Greg Brockman 在推特上发布了一张照片,展示了这一事件...
-
超越BEVFormer!CR3DT:RV融合助力3D检测&跟踪新SOTA(ETH)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文介绍了一种用于3D目标检测和多目标跟踪的相机-毫米波雷达融合方法(CR3DT)。基于激光雷达的方法已经为这一领域奠定了一个高标准,但是其高算力、高成本的缺陷制约了...
-
CVPR 2024 | 面向真实感场景生成的激光雷达扩散模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Towards Realistic Scene Generation with LiDAR Diffusion Models 论文链接:https://hancyran.github.io/a...
-
人工智能可以帮助识别门牌号吗?
人工智能(AI 是一项进步,使计算机和机器能够复制人类的知识和解决问题的能力。如今,人们正在使用人工智能识别门牌号码。人工智能可以单独或与其他技术相结合来执行任务,如传感器、地理定位、机器人技术,无需人类参与。 人工智能在识别门牌号码方面的作用 在计算...
-
借势大模型,科大讯飞走出低谷了吗?
AI1.0公司想靠大模型打个漂亮的“翻身仗”,似乎还差一口气。 4月23日,科大讯飞发布2023年年度及2024年Q1业绩报告。全面 All in大模型的一年,科大讯飞交出了首份成绩单,2023年营业收入为196.5亿元,同比增长4.41%;归属于上市公司...
-
马斯克:可能在明年年底前出售特斯拉人形机器人 Optimus
IT之家 4 月 24 日消息,特斯拉 CEO 马斯克在财报电话会议上表示,预计在今年底之前,特斯拉的 Optimus 人形机器人将拥有完成“有用的”工厂任务的能力,该公司可能会在 2025 年底前将其对外销售,特斯拉计划今年年底前在其自家工厂率先使用...
-
对话蚂蚁李建国:当前AI写代码相当于L2.5,实现L3后替代50%人类编程
蚂蚁集团代码大模型CodeFuse负责人李建国说道。 当下,AI代码生成领域正在野蛮式生长,巨头涌入,AI员工频频上线企业;首个AI程序员Devin被曝造假…… 面对风起云涌的代码生成变革,李建国给出了这样一个明确论断。 李建国是谁? 清华大学博士,机器...
-
一文了解大语言模型(LLM)
人工智能的发展给我们的生活带来很多不一样的体验。面部识别可以解锁设备,激光雷达可以实现自动驾驶。当2023年,OpenApi的chatGPT可以“理解”人类的语言并与我们进行沟通时,大语言模型的概念出现在我们面前。 在自然语言处理领域的大语言模型(La...
-
牛津大学最新!Mickey:3D中的2D图像匹配SOTA!(CVPR'24)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 项目链接:https://nianticlabs.github.io/mickey/ 给定两张图像,可以通过建立图像间的对应关系来估计它们之间的相机相对姿态。通常,这些对应关系是二维到二维的...
-
超越BEVFusion!DifFUSER:扩散模型杀入自动驾驶多任务(BEV分割+检测双SOTA)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 目前,随着自动驾驶技术的越发成熟以及自动驾驶感知任务需求的日益增多,工业界和学术界非常希望一个理想的感知算法模型,可以同时完成如3D目标检测以及基于BEV空间的语义分...
-
时代2024最具影响力100人:黄仁勋、Bengio、纳德拉 、王传福等人入选
刚刚,《时代》周刊发布了 2024 年度最具影响力的 100 人名单。 在这份名单中,我们看到了很多熟悉的学者和企业家。 微软公司 CEO、董事长萨蒂亚・纳德拉,比亚迪创始人王传福,英伟达创始人兼首席执行官黄仁勋,图灵奖得主 Yoshua Bengio...
-
到2032年,汽车AI市场规模预计将达到311.1亿美元
据报告分析,汽车人工智能市场的估值在2024年为41.4亿美元,预计到2032年将达到311.1亿美元,2024年至2032年的复合年增长率为29%。 人工智能是汽车行业迈向新价值未来的新垫脚石,人工智能在汽车行业的应用不仅限于汽车行业本身,还远远超出...
-
CVPR 2024 | 巨幅提升24%!LiDAR4D会是LiDAR重建的答案么?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 尽管神经辐射场(NeRFs)在图像新视角合成(NVS)方面取得了成功,但激光雷达NVS的发展却相对缓慢。之前的方法follow图像的pipeline,但忽略了激光雷达...
-
如何利用Transformer有效关联激光雷达-毫米波雷达-视觉特征?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者个人理解 自动驾驶的基础任务之一是三维目标检测,而现在许多方法都是基于多传感器融合的方法实现的。那为什么要进行多传感器融合?无论是激光雷达和相机融合,又或者是毫米波雷达和相机融合,其最主要的目的就是...
-
LiDAR仿真新思路 | LidarDM:助力4D世界生成,仿真杀器~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:LidarDM: Generative LiDAR Simulation in a Generated World 论文链接:https://arxiv.org/pdf/2404.02903....
-
轨迹预测系列 | HiVT之进化版QCNet到底讲了啥?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 HiVT的进化版(不先看HiVT也能直接读这篇),性能和效率上大幅提升。 文章也很容易阅读。 【轨迹预测系列】【笔记】HiVT: Hierarchical Vector Transformer for...
-
福布斯发布人工智能50强榜单 OpenAI、Anthropic等霸榜
福布斯发布了备受瞩目的第六届人工智能50强榜单,从1900家申请公司中精选出顶级的人工智能企业,展现了该行业的蓬勃发展和创新活力。评选过程严格,结合了算法分析和专家评审,突显了人工智能在提升生产力、推动创意应用和改善实体运营方面的日益重要性。 完整榜单点...
-
等等我还没上车!LLM赋能端到端全新范式LeGo-Drive,车速拉满
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者个人理解 这篇论文介绍了一种名为LeGo-Drive的基于视觉语言模型的闭环端到端自动驾驶方法。该方法通过预测目标位置和可微分优化器规划轨迹,实现了从导航指令到目标位置的端到端闭...
-
扩散模型如何帮助创建更好的强化学习系统
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 扩散模型以其令人印象深刻的生成高质量图像的能力而闻名,它们是流行的文本到图像模型(例如DALL-E、Stable Diffusion和...
-
ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验
一、ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验 ROCm:一个可移植、高性能的GPU计算平台 随着AI时代的来临,显卡的作用不再仅仅只局限于游戏,特别是在Stable Diffusion火爆全网之后,越来越多的玩家...
-
效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 标注之殇 静态物体检测(Static object detection,SOD),包括交通信号灯、导向牌和交通锥,大多数算法是数据驱动深度神经网络,需要大量的训练数据。现在的做法通常是对大量的训练样本...
-
「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线
强化学习(RL)通过与环境交互的试错反馈来优化顺序决策问题。 虽然RL在允许大量试错的复杂电子游戏环境中实现了超越人类的决策能力(例如王者荣耀,Dota 2等),但很难在包含大量自然语言和视觉图像的现实复杂应用中落地,原因包括但不限于:数据获取困难、样本...
-
基于数据正则化自博弈强化学习的人类兼容型自动驾驶
自动驾驶汽车面临的一个核心挑战是如何与人类合作。因此,在模拟环境中,将现实中的人类代理纳入到自主驾驶系统的可扩展训练和评估中至关重要。模拟代理通常是通过模仿大规模、高质量的人类驾驶数据集来开发的。然而,纯粹的模仿学习代理在多代理闭环环境中执行时经验上具...
-
探讨2030年人工智能的发展趋势
1、人类级别的人工智能能力 到2030年,人工智能有望达到人类的智力水平,这是该领域的一个巨大飞跃。这一里程碑将为人工智能系统带来前所未有的机会,使其能够以与人类相当的认知水平执行任务。各行业将见证人工智能驱动的决策、问题解决和创造力创新,从而...
-
智能百科 | 多模态人工智能及其应用
多模态人工智能概述 多模态人工智能是一种人工智能技术,其能够处理和理解多种类型的输入数据,例如文本、图像、语音和视频等。与传统的单一模态人工智能相比,多模态人工智能能够更全面地理解和处理信息,因为其能够同时考虑多种输入源的信息。 多模态人工智能通常利用...