-
黄仁勋身家一年暴增4倍: 英伟达AI人工智能软件应用有哪些?
最近报道显示,英伟达公司首席执行官黄仁勋的身家在 2023 年飙升至 440 亿美元,这一数字较年初增长了 302 亿美元,使他成为今年收入最高的企业家之一。这一成就得益于英伟达股价在今年飙升了近246%。投资者对英伟达在人工智能领域的领先地位和引领力的信...
-
鱼眼相机与超声波传感器融合实现鸟瞰近场障碍物感知
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接:https://browse.arxiv.org/pdf/2402.00637.pdf 视频链接:https://youtu.be/JmSLBBL9Ruo 本文介绍了鱼眼相机与超声传...
-
EgoGen官网体验入口 微软AI合成数据生成自我感知工具使用指南
EgoGen是一个用于生成以自我为中心的合成数据的系统,它能够模拟头戴设备(HMDs)的相机装置,并从相机佩戴者的视角渲染多种传感器数据。该系统提供了丰富的多模态数据和准确的注释,适用于自我感知任务。 点击前往EgoGen官网体验入口 谁可以从EgoGe...
-
清华叉院、理想提出DriveVLM,视觉大语言模型提升自动驾驶能力
与生成式 AI 相比,自动驾驶也是近期 AI 最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统,人们面临的主要挑战是 AI 的场景理解,这会涉及到复杂、不可预测的场景,例如恶劣天气、复杂的道路布局和不可预见的人类行为。 现有的自动驾驶系统通常包括...
-
爆火Sora的背后 | 聊聊什么是world models!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 随着媒体狂炒Sora,OpenAI的介绍材料中称Sora是 “world simulator”,世界模型这个词又进入视野,但很少有文章来介绍世界模型。这里回顾一下什么是世界模型,以及讨论Sora是不是...
-
都在搞端到端,试问端到端自动驾驶的基石到底是什么?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 基础模型的出现彻底改变了自然语言处理和计算机视觉领域,为其在自动驾驶(AD)中的应用铺平了道路。这项调查对40多篇研究论文进行了全面回顾,展示了基础模型在增强AD中的...
-
YOLOv8官网体验入口 AI计算机视觉目标检测模型免费在线使用地址
YOLOv8是YOLO系列目标检测模型的最新版本。它能够在图像或视频中准确快速地识别和定位多个对象,并实时跟踪它们的移动。相比之前版本,YOLOv8在检测速度和精确度上都有很大提升,同时支持多种额外的计算机视觉任务,如实例分割、姿态估计等。YOLOv8可通...
-
四个优秀AI Agent开源项目,谈一谈大模型、人工智能代理
什么是AI Agent? 现在我们与大模型的互动,一般的过程是先输入一个提示词,之后,大模型根据输入内容进行计算并响应。每次想要得到一个新的输出,我们就必须再提供一个提示词。这个过程有点麻烦,因为总是要有人来驱动。 AI Agent(人工智能代理)则以不...
-
逆天了!UniVision:BEV检测和Occ联合统一框架,双任务SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&个人理解 最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处,但在特征表示、数据格式和目标方面仍存在差距,这对统一高效的3D感知...
-
AI驱动的超自动化如何提高业务效率
人们对AI和超自动化感到兴奋,这是有充分理由的,AI具有自动化涉及人类思维和相关行为的复杂企业任务的潜力。 AI驱动的企业超自动化看起来就像自动驾驶汽车的现状,我们有特斯拉可以按需送人们去地方,Waymo在旧金山和凤凰城的街道上漫游,根本没有司机!这是...
-
人工智能如何为未来智能大众出行解决方案铺平道路
预计到2030年,60%的人口将居住在城市地区。现在和未来的必要条件是大量人员进出城市中心的高效流动。城镇化的进步很大程度上依赖于此。在各种公共交通方式中,铁路在每乘客公里的能源消耗方面是最高效、最有效的。 然而,要使铁路成为首选,它必须安全、可靠且可用...
-
SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for Autonomous Driving 论文链接...
-
NeRF成为过去?三维重建迈向3D GS新时代!(复旦大学最新综述)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 3D Gaussian Splatting(3D-GS)已成为计算机图形学领域的一个重大进步,它提供了明确的场景表示和新颖的视图合成,而不依赖于神经网络,如神经辐射场...
-
『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架
本文经自动驾驶之心公众号授权转载,转载请联系出处。 协同感知技术能够有效解决自动驾驶车辆单体感知中存在的障碍物遮挡、视角受限、以及远距离感知能力弱等问题。然而,现有的工作都做了一个过分简单的假设,即参与协作的智能体使用相同的传感器,部署相同的感知模型。...
-
AI自动化标注崛起,数据标注员要失业了?
在数据标注行业流行着一句话:“有多少智能,就有多少人工”。 由于需要标注的数据规模庞大且成本较高,一些互联网巨头及一些AI公司很少自己设有标注团队,大多交给第三方数据服务公司或者数据标注团队来做。 这也衍生出了专为AI而生的人力密集型的数据标注产业链。...
-
马斯克:特斯拉早已掌握视频生成技术 更胜过OpenAI
快科技2月19日消息,据媒体报道,OpenAI发布的首个文生视频模型Sora最近热度十分高,用户通过一句话,就能生成长达1分钟的高清视频。 特斯拉CEO埃隆马斯克在社交媒体平台X上发帖,吹捧了自家模拟现实和视频生成技术是最好的”。 马斯克称,特斯拉在一年前...
-
2024年应该关注的十大人工智能创新
人工智能(AI 不再只是一个流行词,它已成为我们日常生活的重要组成部分。人工智能在去年深入地融入我们社会的各个方面,改变我们的生活方式、工作方式以及与技术互动的方式。 今年是大年初一,我们将探讨2024年可能出现的十大人工智能创新,拥抱这些即将到来的人...
-
周鸿祎谈Sora模型:中美AI差距可能还在加大
2月17日消息,近日,OpenAI 发布了 Sora 模型,该模型可根据用户输入的文本提示词描述,生成一段60秒钟的视频内容。从OpenAI公开的演示视频来看效果非常超现实。 昨日,360董事长周鸿祎在微博发文,谈到OpenAI的文字转视频模型Sora。他...
-
万元预算打造高质量13B私有模型,Colossal-AI LLaMA-2 开源方案再升级
几个月前,Colossal-AI 团队仅利用8.5B token数据、15小时、数千元的训练成本,成功构建了性能卓越的中文LLaMA-2 7B 版本模型,在多个评测榜单性能优越。 在原有训练方案的基础上,Colossal-AI 团队再次迭代,并通过构建更...
-
大模型开车哪家强?普渡研究给指南:GPT-4真行啊
现在一句口令,就能指挥汽车了。 比如说声“我开会要迟到了”“我不想让我朋友等太久”等等,车就能理解,并且自动加速起来。 如果这次行程有不满意的,只需要给汽车提供反馈建议:“要在充分保障安全的前提下”,汽车的自动驾驶行为就会在下次行程中进行自我修正。 这是来...
-
BFT最前线丨浙江大学和蚂蚁集团合作,成立智能视觉实验室;ChatGPT 对亚洲节点大规模封号;谷歌CEO称将推出Bard升级版
文 | BFT机器人 01 浙江大学和蚂蚁集团合作,成立智能视觉实验室 据消息,浙江大学和蚂蚁集团达成合作成立「智能视觉联合实验室」,旨在推进智能视觉的技术创新和产业应用,重点攻坚包括机器视觉、三维重建、视觉内容生成等人工智能...
-
了解AIGC在图像识别和生成中的应用
1.背景介绍 在过去的几年里,人工智能(AI 已经成为了我们生活中的一部分,它在图像识别和生成方面的应用也非常广泛。在这篇文章中,我们将探讨一下AI生成式图像识别(AIGC 在图像识别和生成中的应用,以及其背后的核心概念和算法原理。 1. 背...
-
下一代Edge AI的应用初探
如您所见,AI已不再只是科幻电影的经典主题,它正在以惊人的速度被应用到我们日常生活中的方方面面,并从个人关系到工作项目上,逐渐改变着我们的想法或行为。 其中,一个最为典型的领域当属NextGEN Edge AI(下一代边缘人工智能)应用。它能够通过诸如...
-
OccNeRF:完全无需激光雷达数据监督
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人总结 近年来,3D 占据预测(3D Occupancy Prediction)任务因其独特的优势获得了学界及业界的广泛关注。3D 占据预测通过重建周围环境的 3D 结构为自...
-
三篇论文解决「语义分割的优化和评估」难题!鲁汶/清华/牛津等联合提出全新方法
优化语义分割模型常用的损失有Soft Jaccard损失,Soft Dice损失和Soft Tversky损失,但它们都和软标签不兼容,所以无法支持一些重要的训练技术(例如标签平滑,知识蒸馏,半监督学习,多标注员等)。 另一方面,语义分割常用的评价指标...
-
AIGC在物联网与智能制造中的实践
1.背景介绍 1. 背景介绍 物联网和智能制造是当今最热门的技术领域之一,它们在各种行业中发挥着重要作用。随着计算机视觉、自然语言处理和机器学习等技术的发展,人工智能(AIGC 在物联网和智能制造领域的应用也日益增多。本文将探讨AIGC在物联...
-
挖掘BEV潜力的边界!DA-BEV:无监督BEV SOTA新方案!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 今天和大家探讨3D视觉感知领域中的一个特定问题:针对纯视觉的鸟瞰图(BEV)的无监督领Domain Adaptation(Unsupervised Domain Ad...
-
从0开始用 PyTorch 构建完整的 NeRF
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在解释代码之前,首先对NeRF(神经辐射场)的原理与含义进行简单回顾。而NeRF论文中是这样解释NeRF算法流程的: “我们提出了一个当前最优的方法,应用于复杂场景下合成新视图的任务,具体的实现原理是...
-
网大为卸任腾讯CXO;Midjourney 1 月训练视频模型;2023年马斯克赚了7700亿
投融资 • 2023 年大型科技公司在生成式 AI 初创企业上的投资远超风险投资集团 • 恒信东方与无锡政府合作成立布局 MR/XR 技术及 3D 数字资产 AIGC 产业投资基金 • 新公司法完善注册资本认缴登记制度 • 网大为卸任腾讯CXO,曾促成...
-
哪有人逛街不戴Vision Pro的???
头上长Vision Pro出现人传人现象,这是伦敦街头上演的最新一幕: 秉承着“既然要刺激,那就贯彻到底”的原则,这位小哥一身休闲西装,头戴Vision Pro,遛着自家机器小狗,成为最亮眼的显眼包。 面前有个小台阶时,小哥还朝机器狗伸了伸手,仿佛在对...
-
百度将举办Create AI开发者大会 AI芯片昆仑等多项成果将亮相
百度宣布百度Create AI开发者大会已正式定档于2024年4月16日至17日,在深圳国际会展中心(宝安)隆重举办。届时,百度创始人、董事长兼CEO李彦宏将发表主题演讲,展示最新的百度AI技术突破,并分享对未来趋势的独到见解。 图源备注:图片由AI生成...
-
大模型真能解决一切吗?关于知识驱动自动驾驶的一些思考
本文经自动驾驶之心公众号授权转载,转载请联系出处。 上个星期受邀在外面做了一次关于「知识驱动自动驾驶」的讲座,刚好借这个机会把之前我和团队的一些学术上的思考整理凝练了一下。感觉里面一些内容还是挺值得拿出来分享&讨论的,所以开这么个帖子把其中一些关...
-
机器人和人工智能如何实现供应链的自动化
自动化技术如今正在进入各个行业领域,这在供应链中尤为明显。事实上,正如人们所知,自动化技术的未来进步可能会重塑整个供应链和供应链管理软件。 有远见的供应链参与者已经在为新形势做好准备。首席信息官应该带头为他们的组织带来最好的结果,但首先了解供应链中机器...
-
首个环视世界模型DrivingDiffusion: BEV数据和仿真新思路!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者的一些个人思考 在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面: 不同维度...
-
谁将真正受益于人工智能?
人工智能(AI)已成为我们生活中不可否认的力量。 它正在改变行业、影响决策,并改变我们的生活和工作方式。尽管人工智能的前景广阔,但关于谁将从这场技术革命中获益最多,人们一直在争论。人工智能会让每个人平等受益,还是会加剧现有的差距?在这次深度探索中,我们...
-
Vision Pro开卖炸出各种显眼包!开车/健身/过马路操作秀翻天,AI大牛Karpathy发千字亲测体验
全球第一台Vision Pro被捧出店门的那一刻,整个人群沸腾了。 历史会记住这一刻。苹果Vision Pro的诞生,注定改变全人类,改变全世界。 2月2日早上9点,库克亲临现场,推开纽约苹果门店的大门。 国内的网友,开始打飞的去大洋彼岸抢Visio...
-
人工智能可以帮助改善云计算管理有哪些方式
当企业考虑云管理时,主要考虑的是运营流程,例如监控性能、维护安全性和确保合规性。这些都是成功开展业务的重要方面,但这只是云管理所需要的一部分。 一个经常被忽视的关键方面是通过提供直观的工具和集成的支持流程来改善用户体验,从而消除企业IT基础设施的一些麻...
-
【Stable Diffusion】通过ControlNet修复手臂
ControlNet用处 ControlNet是一个用于机器人控制的高度模块化的、灵活的开源框架,它支持各种传感器、执行器和通信协议。ControlNet可以用于各种应用领域,包括但不限于: 工业自动化:ControlNet可以用于工业自动化系统...
-
数据为王!如何通过数据一步步构建高效的自动驾驶算法?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 下一代自动驾驶技术期望依赖于智能感知、预测、规划和低级别控制之间的专门集成和交互。自动驾驶算法性能的上限一直存在巨大的瓶颈,学术界和业界一致认为,克服瓶颈的关键在于以...
-
Warning!远距离LiDAR感知
本文经自动驾驶之心公众号授权转载,转载请联系出处。 一、引言 去年开了图森ai day之后,一直想以文字形式总结一下这几年在远距离感知方面所做的工作,正好最近有时间了,就想写一篇文章记录一下这几年的研究历程。本文所提到的内容都在图森ai day视频[0]...
-
Depth Anything:释放大规模无标注数据的深度估计
本文经自动驾驶之心公众号授权转载,转载请联系出处。 24年1月论文“Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data“,来自香港大学、字节、浙江实验室和浙江大学。 这项...
-
谷歌DeepMind核心大佬被曝离职创业,瞄准AI智能体!曾是Gemini关键负责人
谷歌又被曝出有核心员工离职了! 这次跑路的竟是DeepMind的核心技术大佬,Gemini项目的四位主要开发者之一,Ioannis Antonoglou。 上图左半部分列出了Gemini项目的36位领导者,自去年九月以来,包括Ioannis Anton...
-
近200+自动驾驶数据集全面调研!一览如何数据闭环全流程
写在前面&个人理解 自动驾驶技术在硬件和深度学习方法的最新进展中迅速发展,并展现出令人期待的性能。高质量的数据集对于开发可靠的自动驾驶算法至关重要。先前的数据集调研试图回顾这些数据集,但要么集中在有限数量的数据集上,要么缺乏对数据集特征的详细调查...
-
云端车端MapNeXt全搞定!面向下一代在线高精地图构建
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 在协作、互联和自动化移动(CCAM)中,智能驾驶车辆对周围环境的感知、建模和分析能力越强,它们就越能意识到并能够理解、做出决策,以及安全高效地执行复杂的驾驶场景。高精...
-
自动驾驶仿真大观!一起聊聊自动驾驶仿真这个行当!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 今天将由我来为大家浮光掠影地介绍一下自动驾驶仿真这个行当。 首先说为什么自动驾驶需要仿真。几年前看非诚勿扰,嘉宾黄澜表示要有2/3的人接受自动驾驶她才会接受,体现了普通群众对于自动驾驶安全性的关注。而...
-
链世界:一种简单而有效的人类行为Agent模型强化学习框架
强化学习是一种机器学习的方法,它通过让智能体(Agent)与环境交互,从而学习如何选择最优的行动来最大化累积的奖励。强化学习在许多领域都有广泛的应用,例如游戏、机器人、自动驾驶等。强化学习也可以用于干预人类的行为,帮助人类实现他们的长期目标,例如戒烟、减...
-
2024年度AI投资策略报告:AI三要素共振,AIGC云到端加速推进
今天分享的AI系列深度研究报告:《2024年度AI投资策略报告:AI三要素共振,AIGC云到端加速推进》。 (报告出品方:中国银河证券研究院) 报告共计:103页 核心观点:行业热度将持续,积极把握六大投资主线 (一 行业行情回顾及 2...
-
利用人工智能减少碳排放的策略
随着世界努力应对气候变化的迫切需要,人工智能(AI 等创新技术成为追求可持续发展的有力工具。本文探讨了利用人工智能减少各个行业碳排放的策略,强调了人工智能在应对气候变化方面推动变革的潜力。 能源效益优化 人工智能驱动的算法可以优化各个行业的能源消耗,识...
-
人工智能和机器学习在物联网中的作用有哪些
将人工智能(AI 和机器学习(ML 集成到物联网(IoT 系统中,标志着智能技术发展的革命性一步。这种融合通常被称为AIoT(物联网人工智能 ,不仅是能力的增强,而且是物联网系统如何运行、学习和适应环境的根本转变。让我们来探讨一下这种集成及其含义。 人...
-
ADMap:用于重建在线矢量化高精地图的抗干扰框架
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接:https://arxiv.org/pdf/2401.13172.pdf 代码链接:https://github.com/hht1996ok/ADMap 摘要 本文介绍了ADMap:用...