-
南大俞扬深度解读:什么是「世界模型」?
随着媒体狂炒Sora,OpenAI的介绍材料中称Sora是「world simulator」,世界模型这个词又进入视野,但很少有文章来介绍世界模型。 这里回顾一下什么是世界模型,以及讨论Sora是不是world simulator。 什么是world...
-
英伟达市值超越俄罗斯GDP 「英伟达」人工智能AI应用有哪些?
最近关于「英伟达市值超越俄罗斯GDP」的报道显示出英伟达在市场上的强大地位和价值。这一数字的背后反映了英伟达在人工智能领域的重要地位,以及市场对其未来发展的信心。英伟达AI技术的广泛应用将继续推动其市值的增长,同时也开启了更多创新和合作的机会。 英伟达A...
-
「人车交互」新突破!普渡大学发布Talk2Drive框架:可学习/定制的「指令识别」系统
在普渡大学数字孪生实验室的最新成果中,研究人员引入了一种革命性的技术——利用大型语言模型(LLM)为自动驾驶汽车提供智能指令解析能力。 该技术的核心为Talk2Drive框架,旨在通过理解人类的自然语言来控制自动驾驶汽车,从而实现了一种前所未有的人车交互...
-
边缘人工智能:让智能更接近源头
随着人工智能的发展,不是把数据交给算法,而是算法去处理数据,从而实现一个全新的洞察力水平。 如今,人工智能 (AI 无处不在,使组织能够预测系统中断的可能性,推动自动驾驶汽车,并为聊天机器人或虚拟助手提供语言功能。 这些类型的人工智能用例主要依赖于...
-
动手实践丨轻量级目标检测与分割算法开发和部署(RK3568)
本文分享自华为云社区《自动驾驶(AIOT - 轻量级目标检测与分割算法开发和部署(RK3568 【玩转华为云】》,作者:HouYanSong。 本文将在ModelArts平台上开发轻量级目标检测与分割算法,并使用ModelBox框架在RK3568开发板...
-
YOLOv9官网体验入口 AI目标检测深度学习工具下载地址
YOLOv9是一款目标检测深度学习模型实现工具,通过使用可编程梯度信息来学习用户想要学习的内容。这个开源项目具有高效和准确的优势,主要用于目标检测任务。 点击前往YOLOv9 官网体验入口 谁可以从YOLOv9中受益? YOLOv9适合需要进行图像识别、...
-
YOLO不死!YOLOv9出炉:性能速度SOTA~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 如今的深度学习方法专注于设计最适合的目标函数,以使模型的预测结果与实际情况最接近。同时,必须设计一个合适的架构,以便为预测获取足够的信息。现有方法忽略了一个事实,即当输入数据经过逐层特征提取和空间变换...
-
ai毕业论文开题报告(开题报告ai写作免费)
宝子们在论文撰写过程中,研究背景的阐述在学术写作的引言部分扮演着非常重要的角色。很多宝子们在撰写引言时常遇到一个难题——如何有效、有逻辑地构建研究背景。这个问题通常源于对于如何撰写研究背景不是很明确,以及缺乏清晰的写作框架。很可能导致收集到的相关信息被杂乱...
-
人工智能、机器学习、深度学习,到底是个啥?
说到近些年的火热名词,“人工智能”必须榜上有名。随着去年ChatGPT爆火出圈,“AI(Artificial Intelligence,人工智能)”屡次霸屏热搜榜,并被英国词典出版商柯林斯评为2023年的年度词。 除了“人工智能”,我们还经常听到“机器学...
-
黄仁勋身家一年暴增4倍: 英伟达AI人工智能软件应用有哪些?
最近报道显示,英伟达公司首席执行官黄仁勋的身家在 2023 年飙升至 440 亿美元,这一数字较年初增长了 302 亿美元,使他成为今年收入最高的企业家之一。这一成就得益于英伟达股价在今年飙升了近246%。投资者对英伟达在人工智能领域的领先地位和引领力的信...
-
鱼眼相机与超声波传感器融合实现鸟瞰近场障碍物感知
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接:https://browse.arxiv.org/pdf/2402.00637.pdf 视频链接:https://youtu.be/JmSLBBL9Ruo 本文介绍了鱼眼相机与超声传...
-
EgoGen官网体验入口 微软AI合成数据生成自我感知工具使用指南
EgoGen是一个用于生成以自我为中心的合成数据的系统,它能够模拟头戴设备(HMDs)的相机装置,并从相机佩戴者的视角渲染多种传感器数据。该系统提供了丰富的多模态数据和准确的注释,适用于自我感知任务。 点击前往EgoGen官网体验入口 谁可以从EgoGe...
-
清华叉院、理想提出DriveVLM,视觉大语言模型提升自动驾驶能力
与生成式 AI 相比,自动驾驶也是近期 AI 最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统,人们面临的主要挑战是 AI 的场景理解,这会涉及到复杂、不可预测的场景,例如恶劣天气、复杂的道路布局和不可预见的人类行为。 现有的自动驾驶系统通常包括...
-
爆火Sora的背后 | 聊聊什么是world models!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 随着媒体狂炒Sora,OpenAI的介绍材料中称Sora是 “world simulator”,世界模型这个词又进入视野,但很少有文章来介绍世界模型。这里回顾一下什么是世界模型,以及讨论Sora是不是...
-
都在搞端到端,试问端到端自动驾驶的基石到底是什么?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 基础模型的出现彻底改变了自然语言处理和计算机视觉领域,为其在自动驾驶(AD)中的应用铺平了道路。这项调查对40多篇研究论文进行了全面回顾,展示了基础模型在增强AD中的...
-
YOLOv8官网体验入口 AI计算机视觉目标检测模型免费在线使用地址
YOLOv8是YOLO系列目标检测模型的最新版本。它能够在图像或视频中准确快速地识别和定位多个对象,并实时跟踪它们的移动。相比之前版本,YOLOv8在检测速度和精确度上都有很大提升,同时支持多种额外的计算机视觉任务,如实例分割、姿态估计等。YOLOv8可通...
-
四个优秀AI Agent开源项目,谈一谈大模型、人工智能代理
什么是AI Agent? 现在我们与大模型的互动,一般的过程是先输入一个提示词,之后,大模型根据输入内容进行计算并响应。每次想要得到一个新的输出,我们就必须再提供一个提示词。这个过程有点麻烦,因为总是要有人来驱动。 AI Agent(人工智能代理)则以不...
-
逆天了!UniVision:BEV检测和Occ联合统一框架,双任务SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&个人理解 最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处,但在特征表示、数据格式和目标方面仍存在差距,这对统一高效的3D感知...
-
AI驱动的超自动化如何提高业务效率
人们对AI和超自动化感到兴奋,这是有充分理由的,AI具有自动化涉及人类思维和相关行为的复杂企业任务的潜力。 AI驱动的企业超自动化看起来就像自动驾驶汽车的现状,我们有特斯拉可以按需送人们去地方,Waymo在旧金山和凤凰城的街道上漫游,根本没有司机!这是...
-
人工智能如何为未来智能大众出行解决方案铺平道路
预计到2030年,60%的人口将居住在城市地区。现在和未来的必要条件是大量人员进出城市中心的高效流动。城镇化的进步很大程度上依赖于此。在各种公共交通方式中,铁路在每乘客公里的能源消耗方面是最高效、最有效的。 然而,要使铁路成为首选,它必须安全、可靠且可用...
-
SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for Autonomous Driving 论文链接...
-
NeRF成为过去?三维重建迈向3D GS新时代!(复旦大学最新综述)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 3D Gaussian Splatting(3D-GS)已成为计算机图形学领域的一个重大进步,它提供了明确的场景表示和新颖的视图合成,而不依赖于神经网络,如神经辐射场...
-
『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架
本文经自动驾驶之心公众号授权转载,转载请联系出处。 协同感知技术能够有效解决自动驾驶车辆单体感知中存在的障碍物遮挡、视角受限、以及远距离感知能力弱等问题。然而,现有的工作都做了一个过分简单的假设,即参与协作的智能体使用相同的传感器,部署相同的感知模型。...
-
AI自动化标注崛起,数据标注员要失业了?
在数据标注行业流行着一句话:“有多少智能,就有多少人工”。 由于需要标注的数据规模庞大且成本较高,一些互联网巨头及一些AI公司很少自己设有标注团队,大多交给第三方数据服务公司或者数据标注团队来做。 这也衍生出了专为AI而生的人力密集型的数据标注产业链。...
-
马斯克:特斯拉早已掌握视频生成技术 更胜过OpenAI
快科技2月19日消息,据媒体报道,OpenAI发布的首个文生视频模型Sora最近热度十分高,用户通过一句话,就能生成长达1分钟的高清视频。 特斯拉CEO埃隆马斯克在社交媒体平台X上发帖,吹捧了自家模拟现实和视频生成技术是最好的”。 马斯克称,特斯拉在一年前...
-
2024年应该关注的十大人工智能创新
人工智能(AI 不再只是一个流行词,它已成为我们日常生活的重要组成部分。人工智能在去年深入地融入我们社会的各个方面,改变我们的生活方式、工作方式以及与技术互动的方式。 今年是大年初一,我们将探讨2024年可能出现的十大人工智能创新,拥抱这些即将到来的人...
-
周鸿祎谈Sora模型:中美AI差距可能还在加大
2月17日消息,近日,OpenAI 发布了 Sora 模型,该模型可根据用户输入的文本提示词描述,生成一段60秒钟的视频内容。从OpenAI公开的演示视频来看效果非常超现实。 昨日,360董事长周鸿祎在微博发文,谈到OpenAI的文字转视频模型Sora。他...
-
万元预算打造高质量13B私有模型,Colossal-AI LLaMA-2 开源方案再升级
几个月前,Colossal-AI 团队仅利用8.5B token数据、15小时、数千元的训练成本,成功构建了性能卓越的中文LLaMA-2 7B 版本模型,在多个评测榜单性能优越。 在原有训练方案的基础上,Colossal-AI 团队再次迭代,并通过构建更...
-
大模型开车哪家强?普渡研究给指南:GPT-4真行啊
现在一句口令,就能指挥汽车了。 比如说声“我开会要迟到了”“我不想让我朋友等太久”等等,车就能理解,并且自动加速起来。 如果这次行程有不满意的,只需要给汽车提供反馈建议:“要在充分保障安全的前提下”,汽车的自动驾驶行为就会在下次行程中进行自我修正。 这是来...
-
BFT最前线丨浙江大学和蚂蚁集团合作,成立智能视觉实验室;ChatGPT 对亚洲节点大规模封号;谷歌CEO称将推出Bard升级版
文 | BFT机器人 01 浙江大学和蚂蚁集团合作,成立智能视觉实验室 据消息,浙江大学和蚂蚁集团达成合作成立「智能视觉联合实验室」,旨在推进智能视觉的技术创新和产业应用,重点攻坚包括机器视觉、三维重建、视觉内容生成等人工智能...
-
了解AIGC在图像识别和生成中的应用
1.背景介绍 在过去的几年里,人工智能(AI 已经成为了我们生活中的一部分,它在图像识别和生成方面的应用也非常广泛。在这篇文章中,我们将探讨一下AI生成式图像识别(AIGC 在图像识别和生成中的应用,以及其背后的核心概念和算法原理。 1. 背...
-
下一代Edge AI的应用初探
如您所见,AI已不再只是科幻电影的经典主题,它正在以惊人的速度被应用到我们日常生活中的方方面面,并从个人关系到工作项目上,逐渐改变着我们的想法或行为。 其中,一个最为典型的领域当属NextGEN Edge AI(下一代边缘人工智能)应用。它能够通过诸如...
-
OccNeRF:完全无需激光雷达数据监督
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人总结 近年来,3D 占据预测(3D Occupancy Prediction)任务因其独特的优势获得了学界及业界的广泛关注。3D 占据预测通过重建周围环境的 3D 结构为自...
-
三篇论文解决「语义分割的优化和评估」难题!鲁汶/清华/牛津等联合提出全新方法
优化语义分割模型常用的损失有Soft Jaccard损失,Soft Dice损失和Soft Tversky损失,但它们都和软标签不兼容,所以无法支持一些重要的训练技术(例如标签平滑,知识蒸馏,半监督学习,多标注员等)。 另一方面,语义分割常用的评价指标...
-
AIGC在物联网与智能制造中的实践
1.背景介绍 1. 背景介绍 物联网和智能制造是当今最热门的技术领域之一,它们在各种行业中发挥着重要作用。随着计算机视觉、自然语言处理和机器学习等技术的发展,人工智能(AIGC 在物联网和智能制造领域的应用也日益增多。本文将探讨AIGC在物联...
-
挖掘BEV潜力的边界!DA-BEV:无监督BEV SOTA新方案!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 今天和大家探讨3D视觉感知领域中的一个特定问题:针对纯视觉的鸟瞰图(BEV)的无监督领Domain Adaptation(Unsupervised Domain Ad...
-
从0开始用 PyTorch 构建完整的 NeRF
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在解释代码之前,首先对NeRF(神经辐射场)的原理与含义进行简单回顾。而NeRF论文中是这样解释NeRF算法流程的: “我们提出了一个当前最优的方法,应用于复杂场景下合成新视图的任务,具体的实现原理是...
-
网大为卸任腾讯CXO;Midjourney 1 月训练视频模型;2023年马斯克赚了7700亿
投融资 • 2023 年大型科技公司在生成式 AI 初创企业上的投资远超风险投资集团 • 恒信东方与无锡政府合作成立布局 MR/XR 技术及 3D 数字资产 AIGC 产业投资基金 • 新公司法完善注册资本认缴登记制度 • 网大为卸任腾讯CXO,曾促成...
-
哪有人逛街不戴Vision Pro的???
头上长Vision Pro出现人传人现象,这是伦敦街头上演的最新一幕: 秉承着“既然要刺激,那就贯彻到底”的原则,这位小哥一身休闲西装,头戴Vision Pro,遛着自家机器小狗,成为最亮眼的显眼包。 面前有个小台阶时,小哥还朝机器狗伸了伸手,仿佛在对...
-
百度将举办Create AI开发者大会 AI芯片昆仑等多项成果将亮相
百度宣布百度Create AI开发者大会已正式定档于2024年4月16日至17日,在深圳国际会展中心(宝安)隆重举办。届时,百度创始人、董事长兼CEO李彦宏将发表主题演讲,展示最新的百度AI技术突破,并分享对未来趋势的独到见解。 图源备注:图片由AI生成...
-
大模型真能解决一切吗?关于知识驱动自动驾驶的一些思考
本文经自动驾驶之心公众号授权转载,转载请联系出处。 上个星期受邀在外面做了一次关于「知识驱动自动驾驶」的讲座,刚好借这个机会把之前我和团队的一些学术上的思考整理凝练了一下。感觉里面一些内容还是挺值得拿出来分享&讨论的,所以开这么个帖子把其中一些关...
-
机器人和人工智能如何实现供应链的自动化
自动化技术如今正在进入各个行业领域,这在供应链中尤为明显。事实上,正如人们所知,自动化技术的未来进步可能会重塑整个供应链和供应链管理软件。 有远见的供应链参与者已经在为新形势做好准备。首席信息官应该带头为他们的组织带来最好的结果,但首先了解供应链中机器...
-
首个环视世界模型DrivingDiffusion: BEV数据和仿真新思路!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者的一些个人思考 在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面: 不同维度...
-
谁将真正受益于人工智能?
人工智能(AI)已成为我们生活中不可否认的力量。 它正在改变行业、影响决策,并改变我们的生活和工作方式。尽管人工智能的前景广阔,但关于谁将从这场技术革命中获益最多,人们一直在争论。人工智能会让每个人平等受益,还是会加剧现有的差距?在这次深度探索中,我们...
-
Vision Pro开卖炸出各种显眼包!开车/健身/过马路操作秀翻天,AI大牛Karpathy发千字亲测体验
全球第一台Vision Pro被捧出店门的那一刻,整个人群沸腾了。 历史会记住这一刻。苹果Vision Pro的诞生,注定改变全人类,改变全世界。 2月2日早上9点,库克亲临现场,推开纽约苹果门店的大门。 国内的网友,开始打飞的去大洋彼岸抢Visio...
-
人工智能可以帮助改善云计算管理有哪些方式
当企业考虑云管理时,主要考虑的是运营流程,例如监控性能、维护安全性和确保合规性。这些都是成功开展业务的重要方面,但这只是云管理所需要的一部分。 一个经常被忽视的关键方面是通过提供直观的工具和集成的支持流程来改善用户体验,从而消除企业IT基础设施的一些麻...
-
【Stable Diffusion】通过ControlNet修复手臂
ControlNet用处 ControlNet是一个用于机器人控制的高度模块化的、灵活的开源框架,它支持各种传感器、执行器和通信协议。ControlNet可以用于各种应用领域,包括但不限于: 工业自动化:ControlNet可以用于工业自动化系统...
-
数据为王!如何通过数据一步步构建高效的自动驾驶算法?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 下一代自动驾驶技术期望依赖于智能感知、预测、规划和低级别控制之间的专门集成和交互。自动驾驶算法性能的上限一直存在巨大的瓶颈,学术界和业界一致认为,克服瓶颈的关键在于以...
-
Warning!远距离LiDAR感知
本文经自动驾驶之心公众号授权转载,转载请联系出处。 一、引言 去年开了图森ai day之后,一直想以文字形式总结一下这几年在远距离感知方面所做的工作,正好最近有时间了,就想写一篇文章记录一下这几年的研究历程。本文所提到的内容都在图森ai day视频[0]...
-
Depth Anything:释放大规模无标注数据的深度估计
本文经自动驾驶之心公众号授权转载,转载请联系出处。 24年1月论文“Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data“,来自香港大学、字节、浙江实验室和浙江大学。 这项...