-
华为云盘古大模型5.0发布:可控时空生成技术重塑自动驾驶开发
快科技6月21日消息,在今日召开的华为开发者大会(HDC 2024 上,华为云发布了盘古大模型5.0,其创新的多模态生成能力,可以为自动驾驶领域提供更高质量的数据支持。 华为常务董事、华为云CEO张平安表示,盘古5.0通过创新的可控时空生成,大规模的生成和...
-
Kimi创始人套现4000万美元疑云|「商汤」大模型一体机可节约80%推理成本,完成云端边全栈布局|中国AI活化石,熬成AIGC第一股| 谁在制造小米汽车?
Kimi创始人套现4000万美元疑云 「商汤」大模型一体机可节约80%推理成本,完成云端边全栈布局 苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相 特斯拉的反围剿战术还剩下啥? 腾讯出手,投了家创新药公司 谁在制造小米汽车? 估值...
-
生成式AI爆发时代,决策式AI“不香了”?
2022年12月,ChatGPT3.5的发布引发了全球范围内对大模型的广泛关注,2023年2月国内高校率先发布产品,2023年6月开始国内涌现出众多的通用大模型和垂类大模型,目前国内大模型产业呈现出“百模大战”的竞争格局。 大模型热引发了全球范围内对生成式...
-
硬核解读KubeEdge基于大模型边云协同的机器人语义分割算法
本文分享自华为云社区《KubeEdge:基于大模型边云协同的机器人语义分割算法》,作者:云容器大未来。 近年来快速发展的视觉大模型(例如 SAM 在促进高精度的智能感知方面具有很大的潜力。然而,边缘环境中的资源限制往往会限制这种视觉大模型在本地部署,从...
-
AI日报:美图发布AI视频神器MOKI;OpenAI靠ChatGPT半年赚34亿美元;斯坦福开发对口型视频模型PROTEUS
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、美图发布王炸产品MOKI 可一...
-
送懂车帝“出嫁”,张一鸣豪赌AI
上线七年后,身为国内三大汽车资讯平台之一的懂车帝,距离启动IPO(首次公开募股)又近了一步。 近日有媒体报道称,字节正在为旗下业务懂车帝寻求融资,希望募集7亿~8亿美元,并为上市做准备。本轮融资,懂车帝估值可达30亿美元。 这是懂车帝首次传出融资消息。上述...
-
对国内AI算力紧缺问题的若干看法
今天凌晨的苹果WWDC证实了一点:AI推理算力将长期处于“云端为主”的状态,这个“长期”至少是三到五年。是的,苹果与OpenAI建立了战略合作,计划将下一代iOS系统与ChatGPT深度融合;但是绝大部分生成式AI推理,包括文字和图片生成任务,仍将上传到C...
-
AIGC技术的发展与前景
如何看待AIGC技术? 方向一:技术应用 人工智能生成对抗网络(AIGC)技术在各个领域都有广泛的应用,其影响和潜力逐渐显现。以下是一些领域和应用案例: 1. **医疗保健**: - **医学影像诊断**:AIGC可以帮助医生...
-
Thoughtworks肖然:大模型走向大众,需要新的应用开发逻辑
嘉宾 | 肖然 采访 & 撰稿 | 云昭 出品 | 51CTO技术栈(微信号:blog51cto) 新年伊始,AI大佬们频繁被问及一个话题:“什么时候有杀手级AI应用”。几个月过去,诸如AI Pin、Rabbit R1、Devin等AI产品一闪...
-
迈向『闭环』| PlanAgent:基于MLLM的自动驾驶闭环规划新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 中科院自动化所深度强化学习团队联合理想汽车等提出了一种新的基于多模态大语言模型MLLM的自动驾驶闭环规划框架—PlanAgent。该方法以场景的鸟瞰图和基于图的文本提示为输入,利用多模态大语言模型的多...
-
报道称,马斯克将数千个AI芯片从特斯拉转移到了X
根据CNBC获得的芯片制造商的电子邮件,埃隆·马斯克(Elon Musk)订购了数千个运往特斯拉的英伟达制造的AI芯片,这些芯片将被转移到他的社交媒体公司X。据该媒体报道,此举有可能将特斯拉收购价值5亿美元的处理器的时间推迟数月。 图源备注:图片由AI生...
-
黄仁勋:下一波浪潮是物理AI 将进入全新机器人时代
站长之家(ChinaZ.com)6月5日 消息:在最近的一次演讲中,英伟达公司的CEO黄仁勋描绘了一个引人注目的未来愿景——物理AI,这一新的技术浪潮正在悄然改变我们的世界。他提出,物理AI,或称为实体AI,是指那些能够模拟智能生物体在控制、形态、动作执行...
-
AI信任问题:你需要知道的事情
随着AI在我们的日常生活和商业运营中的快速发展和整合,AI信任已经成为人类体验和体验经济运行中更加关键的元素。AI技术具有提高效率、个性化体验和管理复杂任务的能力。 然而,它们也带来了挑战,特别是在维护和促进信任方面。 AI对系统的信任 AI系统正越来...
-
理解老司机,超越老司机!LeapAD:具身智能加持下的双过程自驾系统(上海AI Lab等)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文信息 论文题目:Continuously Learning, Adapting, and, Improving: A Dual-Process Approach to Autonomous Dr...
-
港科大最新!Vista:一种具有高保真度和多功能可控的世界模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability 论文链接...
-
【AIGC调研系列】MiniCPM-Llama3-V2.5模型与GPT-4V对比
MiniCPM-Llama3-V2.5模型与GPT-4V的对比可以从多个方面进行分析,包括性能、应用场景和技术特点。 从性能角度来看,MiniCPM-Llama3-V2.5在OCR识别、模型幻觉能力和空间理解能力方面表现出色,实现了开源模型的性能SOTA...
-
Yann LeCun:ViT慢且效率低,实时图像处理还得看卷积
在 Transformer 大一统的时代,计算机视觉的 CNN 方向还有研究的必要吗? 今年年初,OpenAI 视频大模型 Sora 带火了 Vision Transformer(ViT)架构。此后,关于 ViT 与传统卷积神经网络(CNN)谁更厉害的争...
-
武汉市民点赞无人驾驶,市交通运输局:与头部企业共创智能网联汽车产业新蓝图
“武汉市注重智能网联汽车产业发展,已陆续开放智能网联汽车开放道路超千公里,鼓励智能网联汽车头部企业入驻武汉,携手共创武汉智能网联汽车产业发展新蓝图。百度萝卜快跑作为自动驾驶行业中的领军企业,重视武汉智能网联汽车产业发展,从2022年8月落户武汉经开区以来...
-
清华「天眸芯」登Nature封面:全球首款类脑互补视觉芯片
在开放世界中,智能系统不仅要处理庞大的数据量,还需要应对各种「长尾问题」,如自动驾驶中面临的突发危险、出入隧道的剧烈光线变化、夜间强闪光干扰等。在这类任务上,传统视觉感知芯片由于受到「功耗墙」和「带宽墙」的限制,往往面临失真、失效或高延迟的问题,严重影响...
-
AI大牛karpathy点赞SEAL榜单,LLM评估的状况过去是非常糟糕的!
lmsys.org的一个严肃的竞争对手已经加入了对LLMs(大型语言模型)评估的讨论中:SEAL Leaderboards——对领先前沿模型进行的私密、专家评估。 SEAL Leaderboards的设计原则: 🔒私密 + 无法被利用。在评估上不会过度拟...
-
比PID更丝滑的控制算法&卡内基梅隆大学
本文经自动驾驶之心公众号授权转载,转载请联系出处。 MPC控制算法,全称Model Predictive Control(模型预测控制),是一种基于系统动态模型的控制技术。它的工作原理是通过数学模型预测系统的未来行为,并基于这些预测结果来优化系统的控制...
-
腾讯云存储面向AIGC全面升级,搭载全面自研存储引擎
云厂商继续为大模型加速落地铺路架桥。 4月8日,腾讯云宣布云存储解决方案面向AIGC场景全面升级,能够针对AI大模型数据采集清洗、训练、推理、数据治理全流程提供全面、高效的云存储支持。数据显示,采用腾讯云AIGC云存储解决方案,可将大模型的数据清洗和训...
-
自动驾驶系统架构转变思考
本文经自动驾驶之心公众号授权转载,转载请联系出处。 自动驾驶系统架构转变思考 从事辅助驾驶系统架构一段时间后,感觉到了疲惫和无力感,更加深刻的理解到道德经,道生于有,有生于无,有无相生,难易相承,.....是以圣人处无为之事,行不言之教,万物作焉而不辞...
-
AIGC在汽车软件开发的应用举例
AIGC(人工智能生成内容)在汽车软件开发领域的应用主要体现在以下几个方面: 个性化和定制化车辆的创造:通过分析大型数据集并生成新内容,AIGC技术使得创造更加个性化和定制化的车辆成为可能。这不仅提高了车辆的安全性和用户体验,还推动了自动驾驶汽车的发展。...
-
最猛AI独角兽:一年估值1700亿,再造一个OpenAI!马斯克LeCun却吵起来了
马斯克搞大模型又融到60亿美元(约435亿元)! 这是xAI最大的一轮融资,目前估值已来到240亿美元(约1738亿元),一举超过Anthropic,成为OpenAI之下第二位。 借着这个势头,老马也亲自下场发起招聘广告: 如果你相信我们理解宇宙的使命,...
-
人工智能AI和数字化世界走向何方
2024 年 5 月 23 日,美国众议院外交事务委员会以压倒性多数投票提交了一项法案,该法案将使拜登政府更容易限制 AI 系统的出口。该法案还将赋予美国商务部明确的权力,禁止美国人与外国人合作开发对美国国家安全构成威胁的 AI 系统。 路透社本月报...
-
英伟达赢麻了!马斯克xAI超级算力工厂曝光,10万块H100、数十亿美元
最近几年,随着大语言模型的飞速发展与迭代,科技巨头们都竞相投入巨额财力打造超级计算机(或大规模 GPU 集群)。他们认为,更强大的计算能力是实现更强大 AI 的关键。 早在 2022 年,Meta 即宣布与英伟达共同打造大型 AI 研究超级计算机「AI...
-
马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追赶GPT-4o
前段时间,OpenAI、谷歌、微软相继开大会,AI圈子的竞争如火如荼。 这么热闹的时候,怎么能少得了马斯克。 前段时间忙着特斯拉和星链的他,最近好像开始腾出手,而且不鸣则已、一鸣惊人,直接放出一个大消息——自己要造世界上最大的超算中心。 今年3月,他旗下...
-
目标检测新SOTA,端侧实时识别,沈向洋罕见转发点赞
目标检测领域,迎来了新进展—— Grounding DINO 1.5,IDEA研究院团队出品,在端侧就可实现实时识别。 这一进展获得AI大佬沈向洋转发,他一般都是一年一转的节奏。 此次发布主要有两个版本:Pro和Edge。Pro版更强,Edge版更快。...
-
DiffMap:首个利用LDM来增强高精地图构建的网络
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文标题: DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model 论文作者: Peijin Jia, Tuo...
-
PVTransformer: 可扩展3D检测的点到体素Transformer
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:PVTransformer: Point-to-Voxel Transformer for Scalable 3D Object Detection 论文链接:https://arxiv.org...
-
综述!全面概括基础模型对于推动自动驾驶的重要作用
写在前面&笔者的个人理解 近年来,随着深度学习技术的发展和突破,大规模的基础模型(Foundation Models)在自然语言处理和计算机视觉领域取得了显著性的成果。基础模型在自动驾驶当中的应用也有很大的发展前景,可以提高对于场景的理解和推理。...
-
CVPR 2024|多模态场景感知,小红书高保真人体运动预测方法来了!
设想一下,你在家中准备起身,前往橱柜取东西。一个集成 SIF3D 技术的智能家居系统,已经预测出你的行动路线(路线通畅,避开桌椅障碍物)。当你接近橱柜时,系统已经理解了你的意图,柜门在你达到之前就已自动打开,无需手动操作。 视频中,左边为 3D 场景...
-
开源!V2Xverse:上交发布首个面向V2X的仿真平台与端到端模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 车路协同的同步驾驶数据 车路协同辅助的自动驾驶V2X-AD(Vehicle-to-everything-aided autonomous driving)在提供更安全的驾驶策略方面具有巨大潜力。研...
-
大模型数据标注平台Scale AI融资10亿美元,估值达138亿美元
日前,大模型领域著名数据标注平台 Scale AI 宣布完成10亿美元的 F 轮融资,公司估值达138亿美元,成为该领域独角兽。 此轮融资由 Accel 领投,亚马逊、英特尔、AMD、思科、Meta、ServiceNow、老虎全球基金等全球知名公司跟投。...
-
案例分享|Alluxio在自动驾驶模型训练中的应用与部署
分享嘉宾: 杨林三-辉羲智能 关于辉羲智能: 辉羲智能是一家做自动驾驶芯片的初创公司,成立于2022年。致力打造创新车载智能计算平台,提供高阶智能驾驶芯片、易用开放工具链及全栈自动驾驶解决方案,助力车企实现优质高效的自动驾驶量产交付,构建低成本、大规...
-
自动驾驶第一性之纯视觉静态重建
本文经自动驾驶之心公众号授权转载,转载请联系出处。 纯视觉的标注方案,主要是利用视觉加上一些GPS、IMU和轮速计传感器的数据进行动静态标注。当然面向量产场景的话,不一定非要是纯视觉,有一些量产的车辆里面,会有像固态雷达(AT128)这样的传感器。如...
-
走进数字时代:采集图片的艺术与科技
在数字化飞速发展的今天,图片采集已成为我们日常生活和工作中不可或缺的一部分。从拍摄美丽的风景照,到记录重要的历史时刻,再到科学研究中的数据分析,采集图片这一行为所蕴含的意义和内涵越来越丰富。接下来,就让我们一起走进这个充满魅力的领域,探索采集图片背后的艺术...
-
加州大学最新!CarDreamer:全面、灵活的自动驾驶算法测试开源平台
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 为了在复杂的真实世界场景中安全导航,自动驾驶汽车必须能够适应各种道路条件并预测未来事件。基于世界模型的强化学习(RL)已经成为一种有前景的方法,通过学习和预测各种环境...
-
自动驾驶场景中的长尾问题怎么解决?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 昨天面试被问到了是否做过长尾相关的问题,所以就想着简单总结一下。 自动驾驶长尾问题是指自动驾驶汽车中的边缘情况,即发生概率较低的可能场景。感知的长尾问题是当前限制单车智能自动驾驶车辆运行设计域的主要原...
-
路径规划概述:基于采样、搜索、优化全搞定!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 1 决策控制与运动规划概述 目前决策控制方法可以分为三类:sequential planning、behavior-aware planning、和end-to-end planning。 seq...
-
魅族21系列首发!Flyme AIOS发布
快科技5月16日消息,今天下午,全新的Flyme AIOS正式发布。 Flyme AIOS的升级重点是AI”,带来了桌面AI搜索、AI生成壁纸、AI游戏超清、AI连麦对话、AI智能打码、AI笔记创作、AI全局录音、AI客服对话等等功能。 并且Flyme A...
-
重塑生成式 AI 时代的云上「构建」体验
生成式AI时代下的云计算行业变革在全面加速,新的云上构建的时间已经到来,作为一位开发者,如何才能游刃有余地应技术革新?如何快速抓住新技术机遇快速上手和成长?加入开发者开发者必去的 2024 年亚马逊云科技中国峰会,可以帮您答疑解惑并获得回报!亚马逊云科技...
-
大模型真要取代程序员了?最危险的岗位是......
如今,随着大模型在编程、代码生成、自动化测试等领域展现出越来越强大的能力,一个引人深思的问题浮现出来:大模型会不会最终取代程序员的工作? 有些人认为,世界上本就没有哪项工作是绝对安全的,机器取代人工本就是迟早的事。从 GitHub Copilot...
-
DenserRadar:基于密集LiDAR点云的4D毫米波雷达点云检测器
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:DenserRadar: A 4D millimeter-wave radar point cloud detector based on dense LiDAR point clouds 论...
-
AI风投基金OpenAI Startup Fund额外筹集500万美元资金
OpenAI Startup Fund 是一家早期投资于人工智能公司的风投基金,最近从美国证券交易委员会提交的文件中可以看到,该基金已额外融资500万美元。 这笔新资金来自两位投资者,他们将资金转入了 OpenAI Startup Fund 关联的特殊目的...
-
OpenAI 创投基金继续扩大规模 支持多家人工智能初创公司
根据向美国证券交易委员会提交的文件,OpenAI Startup Fund 是一家投资早期人工智能公司的风险基金。最近,该基金已成功额外筹集了500万美元,并将法律控制权从 Sam Altman 移交给 Ian Hathaway。 新资金由两名投资者...
-
超越ORB-SLAM3!SL-SLAM:低光、严重抖动和弱纹理场景全搞定
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 今天我们探讨下深度学习技术如何改善在复杂环境中基于视觉的SLAM(同时定位与地图构建)性能。通过将深度特征提取和深度匹配方法相结合,这里介绍了一种多功能的混合视觉SLAM系统,旨在提高在诸如低...
-
外媒曝光苹果放弃造车真实原因!高管体验ChatGPT后担心掉队
快科技5月12日消息,近日,有国外媒体报道了苹果公司放弃自动驾驶汽车项目的原因。 报道称,苹果高层在体验了OpenAI推出的聊天机器人ChatGPT后,对其背后的强大生成式人工智能技术感到震惊。 苹果担心新兴AI技术可能威胁到iPhone的市场主导地位,甚...
-
SIGGRAPH'24 | 太逆天了!利用分层3D GS,实时渲染超大规模场景!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 近年来,新视角合成取得了重大进展,3D Gaussian splatting提供了出色的视觉质量、快速训练和实时渲染。然而,训练和渲染所需的资源不可避免地限制了可以以良好视觉质量表示的场景大小。本文引入...