-
案例分享|Alluxio在自动驾驶模型训练中的应用与部署
分享嘉宾: 杨林三-辉羲智能 关于辉羲智能: 辉羲智能是一家做自动驾驶芯片的初创公司,成立于2022年。致力打造创新车载智能计算平台,提供高阶智能驾驶芯片、易用开放工具链及全栈自动驾驶解决方案,助力车企实现优质高效的自动驾驶量产交付,构建低成本、大规...
-
时间序列预测:探索性数据分析和特征工程的实用指南
时间序列分析是数据科学和机器学习领域最广泛的主题之一:无论是预测金融事件、能源消耗、产品销售还是股票市场趋势,这一领域一直是企业非常感兴趣的领域。 随着机器学习模型的不断进步,使除了传统的统计预测方法(如回归模型、ARIMA模型、指数平滑 外,与机器学习...
-
牛津大学最新 | 近400篇总结!畅谈大语言模型与三维世界最新综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 随着大型语言模型(LLM)的发展,它们与3D空间数据(3D LLM)之间的集成取得了快速进展,为理解物理空间和与物理空间交互提供了前所未有的能力。本文全面概述了LLM...
-
一文带您了解SHAP:机器学习的模型解释
在机器学习和数据科学领域,模型的可解释性一直是研究者和实践者关注的焦点。随着深度学习和集成方法等复杂模型的广泛应用,理解模型的决策过程变得尤为重要。可解释人工智能(Explainable AI ,XAI)通过提高模型的透明度,帮助建立对机器学习模型的信任...
-
蚂蚁多模态团队在视频多模态方向的技术探索
一、概述 视频多模态检索在蚂蚁内部有着广泛的应用。视频多模态检索具体包括两个方向,一个是视频-文本的语义检索,另外一个是视频-视频的同源检索。 视频-文本的语义检索方向旨在通过文本检索与其语义相近的视频,其检索文本未必在检索到的视频描述中直接出现,但检...
-
替代MLP的KAN,被开源项目扩展到卷积了
本月初,来自 MIT 等机构的研究者提出了一种非常有潜力的 MLP 替代方法 ——KAN。 KAN 在准确性和可解释性方面表现优于 MLP,而且它能以非常少的参数量胜过以更大参数量运行的 MLP。比如,作者表示,他们用 KAN 以更小的网络和更高的自动化...
-
探秘数据之源:如何高效采集指定网站信息
在当今信息爆炸的时代,数据已经成为了一种宝贵的资源。无论是学术研究、商业分析还是日常信息获取,采集指定网站的数据都显得至关重要。本文将深入探讨网站数据采集的技巧、工具以及所面临的挑战,帮助读者更好地从海量网络中汲取所需信息。一、网站数据采集的重要性随着互联...
-
数据更多更好还是质量更高更好?这项研究能帮你做出选择
对基础模型进行 scaling 是指使用更多数据、计算和参数进行预训练,简单来说就是「规模扩展」。 虽然直接扩展模型规模看起来简单粗暴,但也确实为机器学习社区带来了不少表现卓越的模型。之前不少研究都认可扩大神经模型规模的做法,所谓量变引起质变,这种观点也...
-
自动驾驶场景中的长尾问题怎么解决?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 昨天面试被问到了是否做过长尾相关的问题,所以就想着简单总结一下。 自动驾驶长尾问题是指自动驾驶汽车中的边缘情况,即发生概率较低的可能场景。感知的长尾问题是当前限制单车智能自动驾驶车辆运行设计域的主要原...
-
探究Gelato CMS爬虫:功能、应用与未来发展
随着互联网技术的飞速发展,内容管理系统(CMS)已成为众多网站建设不可或缺的一部分。而Gelato CMS,作为市场上备受瞩目的CMS之一,其功能和特性吸引了大量用户的关注。而在众多功能中,Gelato CMS所支持的爬虫技术更是成为关注的焦点。本文将围绕...
-
探秘博客园:文章自动爬虫技术解析与实践
随着互联网信息的爆炸式增长,如何高效地获取与整合网络资源成为了众多研究的热点。博客园作为国内知名的技术博客平台,汇聚了大量高质量的技术文章。在这样的背景下,博客园文章自动爬虫技术应运而生,成为了数据获取与分析的重要工具。本文将深入解析博客园文章自动爬虫的技...
-
HuggingFace教你怎样做出SOTA视觉模型
前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。 其他从业者在震撼之余,也再次开始思考怎么追赶这些超级模型了。 刚好在这时,HuggingFace和法国索邦大学的一篇论文,总结出了构建视觉大模型的关键经验,给开发者指明了一...
-
数据分析师噩梦?ChatGPT实时互动分析Excel数据,网友挖出背后新模型
ChatGPT更强了... 刚刚,OpenAI再次放出大招——ChatGPT可以直接打开线上数据文件,完成实时数据分析。 图片 全新的增强功能,具体包括: - 直接从Google Drive和Microsoft OneDrive上传最新版本的文件 - 在...
-
Ilya离职后第一个动作:点赞了这篇论文,网友抢着传看
自Ilya Sutskever官宣离职OpenAI后,他的下一步动作成了大家关注焦点。 甚至有人密切关注着他的一举一动。 这不,Ilya前脚刚刚点赞❤️了一篇新论文—— ——网友们后脚就抢着都看上了: 论文来自MIT,作者提出了一个假说,用一句话总结...
-
CVPR'24 Oral | 一览纯稀疏点云检测器SAFDNet的前世今生!
写在前面&笔者的个人理解 3D点云物体检测对自动驾驶感知至关重要,如何高效地从稀疏点云数据中学习特征表示是3D点云物体检测面临的一个关键挑战。我们在本文中将会介绍团队发表在NeurIPS 2023的HEDNet和CVPR 2024的SAFDNet...
-
使用开源GenAI时需要注意的十个问题
如今似乎任何人都可以制作AI模型。即使你没有训练数据或编程技巧,你也可以选择你喜欢的开源模型,对其进行调整,并以新的名字发布。 根据斯坦福大学在4月发布的AI指数报告,2023年发布了149个基础模型,其中三分之二是开源的,而且有大量的变体。Huggi...
-
识别细胞也能用大模型了!清华系团队出品,已入选ICML 2024 | 开源
大模型带来的生命科学领域突破,刚刚再传新进展。 来自清华系,使用大模型实现了单细胞身份识别,同时模型LangCell也正式对外开源。 它不仅可以准确识别细胞身份,还具有很强的零样本分析能力,论文已被ICML 2024录⽤。 LangCell的数据集中包...
-
一些 Llama3 微调工具以及如何在 Ollama 中运行
Llama3是Meta提供的一个开源大模型,包含8B和 70B两种参数规模,涵盖预训练和指令调优的变体。这个开源模型推出已经有一段时间,并且在许多标准测试中展示了其卓越的性能。特别是Llama3 8B,其具备小尺寸和高质量的输出使其成为边缘设备或者移动设...
-
UIUC发布StarCoder2-15B-Instruct代码大模型 无需OpenAI数据登上性能榜单
UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型,这一创新成果在代码生成任务方面取得了显著突破。这款模型成功超越了CodeLlama-70B-Instruct,登上了代码生成性能榜单之巅。 StarC...
-
不止3D高斯!最新综述一览最先进的3D重建技术
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 基于图像的3D重建是一项具有挑战性的任务,涉及从一组输入图像推断目标或场景的3D形状。基于学习的方法因其直接估计3D形状的能力而受到关注。这篇综述论文的重点是最先进的...
-
GPT-4o成全球网友新玩具,秒秒钟纸质原型转录初始HTML,网友:谷歌你是一点流量摊不上啊
好啊,不愧是OpenAI最新旗舰,打开各个社交软件,GPT-4o的上手测试都唰唰唰往我首页推。 请!看! 这,就是用上GPT-4o,花不到30s时间,通过单个prompt把一个电子表格中的内容生成了完整的图表和统计分析。 在过去,在Excel里做这玩意儿...
-
告别3D高斯Splatting算法,带神经补偿的频谱剪枝高斯场SUNDAE开源了
本论文作者包括帝国理工学院硕士生杨润一、北航二年级硕士生朱贞欣、北京理工大学二年级硕士生姜洲、北京理工大学四年级本科生叶柏均、中国科学院大学本科大三学生张逸飞、中国电信人工智能研究院多媒体认知学习实验室(EVOL Lab)负责人赵健、清华大学智能产业研究...
-
无需OpenAI数据,跻身代码大模型榜单!UIUC发布StarCoder-15B-Instruct
在软件技术的前沿,UIUC张令明组携手BigCode组织的研究者,近日公布了StarCoder2-15B-Instruct代码大模型。 这一创新成果在代码生成任务取得了显著突破,成功超越CodeLlama-70B-Instruct,登上代码生成性能榜单之...
-
MIT最新!多模态LLM真的无所不能吗?大模型能解决一切难题吗?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文对自动驾驶领域内多模态大型语言模型(MLLMs)的应用进行了审慎的审视,并对一些常见的假设提出了质疑/验证,重点关注它们通过闭环控制环境中的图像/帧序列推理和解释...
-
DenserRadar:基于密集LiDAR点云的4D毫米波雷达点云检测器
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:DenserRadar: A 4D millimeter-wave radar point cloud detector based on dense LiDAR point clouds 论...
-
Llama-3的竞争对手来了——可运行在iPhone上的小体量高性能LLM模型Phi-3
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介 熟悉我的文章的读者可能还记得我以前报道《课本就是你所需要的一切》(https://medium.com/@mgunton7/th...
-
西浦、利物浦大学提出:点云数据增强首个全面综述
本论文的第一作者朱钦峰是西交利物浦大学和利物浦大学联合培养的一年级在读博士,其导师为范磊副教授。他的主要研究方向为语义分割、多模态信息融合、3D视觉、高光谱图像和数据增强。 本文是对发表于模式识别领域顶刊Pattern Recognition 2024的...
-
思维链不存在了?纽约大学最新研究:推理步骤可省略
红极一时的思维链技术,可能要被推翻了! 还在惊讶于大模型居然能够利用思维链分步骤思考? 还在苦于不会写思维链提示词? 来自纽约大学的研究人员表示:「没关系的,都一样」, 推理步骤不重要,不想写提示词也可以不写,用省略号代替就行了。 论文地址:https...
-
李开复称中国需要自己的ChatGPT 目前国内AI都不够好
在最近的一次采访中,知名科技领袖李开复对中国在人工智能领域的现状和未来发表了独到见解。他强调,中国急需拥有自己的ChatGPT,以激发民众对AI的浓厚兴趣,推动其广泛采用和投资。 李开复指出,相较于美国用户早已体验到的ChatGPT带来的革命性变革,中国用...
-
万字长文总结提示词技巧!新加坡首届GPT-4提示工程大赛冠军最新分享
新加坡(GovTech)举办了首届GPT-4提示工程竞赛,Sheila Teo很幸运地取得了胜利。 提示工程是一门融合了艺术和科学的学科——它既是对技术的理解,也包含创造力和战略思维。 这次她和我们分享了她在学习过程中学到的提示工程策略,这些策略可以让任...
-
Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2
Refuel AI 最近宣布推出两个新版本的大型语言模型(LLM),RefuelLLM-2和 RefuelLLM-2-small,这两个模型专为数据标注、清洗和丰富任务而设计,旨在提高处理大规模数据集的效率。 RefuelLLM-2的主要特点包括: 自...
-
美国教授用2岁女儿训AI模型登Science!人类幼崽头戴相机训练全新AI
【新智元导读】为训练AI模型,纽约州立大学的一名教授Brenden Lake,竟让自己不到2岁女儿头戴相机收集数据!要知道,Meta训Llama3直接用了15万亿个token,如果Lake真能让AI模型学习人类幼崽,从有限的输入中学习,那LLM的全球数据荒...
-
Fine-Tuning Vs RAG ,该如何选择?
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 构建块:向量、令牌和嵌入 。 随着技术的不断进步,LLM 带来了前所未有的机遇,吸引了开发者和组织纷纷尝试利用其强大的能力构建应用程序。然而,当预训...
-
力压Transformer?首篇Mamba综述来了!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 Mamba是一种新的选择性结构状态空间模型,在长序列建模任务中表现出色。Mamba通过全局感受野和动态加权,缓解了卷积神经网络的建模约束,并提供了类似于Transfo...
-
超越ORB-SLAM3!SL-SLAM:低光、严重抖动和弱纹理场景全搞定
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 今天我们探讨下深度学习技术如何改善在复杂环境中基于视觉的SLAM(同时定位与地图构建)性能。通过将深度特征提取和深度匹配方法相结合,这里介绍了一种多功能的混合视觉SLAM系统,旨在提高在诸如低...
-
最详细人脑3D地图登Science!GPT-4参数只相当于人类0.2%
芝麻粒大小的人脑组织,突触规模就相当于一个GPT-4! 谷歌与哈佛联手,对局部人脑进行了纳米级建模,论文已登Science。 这是迄今为止最大、最详细的人脑复制品,首次展示出了大脑中的突触连接网络。 凭借超高分辨率,这个名为H01的重建,已经揭示了一些...
-
SIGGRAPH'24 | 太逆天了!利用分层3D GS,实时渲染超大规模场景!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 近年来,新视角合成取得了重大进展,3D Gaussian splatting提供了出色的视觉质量、快速训练和实时渲染。然而,训练和渲染所需的资源不可避免地限制了可以以良好视觉质量表示的场景大小。本文引入...
-
优秀Agent智能体必学的几种设计模式,一学就会
大家好,我是老渡。 昨天在公司听了清华大学智能产业研究院现场分享的AI医院小镇。 图片 这是一个虚拟世界,所有的医生、护士、患者都是由LLM驱动的Agent智能体,可以自主交互。它们模拟了整个诊病看病的过程,在涵盖主要呼吸道疾病的MedQA数据集子集上,...
-
企业如何管理生成式人工智能安全风险
事实表明,尽管有很多好处,但生成式人工智能也给企业带来了许多安全挑战,而且可能代价高昂。而企业需要审查可能的威胁和最佳实践以降低风险。 在ChatGPT推出之后,生成式人工智能模型的迅速采用有望从根本上改变企业开展业务以及与客户和供应商互动的方式。 生...
-
太酷了!手机上部署最新AI大模型!只需两步!
在当前的AI革命中,大模型扮演着至关重要的角色,而这背后的基础便是Scaling Law。简而言之,随着数据、参数和计算能力的不断提升,大模型的能力也随之增强,展现出小规模模型所无法比拟的“涌现能力”。越来越多的AI企业纷纷推出开源大模型,按照扩展定律实...
-
万字长文超全总结Pytorch核心操作!
在深度学习与人工智能领域,PyTorch已成为研究者与开发者手中的利剑,以其灵活高效的特性,不断推动着新技术的边界。对于每一位致力于掌握PyTorch精髓的学习者来说,深入了解其核心操作不仅是提升技能的关键,也是迈向高级应用与创新研究的必经之路。本文精心...
-
原作者带队,LSTM真杀回来了!
20 世纪 90 年代,长短时记忆(LSTM)方法引入了恒定误差选择轮盘和门控的核心思想。三十多年来,LSTM 经受住了时间的考验,并为众多深度学习的成功案例做出了贡献。然而,以可并行自注意力为核心 Transformer 横空出世之后,LSTM 自身所...
-
DriveWorld:一个预训练模型大幅提升检测+地图+跟踪+运动预测+Occ多个任务性能
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 以视觉为中心的自动驾驶技术近期因其较低的成本而引起了广泛关注,而预训练对于提取通用表示至关重要。然而,当前的以视觉为中心的预训练通常依赖于2D或3D预训练任务,忽视了自动驾驶作为4D场景理解...
-
AlphaGo核心算法增强,7B模型数学能力直逼GPT-4,阿里大模型新研究火了
把AlphaGo的核心算法用在大模型上,“高考”成绩直接提升了20多分。 在MATH数据集上,甚至让7B模型得分超过了GPT-4。 一项来自阿里的新研究引发关注: 研究人员用蒙特卡洛树搜索(MCTS)给大语言模型来了把性能增强,无需人工标注解题步骤,也能...
-
时间序列概率预测的共形预测
前面我们介绍了用于时间序列概率预测的分位数回归,今天继续学习基于概率预测的时间序列概率预测方法--共形预测。 现实世界中的应用和规划往往需要概率预测,而不是简单的点估计值。概率预测也称为预测区间或预测不确定性,能够提供决策者对未来的不确定性状况有更好的认...
-
Stack Overflow 大规模封禁账号:只因大量用户反对与 OpenAI 的合作
编译丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 久负盛名的开发者论坛Stack Overflow最近宣布其与OpenAI达成合作,ChatGPT 将使用 Stack Overflow 的数据,而 OpenAI...
-
理论+实践,带你了解分布式训练
本文分享自华为云社区《大模型LLM之分布式训练》,作者: 码上开花_Lancer。 随着语言模型参数量和所需训练数据量的急速增长,单个机器上有限的资源已无法满足大语言模型训练的要求。需要设计分布式训练(Distributed Training)系统来解决...
-
LLM全搞定!OmniDrive:集3D感知、推理规划于一体(英伟达最新)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 这篇论文致力于解决当前多模态大语言模型 (MLLMs 在自动驾驶应用中存在的关键挑战,尤其是将MLLMs从2D理解扩展到3D空间的问题。由于自动驾驶车辆 (AVs ...
-
清华首个AI医院小镇来了!AI医生自进化击败人类专家,数天诊完1万名患者
斯坦福AI小镇曾火遍了全网,25个智能体生活交友,堪称现实版的「西部世界」。 而现在,AI「医院小镇」也来了! 最近,来自清华团队的研究人员开发了一个名为「Agent Hospital」的模拟医院。 论文地址:https://arxiv.org/pdf...
-
港大开源图基础大模型OpenGraph 增强图学习泛化能力
香港大学数据智能实验室主任黄超团队开发了一款名为 OpenGraph 的图基础大模型,专注于在多种图数据集上进行零样本预测。该模型通过学习通用的图结构模式,仅通过前向传播即可对全新数据进行预测,有效缓解了图学习领域的数据饥荒问题。 关键特点: 强泛化能...