-
一览Occ与自动驾驶的前世今生!首篇综述全面汇总特征增强/量产部署/高效标注三大主题
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 近年来,自动驾驶因其在减轻驾驶员负担和提高驾驶安全方面的潜力而越来越受到关注。基于视觉的三维占用预测是一种新兴的感知任务,适用于具有成本效益的自动驾驶感知系统,它可以...
-
7262篇提交,ICLR 2024爆火,两篇国内论文获杰出论文提名
ICLR 全称为国际学习表征会议(International Conference on Learning Representations),今年举办的是第十二届,于 5 月 7 日至 11 日在奥地利维也纳展览会议中心举办。 在机器学习社区中,ICLR...
-
moto首款AI手机 moto X50 Ultra证件照公布
快科技5月7日消息,今天,moto X50 Ultra获得入网许可,该机的素颜照正式公布。 如图所示,moto X50 Ultra采用曲面屏方案,后置矩阵三摄,包含主摄、超广角和潜望长焦。 该机对应的国际版机型是moto Edge 50 Ultra,后者已...
-
制造星野:穿越平行时空和次元壁,揭秘 MiniMax 的另类 AI 世界
“AGI”。 幻海(花名)第一次听到这个词,是在 2022 年 7 月。 跟他“科普”这个词的,是一个戴着眼镜、头顶毛发稀疏,但语速极快的 34 岁男子。后者的公司刚刚成立一年,在这家位于漕河泾科技园的公司那面粉紫色的磨砂屏风上,七个字母“MiniMax”...
-
新研究强调了GenAI应用中的人才短缺和战略缺口
最近的一项研究表明,美国企业对生成式人工智能(GenAI)提高其业务和员工生产力的潜力充满热情。但在高涨的热情背后,领导者认为,理解差距、缺乏战略规划和人才匮乏是实现和衡量技术全部价值的障碍。 这项研究是今年早些时候由科尔曼帕克斯研究公司进行的,由SA...
-
OmniDrive: 一个关于大模型与3D驾驶任务对齐的框架
本文经自动驾驶之心公众号授权转载,转载请联系出处。 从一个新颖的3D MLLM架构开始,该架构使用稀疏查询将视觉表示提升和压缩到3D,然后将其输入LLM。 题目:OmniDrive: A Holistic LLM-Agent Framework for...
-
六种人工智能代理(AI Agent)类型
随着大模型的发展,通用智能不断迭代升级,应用模式也不断创新,从简单的Prompt应用、RAG(搜索增强生成)再到AI Agent(人工智能代理)。其中AI Agent一直是个火热的话题,未来将无处不在。比尔盖茨还宣称终极技术竞赛将围绕着开发顶级AI代理。...
-
特斯拉机器人进厂打工,马斯克:手的自由度今年将达到22个!
特斯拉机器人Optimus最新视频出炉,已经可以在厂子里打工了。 正常速度下,它分拣电池(特斯拉的4680电池)是这样的: 官方还放出了20倍速下的样子——在小小的“工位”上,拣啊拣啊拣: 这次放出的视频亮点之一在于Optimus在厂子里完成这项工作...
-
斯坦福李飞飞首次创业:学术休假两年,瞄准「空间智能」
没想到,在大模型时代,知名「AI 教母」李飞飞也要「创业」了,并完成了种子轮融资。 据路透社独家报道,著名计算机科学家李飞飞正在创建一家初创公司。该公司利用类似人类的视觉数据处理方式,使人工智能能够进行高级推理。 知情人士透露称,李飞飞最近为这家公司进行...
-
AI日报:GPT 2 Chatbot神秘机器人引热议;Kimi上线智能体功能Kimi+;抖音推AI修图产品“星绘”;小红书内测自研大模型“小地瓜”
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、OpenAI神秘搞事,GPT...
-
具身智能占领中国硅谷?1.23万AI学者集结海淀,填补全球百亿人形机器人空缺
这几天的中关村,已经被机器人占领了! 在2024中关村论坛年会的会场前台,这两位美女机器人的出现,把央视主持人都惊到了。 图片 逼真的动作,灵活的手指,连口型都是搭配的,两位美女机器人给到来的游客们耐心介绍着AI主题日的相关信息,在人群中分外吸睛。 往...
-
七麦数据重磅发布AI应用榜:「豆包」登顶;文本生成仍是主流、数字人崭露头角;厂商布局渐成雏形......
随着ChatGPT的火热,国产大模型开始呈现爆发式增长态势,科技巨头、垂直场景玩家纷纷入局。在AI技术跃进式发展的趋势下,“从文本生成到AI聊天机器人”“从网站、软件App到智能终端”“从AI+视频,到AI+游戏”……AIGC无处不在,并开始席卷一切。 那...
-
超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题
哭死啊,全球狂炼大模型,一互联网的数据不够用,根本不够用。 训练模型搞得跟《饥饿游戏》似的,全球AI研究者,都在苦恼怎么才能喂饱这群数据大胃王。 尤其在多模态任务中,这一问题尤为突出。 一筹莫展之际,来自人大系的初创团队,用自家的新模型,率先在国内把“模...
-
激进式押注AI手机的厂商一大堆,为什么登顶的是它家
今年的中国手机市场,正在迎来大变局。 两大变量交融交汇,已经开始展现作用力,让市场重新火热: 一是华为全面回归,盛况空前。 二是AI搅动风云,成为兵家必争之地。 就在这种交融之下,第一季度王座现已呈现归属—— 荣耀。 AI成手机厂商关键增长引擎 华为的全面...
-
阿里智能体“组装工厂”开源!0经验搞定上万Agent并发
让多智能体开发就像搭积木,阿里巴巴通义实验室开源多智能体编程框架与开发平台AgentScope。 该平台专门为多智能体应用开发者打造,旨在提供高易用的编程体验、稳定可靠的运行时保障,并且为开发者提供了分布式和多模态的技术支持。 内置了OpenAI、Das...
-
为什么要做长文本、长图文、长语音的大模型?深度解读讯飞星火V3.5春季上新
4月26日,科大讯飞发布讯飞星火大模型 V3.5的功能上新,其中一个重点就是面向用户各种场景中高效获取信息需求,发布首个长文本、长图文、长语音的大模型,能够支持文档、图文资料、会议录音等各种信息来源的快速理解和学习,还能够结合各种行业场景知识给出专业、准确...
-
吴恩达:多智能体协作是新关键,软件开发等任务将更高效
前不久,斯坦福大学教授吴恩达在演讲中提到了智能体的巨大潜力,这也引起了众多讨论。其中,吴恩达谈到基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。这表明,将目光局限于大模型不一定可取,智能体或许会比其所用的基础模型更加优秀。 在软...
-
讯飞星火大模型V3.5升级 推出长文本、长图文、长语音大模型
科大讯飞今日发布重大更新,讯飞星火大模型V3.5升级,不仅推出了首个长文本、长图文、长语音大模型,还首次将多情感超拟人合成技术引入市场,并同步推出了星火智能体平台。这一系列创新举措,旨在为招投标应用和合同应用提供更为强大的技术支持。 科大讯飞董事长刘庆峰在...
-
均价破万!AI让PC快成了奢侈品
快科技4月24日消息,随着ChatGPT等AI技术的快速发展,大模型的部署正在从云端向设备下沉扩散,用户常用的PC和手机就成了最主要的载体。 联想CEO杨元庆表示,受算力等因素的影响,目前运行AI智能体最好的载体还是PC。 不仅是联想,全球主流PC厂商、涉...
-
这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数
还记得去年 11 月底爆出来的 Q* 项目吗?这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下,可参看机器之心当时的报道《全网大讨论:引爆 OpenAI 全员乱斗的 Q * 到底是什么?》简而言之,Q* 很可能是...
-
华为发布新一代鸿蒙座舱:搭载千悟大模型
在今日的华为智能汽车解决方案发布会上,华为为我们带来了令人瞩目的新一代鸿蒙座舱,该座舱融合了智慧车机、智慧音响和智慧显示,为车主带来前所未有的智能体验。 这款新一代鸿蒙座舱不仅拥有先进的千悟大模型,还集成了盘古大模型、MindSpore异思计算框架以及异腾...
-
人工智能注释可以增强UI和UX吗?
随着技术的不断变革和人们的不断适应,人工智能现已融入我们的日常生活。 人工智能在UI(用户界面 /UX(用户体验 中一直存在,但现在主要是由设计师在全球范围内使用,为客户创造更好的体验。 如今,人工智能和机器学习算法甚至被用来进行最基本的选择,例如流媒...
-
对话蚂蚁李建国:当前AI写代码相当于L2.5,实现L3后替代50%人类编程
蚂蚁集团代码大模型CodeFuse负责人李建国说道。 当下,AI代码生成领域正在野蛮式生长,巨头涌入,AI员工频频上线企业;首个AI程序员Devin被曝造假…… 面对风起云涌的代码生成变革,李建国给出了这样一个明确论断。 李建国是谁? 清华大学博士,机器...
-
被AI改变的00后娱乐习惯
初见文生图、文生视频的震撼还清晰如同昨日,硬糖君的记忆更停留在AI绘画导致LOFTER用户销号事件——可能是这个冷门社区近年来站得最高的一次。但不到两年时间,AIGC已经随风潜入夜。 如果说AI翻唱、AI换脸、AI绘画还是在借助新工具进行自我表达,那么在互...
-
AI PC,是联想们的销量解药吗?
4月16日,AMD推出了适用于商用笔记本电脑和台式机的AI芯片;英特尔去年底就推出了Core Ultra芯片,今年还计划推出新一代英特尔酷睿Ultra客户端处理器家族,并预计年出货4000万台AI PC。 随着全球芯片制造商的AI技术越来越成熟,不断推出新...
-
GPT-4化身黑客搞破坏,成功率87%,OpenAI要求保密提示词,网友复现ing
91行代码、1056个token,GPT-4化身黑客搞破坏! 测试成功率达87%,单次成本仅8.8美元(折合人民币约63元)。 这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括GPT-4、GPT-3.5和众多开源模...
-
GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing
91行代码、1056个token,GPT-4化身黑客搞破坏! 测试成功率达87%,单次成本仅8.8美元(折合人民币约63元)。 这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括GPT-4、GPT-3.5和众多开源模...
-
moto X50 Ultra AI手机亮相,搭载联想AI个人智能体
2024 F1联想中国大奖赛在上海国际赛车场拉开帷幕,吸引了全球观众的关注。与此同时,摩托罗拉旗下首款AI手机——moto X50 Ultra也成为了焦点。这款手机在硬件配置上与海外版相似,但针对中国用户进行了专门的AI适配,更加符合国内用户的使用习惯。...
-
Meta发布最新开源大模型Llama 3,将深度融入自家搜索
4月19日消息,美国时间周四,Facebook的母公司Meta发布了其开源大语言模型的最新版本——Llama 3。目前硅谷人工智能之战日益激烈。 这款新模型旨在为其升级后的Meta AI提供支持,后者现将在Meta的多个应用中扮演更加显著的角色。此外,...
-
moto首款AI手机!moto X50 Ultra官宣
快科技4月19日消息,联想陈劲宣布,moto首款AI手机moto X50 Ultra将在5月份正式发布。 据悉,moto X50 Ultra对应的国际版机型是moto Edge 50 Ultra,两者在系统层面有所区别。 moto X50 Ultra国行版...
-
国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队
在2023年的「百模大战」中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理地评价这些模型的能力,成为关键问题。 尽管国内外存在多个模型能力评测榜单,但它们的质量参差不齐,排名差...
-
moto X50 Ultra即将亮相:搭载联想小天AI个人智能体
根据最新消息,联想旗下moto品牌即将发布其首款AI手机——moto X50 Ultra。这款手机预计将在五月份正式上市。 据了解,moto X50 Ultra的国际版机型为moto Edge 50 Ultra,两者在系统配置上有所差异。 值得一提的是,...
-
1个基础模型系列、3大 AI 开发工具,Create 2024重磅发布都在这里了!
4月16日,百度举办了 Create 2024百度 AI 开发者大会,包括百度创始人、董事长兼首席执行官李彦宏在内的多位重磅嘉宾登台演讲,并与全球各地的开发者们分享了百度在 AI 领域的最新技术进展。 人人都是开发者 百度创始人、董事长兼首席执...
-
Glow官网体验入口 虚拟社交AI应用官方安卓苹果免费下载地址
Glow是一款 AI 虚拟社交 App,用户可以通过 AIGC 技术自定义智能体,赋予智能体人设、声音、形象,并可以与之进行对话聊天,满足用户的角色扮演、情感陪伴、树洞倾诉等情绪类需求。主要功能包括自定义智能体,24 小时陪伴聊天以及发现智能体。Glow...
-
AI金融助理“支小宝”:今年已解答845万个理财保险类问题
国内AIGC赛道进入到比拼产业应用的阶段。4月11日,记者注意到,蚂蚁集团的“AI金融助理”支小宝2.0版本已经处于对外测试阶段。支小宝定位于理财和保险专业知识问答,同时提供行情及持仓分析、智能核保和理赔等专业工具。目前,在支付宝APP的蚂蚁财富和蚂蚁保频...
-
探索智能体的边界:AgentQuest,一个全面衡量和提升大型语言模型智能体性能的模块化基准框架
随着大模型的不断进化,LLM智能体——这些强大的算法实体已经展现出解决复杂多步骤推理任务的潜力。从自然语言处理到深度学习,LLM智能体正逐渐成为研究和工业界的焦点,它们不仅能够理解和生成人类语言,还能在多变的环境中制定策略、执行任务,甚至使用API调用和...
-
全面突围,谷歌昨晚更新了一大波大模型产品
当地时间本周二,谷歌在 Google’s Cloud Next 2024 上发布了一系列 AI 相关的模型更新和产品,包括 Gemini 1.5 Pro 首次提供了本地音频(语音)理解功能、代码生成新模型 CodeGemma、首款自研 Arm 处理器 A...
-
每周AI新闻(2024年第11周)Meta公布Llama 3集群细节 | Sora将于年内推出 | 全球首个AI软件工程师发布
这里是陌小北,一个正在研究硅基生命的碳基生命。正在努力成为写代码的里面背诗最多的,背诗的里面最会写段子的,写段子的里面代码写得最好的…厨子。 每周日解读每周AI大事件。 欢迎关注同名公众号【陌北有棵树】,关注AI最新技术与资讯。 大厂动向 M...
-
盘点六大Devin替代方案:自动化你的编程任务
编译丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 上个月,成立不久的初创公司Cognition推出了全球首位“AI工程师”——Devin。 凭借自动生成代码、调试错误及自行部署应用等能力,Devin充分实现了软件开发过程的部分自动...
-
百度文心一言“新花样”!上线语音定制功能:2秒完美复刻个人声音
快科技4月9日消息,百度日前官方宣布文心一言语音定制功能上线,只需2秒钟,AI 就能完美重建任何一个人的声音,每个人都能拥有自己的AI声优。 用户只需打开文心一言App,选择创建智能体,点击创建自己的声音,随后系统会给出一句话,只需用平时说话的语气念一遍。...
-
【AIGC调研系列】Devin与AutoDev的相关资料研究
Devin和AutoDev是微软在AI程序员领域的两个重要项目。Devin是由AI初创公司Cognition开发的全球首个全自主AI软件工程师,它具备自主学习新技术、端到端构建和部署应用、自主查找和修复代码Bug、训练和微调AI模型的能力[9]。这表明De...
-
通义千问开源Qwen1.5-32B 模型系列
通义千问团队最新发布了 Qwen1.5-32B 模型系列,其中包括 Qwen1.5-32B 和 Qwen1.5-32B-Chat。 这些模型在模型架构上与之前的 Qwen1.5系列基本相同,但参数量减少至32B,旨在提供更高效、更经济实惠的解决方案。Qw...
-
斯坦福团队大模型Octopus v2火了:手机就能运行 准确性超越GPT-4
近日,斯坦福大学研究人员发布的 Octopus v2模型引起了开发者社区的极大关注,其20亿参数的模型一夜下载量超过2k。 这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行,并在准确性和延迟方面表现超越了 GPT-4,同时将上下文长度减少了95%。...
-
文心一言APP上线定制专属声音功能 只需2秒即可
近日,文心一言APP上线新功能,让用户能够在短短两秒内打造出专属的定制声音。 想要体验这一神奇功能,只需打开文心一言APP,点击下方“+”,然后选择创建智能体。在声音选项里,你会发现一个名为“创建我的声音”的有趣功能。 操作起来非常简单,你只需按照系统提...
-
AI程序员哪家强?探索Devin、通义灵码和SWE-agent的潜力
4月3日,距世界首个AI程序员Devin诞生不足一个月,普林斯顿大学的NLP团队开发了一个开源AI程序员SWE-agent,它利用GPT-4模型在GitHub存储库中自动解决问题。SWE-agent在SWE-bench测试集上的表现与Devin相似,平均...
-
让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 在探索人工智能边界时,我们时常惊叹于人类孩童的学习能力 —— 可以轻易地将他人的动作映射到自己的视角,进而模仿并创新。当我们追求更高阶...
-
开源版AI程序员来了:GPT-4加持,能力比肩Devin,一天1.4k Star
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 最近,有很多人在为 AI 代替自己的工作而担忧。 上个月火遍 AI 圈的「首位 AI 程序员」Devin,利用大模型能力已经掌握了全栈技...
-
OS-Copilot:实现具有自我完善能力的通用计算机智能体
🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ AI 缩小了人类间的知识和技术差距 论文标题:OS-Copilot: Towards Generalist Computer Agents with S...
-
面向2026年的推荐算法前瞻
常规的推荐系统范式已经逐渐走入瓶颈,原因是在当前固定化的问题描述下模型和系统几乎已经发展到极限。当前的主要范式在模型上为召回+排序+重排,系统上为样本挖掘+特征工程+线上打分预估能力建设。一线大厂在上述领域已经把空间挖掘殆尽。同时可以看到,我们的用户对当...
-
普林斯顿首个「开源」AI程序员进场 基于GPT-4,可自动修复bug
普林斯顿大学最近推出了一款名为SWE-agent的AI程序员,这是世界上首个开源的AI程序员,它基于GPT-4技术,能够在GitHub仓库中自动修复bug。这个智能体-计算机接口(ACI)的诞生,标志着AI在软件工程领域的应用迈出了重要一步。 SWE-ag...