-
AI日报:百度发布一见视觉大模型v4.5;Adobe支持用AI做动画设计;Familia.AI推“复活亲人”软件
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、百度智能云一见视觉大模型v4....
-
支小宝,生于人人需要“AI牛马”的时代
《钢铁侠》中的贾维斯,是大多数人对AI助手的初印象。只需一个简单指令,贾维斯就能迅速准确地做出相应动作,无数次拯救钢铁侠于危难之际。 回到现实,虽然不是每个人都能拥有钢铁侠的“钞能力”,打造一个专属于自己的贾维斯。但要拥有一个能够解决生活琐事、提高生活效率...
-
基于Llama构建的语音语言模型LLaMA-Omni;增强记忆的长文本建模检索方法;全功能的AI应用AnythingLLM
✨ 1: LLaMA-Omni LLaMA-Omni是基于Llama-3.1-8B-Instruct构建的语音语言模型,支持高质量低延迟的语音互动。 LLaMA-Omni是一个基于Llama-3.1-8B-Instruct构建的语音语言模型...
-
AI日报:阿里推新多模态大模型Ovis;Kyutai开源实时语音对话模型Moshi;Apple Intelligence测试版现已开放
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、阿里国际推出最新多模态大模型...
-
OpenAI重金押注,机器人NEO世界模型登场!机器人迎来ChatGPT时刻?
【新智元导读】刚刚,OpenAI重金押注的人形机器人初创1X终于揭秘了背后的「世界模型」——它能够根据真实数据,生成针对不同场景的中的行为预测!机器人领域的ChatGPT时刻,或许真的要来了。 月初,OpenAI投下重注人形机器人初创1X,终于放出了NEO...
-
了解一点智能体(Agent)
百度百科对智能体的定义:智能体,顾名思义,就是具有智能的实体,英文名是Agent。以云为基础,以AI为核心,构建一个立体感知、全域协同、精准判断、持续进化、开放的智能系统。 1 智能体(Agent)是什么? 在计算机科学和人工智能领域,智能体(A...
-
T-Eval:大模型智能体能力评测基准解读 | ACL 2024
AI Agent(智能体)作为大模型的重要应用模式,能够通过使用外部工具来执行复杂任务,完成多步骤的工作流程。为了更全面地评估模型的工具使用能力,司南及合作伙伴团队推出了T-Eval评测基准,相关成果论文已被ACL 2024主会录用,点击链接可查看原文:h...
-
理财AI勇闯「无人区」:理解专家、成为专家
用十年时间成为全球在线服务数亿用户的财富管理平台后,摆在蚂蚁财富面前的是一段少有人走过的路: 这5亿活跃用户第一次动动手就能接触到各类普惠的理财产品,但真正理财行为成熟的仅占两成。而放眼中国7.2亿基金投资者里,每3600人才能分到1位传统理财顾问来服务。...
-
【AIGC调研系列】MetaGpt与AutoGpt相比有哪些优势和劣势
MetaGPT与AutoGPT相比,具有以下优势和劣势: 优势: MetaGPT采用了多智能体框架,通过角色专业化、工作流管理和灵活的消息机制,增强了大规模语言模型在多智能体协作上的能力[4]。这种设计使得MetaGPT能够处理更复杂的任务,并通过结...
-
吃个瓜而已,AI居然写了份研究报告??
救命,本来只是想随手吃个瓜,没想到AI较真起来,写了份完整研究报告。 一口气查几百篇资料,从中精选出42篇参考,十几秒内洋洋洒洒3000多字。 而且这个AI不光把问题本身答好,还主动挑选了相关话题做拓展延伸。 既然是老马和Neuralink的员工生孩子...
-
一个人就是团队!阿里云推出首个AI程序员:分钟级完成应用开发
快科技6月21日消息,在今天的阿里云上海AI峰会上,阿里云推出了业界首个具备全栈软件开发能力的AI程序员。 这一程序员集成了架构师、开发工程师、测试工程师等关键岗位技能,能够独立完成从任务分解、代码编写、测试、问题修复到代码提交的整个软件开发流程,且在某些...
-
AI画连环画角色更一致了!人物之间的复杂互动也能处理|中山大学&联想团队出品
让AI画漫画角色保持一致的新研究来了! 创作的连环画效果belike: 频繁切换主体、人物之间复杂的互动也能保持角色一致性: 上述效果来自AutoStudio,是一个由中山大学和联想团队联合提出的无需训练的多智能体协同框架。 AutoStudio采用基...
-
智谱AI Open Day:升级清言App、发布GLM-4开源模型、新一代MaaS平台,大模型商业化迎来“下一站”
“描绘宏大未来愿景的同时让更多人切身体会到大模型的强大能力,让大模型技术从炫酷的天空当中真正落到地面上、落到实处,是每一个大模型公司必须思考的问题。”——智谱 AI CEO 张鹏 6月5日,智谱AI Open Day在UCCA Lab北京艺术空间举办。...
-
腾讯AI助手App元宝来了,公众号作者必备
以产品见长的腾讯,终于推出C端AI助手App:腾讯元宝。 与之前测试的混元助手相比,元宝在AI搜索、AI总结、AI写作等核心能力上都有升级,大模型效果提升50%。 功能听起来好像和同类AI助手也差不多?But,一试才发现—— 能精准搜到微信公众号生态优质...
-
一文带你了解大模型:智能体(Agent)
作者 | lucasgftang 大语言模型 vs 人类 大语言模型很强大,就像人类的大脑一样拥有思考的能力。如果人类只有大脑,没有四肢,没有工具,是没办法与世界互动的。如果我们能给大模型配备上四肢和工具呢?大模型是不是就会打破次元壁,从数字世界走向现实...
-
AI智能体的炒作与现实:GPT-4都撑不起,现实任务成功率不到15%
随着大语言模型的不断进化与自我革新,性能、准确度、稳定性都有了大幅的提升,这已经被各个基准问题集验证过了。 但是,对于现有版本的 LLM 来说,它们的综合能力似乎并不能完全支撑得起 AI 智能体。 多模态、多任务、多领域俨然已成为 AI 智能体在公共...
-
鹅厂造了个AI翻译公司:专攻网络小说,自动适配语言风格,真人和GPT-4看了都说好
鹅厂搞了个150多人的“翻译公司”,从老板到员工都是AI智能体! 主营业务是翻译网络小说,质量极高,参与评价的读者认为比真人翻译得还要好。 而且相比于雇佣真人,用它来翻译文学作品,成本降低了近80倍。 公司名为TransAgents,每个岗位都配备了3...
-
DiffMap:首个利用LDM来增强高精地图构建的网络
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文标题: DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model 论文作者: Peijin Jia, Tuo...
-
腾讯AI实验室开发新型智能体框架TRANSAGENTS 专用于处理超长文学内容的翻译工作
腾讯AI实验室开发的"TRANSAGENTS"是一个创新的多智能体框架,专门设计用于处理超长文学内容的翻译工作。这个系统通过创建一个虚拟的翻译出版公司来模拟真实的翻译流程,其中包含多个具有不同职责和专业技能的虚拟角色。 以下是TRANSAGENTS系统的...
-
优秀Agent智能体必学的几种设计模式,一学就会
大家好,我是老渡。 昨天在公司听了清华大学智能产业研究院现场分享的AI医院小镇。 图片 这是一个虚拟世界,所有的医生、护士、患者都是由LLM驱动的Agent智能体,可以自主交互。它们模拟了整个诊病看病的过程,在涵盖主要呼吸道疾病的MedQA数据集子集上,...
-
清华首个AI医院小镇来了!AI医生自进化击败人类专家,数天诊完1万名患者
斯坦福AI小镇曾火遍了全网,25个智能体生活交友,堪称现实版的「西部世界」。 而现在,AI「医院小镇」也来了! 最近,来自清华团队的研究人员开发了一个名为「Agent Hospital」的模拟医院。 论文地址:https://arxiv.org/pdf...
-
一览Occ与自动驾驶的前世今生!首篇综述全面汇总特征增强/量产部署/高效标注三大主题
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 近年来,自动驾驶因其在减轻驾驶员负担和提高驾驶安全方面的潜力而越来越受到关注。基于视觉的三维占用预测是一种新兴的感知任务,适用于具有成本效益的自动驾驶感知系统,它可以...
-
阿里智能体“组装工厂”开源!0经验搞定上万Agent并发
让多智能体开发就像搭积木,阿里巴巴通义实验室开源多智能体编程框架与开发平台AgentScope。 该平台专门为多智能体应用开发者打造,旨在提供高易用的编程体验、稳定可靠的运行时保障,并且为开发者提供了分布式和多模态的技术支持。 内置了OpenAI、Das...
-
吴恩达:多智能体协作是新关键,软件开发等任务将更高效
前不久,斯坦福大学教授吴恩达在演讲中提到了智能体的巨大潜力,这也引起了众多讨论。其中,吴恩达谈到基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。这表明,将目光局限于大模型不一定可取,智能体或许会比其所用的基础模型更加优秀。 在软...
-
AI金融助理“支小宝”:今年已解答845万个理财保险类问题
国内AIGC赛道进入到比拼产业应用的阶段。4月11日,记者注意到,蚂蚁集团的“AI金融助理”支小宝2.0版本已经处于对外测试阶段。支小宝定位于理财和保险专业知识问答,同时提供行情及持仓分析、智能核保和理赔等专业工具。目前,在支付宝APP的蚂蚁财富和蚂蚁保频...
-
盘点六大Devin替代方案:自动化你的编程任务
编译丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 上个月,成立不久的初创公司Cognition推出了全球首位“AI工程师”——Devin。 凭借自动生成代码、调试错误及自行部署应用等能力,Devin充分实现了软件开发过程的部分自动...
-
吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果
AI 智能体是去年很火的一个话题,但是 AI 智能体到底有多大的潜力,很多人可能没有概念。 最近,斯坦福大学教授吴恩达在演讲中提到,他们发现,基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。当然,基于 GPT-4 构建的智能体工...
-
复刻Sora的通用视频生成能力,开源多智能体框架Mora来了
Sora 是首个引起社会广泛关注的大规模通用视频生成模型。自 OpenAI 在 2024 年 2 月推出以来,没有其他视频生成模型能够在性能或支持广泛视频生成任务的能力上与 Sora 匹敌。此外,完全公开的视频生成模型寥寥无几,大多数都是闭源的。 为了弥...
-
吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型
随着 ChatGPT、GPT-4、Sora 的陆续问世,人工智能的发展趋势引起了广泛关注,特别是 Sora 让生成式 AI 模型在多模态方面取得显著进展。人们不禁会问:人工智能领域下一个突破方向将会是什么? 今天,人工智能著名学者、斯坦福大学教授吴恩达指...
-
用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质
心理测量在精神健康、自我了解、和个人发展方面都发挥着重要的作用。 传统的心理测量范式以自我报告类型的问卷为主,常常通过参与者回忆自己的日常生活行为模式或情绪状态进行测量。 这样的测量方式虽然高效便捷,但可能引发参与者的抗拒心理,降低被测意愿。 随着大语言...
-
扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹
设想一下,当你站在房间内,准备向门口走去,你是通过自回归的方式逐步规划路径吗?实际上,你的路径是一次性整体生成的。 近期的研究表明,采用扩散模型的规划模块能够同时生成长序列的轨迹规划,这更加符合人类的决策模式。此外,扩散模型在策略表征和数据合成方面也能为...
-
大模型在复杂推理任务上潜力如何?多智能体互动框架ThinkThrice玩转剧本杀
剧本杀是一种广受欢迎的多角色扮演侦探游戏,要求玩家扮演不同的角色。通过阅读角色文本、理解各自的故事、搜集线索、以及逻辑推理,玩家们共同努力揭开谜团。游戏角色通常被分为平民和凶手两大类:平民的目标是找出隐藏在他们中间的凶手,而凶手则尽力隐藏自己的身份,避免...
-
每日AI:Pika推出Lip Sync功能;阿里推对口型视频生成工具EMO;DomoAI推fusion style功能;GitHub上线Copilot Enterprise通用版本
欢迎来到【每日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI应用 Pika推出Lip...
-
OpenAI工程师必备经典《苦涩的教训》,原来20多年前就有了原型
OpenAI 推出视频生成模型 Sora 已经一周的时间了,热度不减,作者团队还在持续放出让人眼前一亮的视频。比如「一群爱冒险的小狗探索天空废墟的电影预告片」,Sora 一次生成并自己完成剪辑。 当然,一个个生动、逼真的 AI 视频让人们好奇为什么是 O...
-
SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for Autonomous Driving 论文链接...
-
『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架
本文经自动驾驶之心公众号授权转载,转载请联系出处。 协同感知技术能够有效解决自动驾驶车辆单体感知中存在的障碍物遮挡、视角受限、以及远距离感知能力弱等问题。然而,现有的工作都做了一个过分简单的假设,即参与协作的智能体使用相同的传感器,部署相同的感知模型。...
-
斯坦福和OpenAI提出meta-prompting,最强零样本prompting技术诞生了
最新一代语言模型(尤其是 GPT-4、PaLM 和 LLaMa)已经成功拓展了自然语言处理和生成的边界。这些大规模模型可以解决许多不同任务,从写莎士比亚风格的十四行诗到总结复杂的医疗报告和解决竞赛级的编程问题。尽管这些模型可以解决多种多样的问题,但它们并...
-
想要成为AIGC大模型工程师, 如何搭建你的知识体系框架?
Look!?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??? AI不会取代你的工作,会取代你的是会AI的人,如何提升自己与他人的知识壁垒,如何学习AIGC?相信在过去2023这个AI爆发的元年,我...
-
三个Agent顶个GPT-4,基于开源小模型的那种
真·“三个臭皮匠,顶个诸葛亮”—— 基于开源小模型的三个Agent协作,比肩GPT-4的工具调用效果! 话不多说,直接来看两个系统执行记录。 用户表示自己是一个音乐爱好者,想探索不同的音乐流派以及音乐家。于是指定模型使用Deezer和Shazam的API...
-
Agent像人一样分工协作,还能“群聊”交换信息
智能体也要有“规范手册”! 一项名为MetaGPT的研究,通过对智能体角色进行明确分工,并要求多个智能体在协作中采用统一规范的“交流格式”等方法,让智能体性能大增。 目前,这项研究在GitHub上已狂揽33.6k星,并在深度学习顶会ICLR 2024上被...
-
GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板
当你让大模型写一首「莎士比亚十四行诗」,并以严格的韵律「ABAB CDCD EFEF GG」执行。 同时,诗中还要包含提供的3个词。 对于这么高难度的创作题,LLM在收到指令后,并不一定能够按要求做出这首诗。 正所谓,人各有所长,LLM也是如此,仅凭单...
-
Midjourney V6更新解读与侵权风险警告;AI Agent智能体创业必读;高清图解Mixtral和MoE;2023年度AI设计实践报告 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? Midjourney V6 文生图细节爆炸,但是被扒叠图电影画面? 左图提示词:a full body editorial santa ho...
-
多智能体系统的合作之道:对MAS不确定性、社会机制与强化学习的探索
多智能体系统(MAS)是由多个自主智能体组成的系统,它们可以相互交互和协作,以完成一些共同或个人的目标。多智能体系统在许多领域都有广泛的应用,如机器人、交通、电力、社交网络等。但是如何促进智能体之间的合作行为一直是这一领域的难题,特别是在激励机制不确定的...
-
基于ChatGPT的代码解释神器:GPT Academic、GitHub Copilot
(个人推荐使用第二个GitHub Copilot) 1. GPT 学术优化 (GPT Academic 工具 简介 GPT Academic是什么 为ChatGPT/GLM提供实用化交互界面,特别优化论文阅读/润色/写作体验,模块化设计,支持自定...
-
何为交互感知?全面回顾自动驾驶中的社会交互动态模型与决策前沿!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 交互感知自动驾驶(IAAD)是一个迅速发展的研究领域,专注于开发能够与人类道路使用者安全、高效交互的自动驾驶车辆。这是一项具有挑战性的任务,因为它要求自动驾驶车辆能够理...
-
《我的世界》化身AI小镇,NPC居民角色扮演如同真人
注意看,这个方块人正在快速思考面前几位“不速之客”的身份。 原来她是遇到了危险,意识到这一点之后,她马上开始在脑海中搜索策略。 最终,她的方案是先逃跑然后寻求帮助,并马上付诸行动。 与此同时,对面的人也在进行着和她一样的思考…… 这样的一幅场景出现...
-
盘古智能体(Pangu-Agent)的五个创新点
随着大规模语言模型(Large Language Model,LLM)的发展和应用,人工智能领域出现了一种新的研究方向,即基于LLM的自主智能体(LLM-based Autonomous Agent)。这种智能体利用LLM的强大的表示能力和生成能力,可以...
-
AI聊天 AI绘画 AI视频 AI制作PPT
文章目录: 一:AI聊天 二:AI绘画 三:AI视频 四:AI制作PPT 这些平台工具太多了,我列举一些我用过还可以的,如果亲,您有什么推荐的,可以在下面评论留言,我到时补充上去! 这里主要放一些国内我感觉好用的,国外或者更多请移步——&g...
-
六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革
两千年前的古人穿越到一千年前后,需要适应的东西可能不多。而一千前的古人穿越到一百年前,变化也不至于大到难以适应。但如果一百年前的古人穿越到现在,甚至只是有人“冬眠”10年、20年,面对的现实世界的变化,恐怕会是天翻地覆。日新月异的技术进步,正不断带来颠覆...
-
一个智能助手搞定软件开发全流程,从设计到运维统统交给AI
从设计、编码到测试、部署,甚至是运维……软件开发的整个流程,可以通通交给AI了! 一款覆盖软件开发全生命周期的端到端AI智能助手,让分散的软件开发操作变得集成化、智能化。 这款AI助手专门针对开发领域设计,避免了通用大模型不可靠、信息不及时、领域任务不完...