-
谷歌称Gemini Nano AI大模型暂不支持Pixel8手机
谷歌公司近日透露,由于硬件限制,其为移动设备开发的AI语言大模型Gemini Nano暂时无法运行在新款Pixel8手机上,但未来有望在其他高端设备上推出。 Gemini Nano是谷歌旗下大模型Gemini的移动版本,能够在手机上本地运行,无需连接外部服...
-
清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!
大模型只能够记忆与理解有限的上下文已经成为大模型在真实应用中的能力瓶颈,例如对话式AI系统往往无法记忆你前一天对话的内容,利用大模型构建智能体会产生前后不一致的行为与记忆。 为了让大模型能够记忆并处理更长的上下文,来自清华大学、麻省理工学院和人民大学的研...
-
扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹
设想一下,当你站在房间内,准备向门口走去,你是通过自回归的方式逐步规划路径吗?实际上,你的路径是一次性整体生成的。 近期的研究表明,采用扩散模型的规划模块能够同时生成长序列的轨迹规划,这更加符合人类的决策模式。此外,扩散模型在策略表征和数据合成方面也能为...
-
大模型在复杂推理任务上潜力如何?多智能体互动框架ThinkThrice玩转剧本杀
剧本杀是一种广受欢迎的多角色扮演侦探游戏,要求玩家扮演不同的角色。通过阅读角色文本、理解各自的故事、搜集线索、以及逻辑推理,玩家们共同努力揭开谜团。游戏角色通常被分为平民和凶手两大类:平民的目标是找出隐藏在他们中间的凶手,而凶手则尽力隐藏自己的身份,避免...
-
BsinCopilot:Java版端到端大语言模型开发框架
BsinCopilot是基于BsinPaaS开源框架构建的大语言模型应用SaaS服务,借鉴langchain的框架思想,引入 langchian4j组件,微前端微服务的架构设计,可快速助您构建和体验端到端的AI应用。 基本概念 概念 说明...
-
AI初创公司新旦智能完成千万级别天使轮融资 用于发展 xDAN 模型
「新旦智能」是一家新兴的人工智能初创公司,最近完成了千万级的天使轮融资。这轮融资是由全球化人工智能企业 APUS 和 AI 行业资深投资人周弘扬联合投资的。融资资金将用于进一步发展他们的 xDAN 模型,这个模型具有独特的高情商和强大的推理能力,旨在打造新...
-
文心一言变身虚拟患者,助力医学生轻松开启「实践模式」
本期文心开发者说邀请到天佑星河团队负责人,从医疗教育与人工智能结合的角度出发,分享“智慧医疗教育系统”的开发历程。本期分享将从应用介绍、应用价值、应用亮点、技术全景等方面介绍“智慧医疗教育系统”应用的开发心得和技术路线。 随着生成式人工智能的发展,AI正...
-
抖音推出全新AI社交产品“话炉” 能陪你闲扯还能讲故事、猜谜语
据Tech星球的报道,抖音再次推出了全新的社交产品“话炉”,这次加入了AI的元素。继多闪、飞聊之后,抖音再次在社交领域发力。 “话炉”是一款基于字节旗下云雀大模型驱动的角色聊天产品。用户可以通过与个性鲜明、背景各异的AI角色实时聊天互动,满足闲谈生活日常、...
-
十大必知的人工智能算法
随着人工智能技术(AI)的日益普及,各种算法在推动这一领域的发展中发挥着关键作用。从预测房价的线性回归到自动驾驶汽车的神经网络,这些算法在背后默默支撑着无数应用的运行。 今天,我们将带您一览这些热门的人工智能算法(线性回归、逻辑回归、决策树、朴素贝叶斯...
-
生成式 AI 时代,手机正在进行一次全栈革新?
最近一段时间,AI 与大模型技术突飞猛进。春节刚过,前沿方向上就迎来了新一轮突破。 OpenAI 的 Sora 一下子把 AI 视频生成的进度条拉快了半年。 在大模型的应用领域,技术落地应用的速度也在加快。目前各家大厂的新一代旗舰手机已经悉数登场,它们绝...
-
马斯克起诉OpenAI:他们做出了AGI还授权给微软,这是对创始协议赤裸裸的背叛
在刚刚过去的一天,「沉湎于戏剧性冲突」的马斯克又做了一件新鲜事:他起诉了自己参与创立的 OpenAI。 在诉讼文件中,他指控 OpenAI 不计后果地开发人类级别的人工智能,并将其移交给微软。 马斯克的诉讼针对的是 OpenAI 及其两名高管 —— 首...
-
大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界
没人怀疑,OpenAI开年推出的史诗巨作Sora,将改变视频相关领域的内容生态。 但Google DeepMind、UC伯克利和MIT的研究人员更进一步,在他们眼里,「大视频模型」也许能够像世界模型一样,真正的做到理解我们身处的这个世界。 论文地址:h...
-
OPPO刘作虎:手机是AI的最佳载体 它会让手机拥有智能的魂
快科技3月4日消息,今天OPPO首席产品官刘作虎在个人微博表示,对于AI手机是噱头还是未来这个问题很好回答,AI一定是未来。 刘作虎表示,毫无疑问手机就是目前最适合AI技术的载体,这种化学反应让我们充满想象空间,就像我在内部分享时说过的一个观点: 过去应用...
-
开源AI助手AIlice:可以控制多个智能体协同完成复杂任务
MyShellAI刚上班了开源项目AIlice,可以控制多个智能体协同完成复杂的任务,例如文档检索、下载、数据分析、画图等。 并且可以针对任务生成代码在虚拟环境中运行。 AIlice 项目旨在创建一个自包含的人工智能助手,类似于 JARVIS,利用开源模...
-
李飞飞,最火AI女王
黄仁勋又出手了。 最近,英伟达宣布成立一个新研究部门——通用具身智能体研究实验室GEAR。令人意外的是,该实验室的领导者是两位华人90后博士——范麟熙(Jim Fan)和朱玉可(Yuke Zhu 。 范麟熙和朱玉可身上标签很多,但最为鲜明还是一点:李飞飞的...
-
港大开发V-IRL平台:将真实世界地图纳入虚拟环境 给AI Agent完整的一生!
近日,港大和NYU的研究团队合作开发了一个名为V-IRL的平台,该平台将真实世界的地图、街景等丰富信息融入到虚拟环境中,为AI Agent提供了更真实和完整的生活体验。 这项研究的核心在于构建一个可扩展的平台,利用地理信息和街景图像等API将AI智能体嵌入...
-
给AI Agent完整的一生!港大NYU谢赛宁等最新智能体研究:虚拟即现实
【新智元导读】近日,来自香港大学的Jihan Yang和纽约大学的谢赛宁等人发表了新的成果,将真实世界的地图、街景等各种信息融入Agent所在的虚拟世界,为智能体的未来赋予了无限可能。 怎样能构建更强大的AI Agent? 答案是给他们一个完整而真实的世界...
-
十分钟读完 Meta提出Llama 2模型的经典论文:Llama 2: Open Foundation and Fine-Tuned Chat Models
超越GPT-3:Meta AI发布新一代开源人工智能对话大模型Llama 2 引言:介绍 Llama 2 的发布背景和其在对话用例中的优化。 随着人工智能技术的飞速发展,大型语言模型(LLMs)已经成为了人类智能助手的代表,它们在需要专业知识的复杂推理...
-
OpenAI把GPT塞进机器人大脑,具身AGI奇点迫近!英伟达微软参投26亿美金独角兽Figure
人形机器人明星公司Figure迎来了高光时刻! 就在刚刚,OpenAI与Figure官宣合作,专为人形机器人打造下一代AI多模态模型。 图片 这项合作最大的目的是,增强机器人处理语言和推理的能力。 上个月,机器人Figure 01仅使用神经网络煮咖啡的视...
-
百度发布2023年第四季度财报 李彦宏:继续坚定对生成式AI投入
百度公布了其2023年第四季度及全年的财务报告,全年总营收高达1345.98亿元,同比增速达39%,归属百度的净利润(non-GAAP)为287亿元,同样实现了显著增长。 在第四季度,百度的营收达到了349.51亿元,同比增长44%,净利润(non-GAA...
-
每日AI:Pika推出Lip Sync功能;阿里推对口型视频生成工具EMO;DomoAI推fusion style功能;GitHub上线Copilot Enterprise通用版本
欢迎来到【每日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 🤖📱💼AI应用 Pika推出Lip...
-
谷歌发布基础世界模型:11B参数,能生成可交互虚拟世界
Sora 问世才不到两个星期,谷歌的世界模型也来了,能力看起来更强大:它生成的虚拟世界「自主可控」。 刚刚,谷歌定义了生成式 AI 的全新范式 —— 生成式交互环境(Genie,Generative Interactive Environments)。G...
-
南大俞扬深度解读:什么是「世界模型」?
随着媒体狂炒Sora,OpenAI的介绍材料中称Sora是「world simulator」,世界模型这个词又进入视野,但很少有文章来介绍世界模型。 这里回顾一下什么是世界模型,以及讨论Sora是不是world simulator。 什么是world...
-
【论文精读】OS-Copilot: Towards Generalist Computer Agents with Self-Improvement
OS-Copilot: Towards Generalist Computer Agents with Self-Improvement 前言 ABSTRACT 1 INTRODUCTION 2 THE OS-COPILOT FRAMEWORK...
-
揭秘LangGraph的无限潜能
作者 | 崔皓 审校 | 重楼 摘要 本文介绍了一种基于LangChain的新技术LangGraph,它通过循环图协调大模型和外部工具,解决复杂任务。首先,介绍了LangChain的DAG模型处理简单任务,以及LangGraph使用循环图处理复杂任务的...
-
DeepMind CEO专访:AI还没到拼算力的时候,谷歌优势在研发,智能体是下一个爆点
GoogleDeepMind首席执行官Hassabis最近在接受WIRED采访时表示,AI技术现在还有很大的改进空间,还远没有到只能拼算力的时候。谷歌的优势在于科研能力,未来智能体将改变AI的格局。 虽然谷歌的Gemini在开年的AI产品大战中没有获得太多...
-
OpenAI工程师必备经典《苦涩的教训》,原来20多年前就有了原型
OpenAI 推出视频生成模型 Sora 已经一周的时间了,热度不减,作者团队还在持续放出让人眼前一亮的视频。比如「一群爱冒险的小狗探索天空废墟的电影预告片」,Sora 一次生成并自己完成剪辑。 当然,一个个生动、逼真的 AI 视频让人们好奇为什么是 O...
-
爆火Sora的背后 | 聊聊什么是world models!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 随着媒体狂炒Sora,OpenAI的介绍材料中称Sora是 “world simulator”,世界模型这个词又进入视野,但很少有文章来介绍世界模型。这里回顾一下什么是世界模型,以及讨论Sora是不是...
-
生成式AI智能体之间的秘密串通:一场隐藏的危机,你准备好了吗?
大型语言模型(LLM)的能力增强,开辟了一组通信生成AI智能体解决联合任务的应用程序。这对未经授权的信息共享或其他不必要的智能体协调形式带来了隐私和安全挑战。现代隐写技术可能会使这种动态难以检测。通过借鉴人工智能和安全文献中的相关概念,全面正式化了生成人...
-
OPPO刘作虎:用户对AI手机并没有感知 但会为AI功能买单
快科技2月21日消息,日前,OPPO正式对外公布了自己的AI战略,1 N 智能体生态战略,目的就是让用户将AI从尝鲜到常用。 2024年春节期间,OPPO面向超千万用户推出百余项AI实用功能,比如AI消除、通话摘要和新小布助手等等。 OPPO首席产品官刘作...
-
刘作虎:OPPO在AI上的投入没有上限!
快科技2月21日消息,日前的OPPO AI战略发布会上,OPPO首次公布1 N智能体生态战略,让用户将AI从尝鲜到常用。 在会后的采访中,OPPO首席产品官刘作虎表示,OPPO在AI上的投入没有上限。 当被问及OPPO有没有计算过自己的AI投入时,刘作虎表...
-
20分钟学会装配电路板!开源SERL框架精密操控成功率100%,速度三倍于人类
近年来,机器人强化学习技术领域取得显著的进展,例如四足行走,抓取,灵巧操控等,但大多数局限于实验室展示阶段。将机器人强化学习技术广泛应用到实际生产环境仍面临众多挑战,这在一定程度上限制了其在真实场景的应用范围。强化学习技术在实际应用的过程中,任需克服包括...
-
在Sora引爆视频生成时,Meta开始用Agent自动剪视频了,华人作者主导
这几天,AI 视频领域异常地热闹,其中 OpenAI 推出的视频生成大模型 Sora 更是火出了圈。而在视频剪辑领域,AI 尤其是大模型赋能的 Agent 也开始大显身手。 随着自然语言被用来处理与视频剪辑相关的任务,用户可以直接传达自己的意图,从而不需...
-
OPPO发布1+N智能体生态战略 包括AI超级智能体、AI Pro开发平台
OPPO于今日在东莞的OPPO AI滨海湾数据中心举行了盛大的AI战略发布会,此次发布会标志着OPPO正式进入AI手机时代。此前,OPPO已在2月9日宣布向超千万用户推送ColorOS AI新春版,其首席产品官刘作虎亦宣布了OPPO在AI领域的战略布局。...
-
成为AIGC大模型工程师, 如何搭建你的知识体系框架?
Look!👀我们的大模型商业化落地产品 📖更多AI资讯请👉🏾关注 AI是否真的会取代你的工作,或者是掌握AI技能的人将会取代你?随着2023年AI技术的爆炸式增长,许多人开始质疑,如果不掌握如ChatGPT、Midjourney或Stable Di...
-
SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for Autonomous Driving 论文链接...
-
『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架
本文经自动驾驶之心公众号授权转载,转载请联系出处。 协同感知技术能够有效解决自动驾驶车辆单体感知中存在的障碍物遮挡、视角受限、以及远距离感知能力弱等问题。然而,现有的工作都做了一个过分简单的假设,即参与协作的智能体使用相同的传感器,部署相同的感知模型。...
-
AIGC专题:AIGC产业链近况更新
今天分享的是AIGC系列深度研究报告:《AIGC专题:AIGC产业链近况更新》。 (报告出品方:国联证券) 报告共计:19页 AIGC 正反馈持续加强 依托于强大的算力基础设施和海量的通用数据,经过训练和不断调优打造出了 AIGC 大模型,到中...
-
Windows、Office直接上手,大模型智能体操作电脑太6了
当我们谈到 AI 助手的未来,很难不想起《钢铁侠》系列中那个令人炫目的 AI 助手贾维斯。贾维斯不仅是托尼・斯塔克的得力助手,更是他与先进科技的沟通者。如今,大模型的出现颠覆了人类使用工具的方式,我们或许离这样的科幻场景又近了一步。想象一下,如果一个多模...
-
文心一言用户规模破亿 /微软宣布:支付费用延长旧版Windows 10使用寿命|魔法半周报
我有魔法✨为你劈开信息大海❗ 高效获取AIGC的热门事件🔥,更新AIGC的最新动态,生成相应的魔法简报,节省阅读时间👻 🔥资讯预览 百度大模型重要突破,文心一言用户规模破亿,飞桨开发者数量达1070万 微软宣布:支付费用延长旧版Window...
-
最新的AIGC相关技术更新
1.腾讯发布PhotoMaker 《PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding》 作者机构:南开大学&腾讯 PCG ARC 实验室&东京...
-
从声音到形象,AIGC 赋能的 TT 语音年度盛典有多好玩?
摘要: 23年是 AIGC 暴热的一年,这一年我们既兴奋又彷徨。兴奋之处在于新技术持续突破,业界“百模大战”的白热化,一些创新应用开始崭露头角,例如 ChatGPT 和 DALL·E 3,Midjourney,HeyGen, 星野,Copilot 等。彷...
-
什么是AIGC
AIGC是人工智能创意生成的缩写(Artificial Intelligence Generated Creativity),指的是利用人工智能技术实现的创意生成。通俗来说,就是让机器产生新颖、独特且有创造性的作品或方案,例如音乐、绘画、视频、文本等等。...
-
Copilot 时代,开发者与 AI 如何相处?| 新程序员
【导读】AI 在软件开发领域的应用正在发生极大的演进,以 GitHub Copilot 为首,从单一的编程辅助,扩展到开发流程的各个环节。本文作者深入分析了 AI 辅助开发工具的演进,并提出,再争论 AI 是否会替代人类开发者的工作已经愈发没有意义,至关重...
-
GPT-4绝对性能暴涨74.4%!UIUC苹果华人团队提出CodeAct,用Python代码统一LLM智能体行动
一直以来,LLM智能体被众多业界AI大佬看好,甚至有望成为将人类从琐碎工作中解放出来的利器。 但是,它们该如何与世界进行最佳互动? 最近,来自UIUC和苹果的华人研究员,提出了一种全新的智能体框架——CodeAct。 它通过采用可执行的Python代码,来...
-
奥特曼7万亿美元芯片帝国野心曝光,OpenAI日产1000亿单词欲接管全世界!
【新智元导读】Sam Altman表示,自己需要7万亿美元建起全球的芯片帝国,他已经在全球搜罗金主,包括中东土豪。 就在刚刚,Sam Altman发推表示: 如今,OpenAI每天能够创造出约1000亿字的内容,而全世界的人类每天总共能产生约100万亿字。...
-
每周AI新闻(2024年第3周)Meta研发Llama 3 | 苹果Vision Pro预售 | 智谱AI发布GLM-4
我是陌小北,一个正在研究硅基生命的、有趣儿的碳基生命。每周日20:00,准时解读每周AI大事件。 大厂动向 【1】Meta研发Llama 3,构建开源AGI Meta公司CEO马克·扎克伯格(Mark Zuckerberg)=宣布公司将对两个关键A...
-
想要成为AIGC大模型工程师, 如何搭建你的知识体系框架?
Look!👀我们的大模型商业化落地产品 📖更多AI资讯请👉🏾关注 Free三天集训营助教在线为您火热答疑👩🏼🏫 AI不会取代你的工作,会取代你的是会AI的人,如何提升自己与他人的知识壁垒,如何学习AIGC?相信在过去2023这个AI爆发的元年,我...
-
三个Agent顶个GPT-4,基于开源小模型的那种
真·“三个臭皮匠,顶个诸葛亮”—— 基于开源小模型的三个Agent协作,比肩GPT-4的工具调用效果! 话不多说,直接来看两个系统执行记录。 用户表示自己是一个音乐爱好者,想探索不同的音乐流派以及音乐家。于是指定模型使用Deezer和Shazam的API...
-
近屿智能引领行业前沿,精心打造AIGC大模型工程师和产品经理的进阶之路(附完整版学习路径图)
近屿智能,倾力打造了一套独特的AIGC大模型工程师和产品经理学习路径图。该路径图清晰地展示了从初学者到专家水平的技能进阶过程,为工程师和产品经理提供了明确的学习目标和成长路径。 这套学习路径图适用于不同背景和经验的学习者,无论您是初涉AIGC领域的新...