-
2023 OPPO开发者大会,将带来ColorOS14、安第斯大模型以及潘塔纳尔最新进展
2023 OPPO开发者大会将于明天在上海世博中心正式召开。 ColorOS十年,全球月活用户已经突破6亿。本次大会,OPPO将发布更智慧、更流畅、更安全的ColorOS14,全新小布和全新的泛在服务为用户带来更好的专属服务;智慧融合,打破服务与设备的壁垒...
-
微软用GPT-4V解读长视频 MM-Vid能看懂电影还能讲给盲人听
近期,微软Azure AI发布了MM-Vid,这是一项结合GPT-4V与专用工具的创新,致力于解读长视频并为视障人士提供更好的体验。 目前,人工智能在长视频理解领域所面临的复杂挑战,包括分析多个片段、提取不同信息源、实时处理动态环境等。而MM-Vid的工作...
-
微软用GPT-4V解读视频,看懂电影还能讲给盲人听,1小时不是问题
世界各地的人们每天都会创造大量视频,包括用户直播的内容、短视频、电影、体育比赛、广告等等。 视频是一种多功能媒介,可以通过文本、视觉和音频等多种模态传递信息和内容。如果可以开发出能学习多模态数据的方法,就能帮助人们设计出具备强大能力的认知机器 —— 它不...
-
Agent4Rec来了!大模型智能体构成推荐系统模拟器,模拟真实用户交互行为
一直以来,推荐系统领域面临模型线上线下效果差距大的痛点问题,昂贵的线上 A/B 测试成本使得广大研究人员望而却步,也造成学术界的推荐系统研究与工业界的实际应用间的巨大割裂。随着大语言模型展现出类人的逻辑推理和理解能力,基于大语言模型的智能体(Agent)...
-
新加坡推Agent4Rec 大模型智能体构成推荐系统模拟器
推荐系统领域长期存在线上线下效果差距大的问题,Agent4Rec通过构建大语言模型智能体,模拟真实用户行为,为解决这一问题提供了新的思路。在Agent4Rec中,每个用户智能体由个性化模块构成,根据用户历史交互生成电影偏好,模拟用户在推荐系统中的行为。通过...
-
成本2元开发游戏,最快3分钟完成!全程都是AI智能体“打工”,大模型加持的那种
家人们,OpenAI前脚刚发布自定义GPT,让人人都能搞开发;后脚国内一家大模型初创公司也搞了个产品,堪称重新定义开发——让AI智能体们协作起来! 只需一句话,最快3分钟不到,成本也只要2元多,“啪~”,一个软件就开发完了。 例如开发一个红包雨的小软件,现...
-
被OpenAI带火的Agent如何解放人力?清华等发布ProAgent
项目地址:https://github.com/OpenBMB/ProAgent 论文地址:https://github.com/OpenBMB/ProAgent/blob/main/paper/paper.pdf 在历史的长河中,自动化是人类技术...
-
Altman亲手复刻「Grok」,背刺马斯克!定制GPT正式开放,最全第三方市场已出
经过ChatGPT大范围宕机后,Altman今天突然宣布,开发者大会上的所有产品更新,所有PLUS用户都上手用了。 图片 对此,有人已经花了整个下午的时间去玩了。 图片 GPTs全面上线,Altman嘲讽马斯克Grok 搞笑的是,Altman自己发了一个...
-
让AI模型成为GTA五星玩家,基于视觉的可编程智能体Octopus来了
电子游戏已经成为如今现实世界的模拟舞台,展现出无限可能。以游戏《侠盗猎车手》(GTA)为例,在 GTA 的世界里,玩家可以以第一人称视角,在洛圣都(游戏虚拟城市 当中经历丰富多彩的生活。然而,既然人类玩家能够在洛圣都里尽情遨游完成若干任务,我们是否也能有一...
-
李飞飞团队新作:脑控机器人做家务,让脑机接口具备少样本学习能力
未来也许只需动动念头,就能让机器人帮你做好家务。斯坦福大学的吴佳俊和李飞飞团队近日提出的 NOIR 系统能让用户通过非侵入式脑电图装置控制机器人完成日常任务。 NOIR 能将你的脑电图信号解码为机器人技能库。它现在已能完成例如烹饪寿喜烧、熨衣服、磨奶酪、...
-
AIGC实战——生成模型简介
AIGC实战——生成模型简介 0. 前言 1. 生成模型 2. 生成模型与判别模型的区别 2.1 模型对比 2.2 条件生成模型 2.3 生成模型的发展 2.4 生成模型与人工智能 3. 生成模型示例 3.1 简单示例 3.2 生成模型框...
-
三星预热S24 AI功能 接听电话时能实时翻译对方语言
随着人工智能技术的迅猛发展,越来越多的手机厂商开始将其应用于手机端以提升用户体验。近日,三星宣布推出Galaxy AI系列旗舰手机,首款手机预计将于明年年初上市。 根据三星的介绍,Galaxy Al是一种移动人工智能体验的全面解决方案。它由三星自主研发的设...
-
开发者「第二大脑」来袭,GitHub Copilot更新,人类开发参与进一步减少
是什么让 Andrej Karpathy 感慨,人类在软件开发过程中直接编写代码的贡献将越来越小,直接输入和监督作用将更加抽象化。最终,人类的角色将仅仅是进行基本的审核和确认,而不再是主要的编程和开发者。 原来是 GitHub 新发布的 Copilot...
-
大模型勇闯洛圣都,加封「GTA五星好市民」!南洋理工、清华等发布视觉可编程智能体Octopus:打游戏、做家务全能干
随着游戏制作技术的不断发展,电子游戏已然成为现实世界的模拟舞台。 以游戏《侠盗猎车手》(GTA)为例,在GTA的世界里,玩家可以以第一人称视角,在洛圣都(游戏虚拟城市)当中经历丰富多彩的生活。 然而,既然人类玩家能够在洛圣都里尽情遨游完成若干任务,我们...
-
GPT商店已至,AI的爆款应用还有多远?
什么,还必须要关注“技术”想要什么。 昨天凌晨,整个AI界发生了一场地震,在被视为“首届AI春晚”的OpenA开发者大会上,GPT-4进行了史诗版本的更新。 128K的超长上下文、成本更低的tokens、全新的Assistants API、新增的多模态功能...
-
全网最全ChatGPT/AIGC报告分析(365份)
本星球整理了365份ChatGPT/AIGC重磅专业报告(更新中…),部分目录如下,请读者搜索关键字,获取报告,学习参阅。 https://mp.weixin.qq.com/s/hvI2Hupjx_mnPh3YGyobww 1、计算机研究报告:Chat...
-
从科幻走向现实,LLM Agent 做到哪一步了?
LLM 洪流滚滚,AI 浪潮席卷全球,在这不断冲击行业认知的一年中,Agent 以冉冉新星之态引起开发者侧目。OpenAI 科学家 Andrej Karpathy 曾言“OpenAI 在大模型领域快人一步,但在 Agent 领域,却是和大家处在同一起跑线上...
-
通过100个关键词学习法来学习人工智能(AI)
100个关键词学习法是一种高效的学习方法,它的核心思想是围绕关键词(也就是重点)来进行学习。这套方法论最初由冯唐在世界顶级咨询公司中总结出来。具体来说,不论你想学习哪个行业的知识,首先需要掌握这个行业最重要的一百个关键词。这些关键词可以帮助你快速理解并掌...
-
让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider
大语言模型因其强大而通用的语言生成、理解能力,展现出了成为通用智能体的潜力。与此同时,在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此,大语言模型如何适配开放世界是一个重要的研究问题。 北京大学和北京智源人工智能研究院的团队针对这个问题提出了...
-
Canalys:平板电脑厂商须优先考虑融入生成式 AI 以保持竞争优势
据 Canalys 公布的第三季度全球平板电脑出货量统计数据显示,全球平板电脑出货量达到了 3300 万台,同比下降了 7%,但环比增加了 8%。 这表明在重要的节日季之前,平板电脑市场出现了复苏的迹象,新进者在该领域也表现出色。与此同时,渠道在返校季进...
-
国内最大开源模型发布,无条件免费商用!参数650亿,基于2.6万亿token训练
国内规模最大的开源大模型来了: 参数650亿、基于2.6-3.2万亿token训练。 排名仅次于“猎鹰”和“羊驼”,性能媲美GPT3.5,现在就能无条件免费商用。 它就是来自深圳元象公司的XVERSE。 根据算力、资源限制和具体任务需求的不同,我们能对...
-
大模型落地最后一公里:111页全面综述大模型评测
当前,大模型正凭借其强大的能力和无限的潜力引领着新一轮技术革命,众多科技巨头纷纷围绕大模型进行布局,进一步推动大模型不断向前发展。然而,尽管大模型能够协助我们完成各种任务,改变我们的生产和生活的方式,提高生产力,为我们带来便利,但大模型的发展也伴随着诸多...
-
GPT-4+Midjourney零代码做「愤怒的南瓜」!实测体验:门槛不低,很难复现
【新智元导读】国外网友分享了一个只用AI工具制作游戏的教程,在外网爆火。但亲自尝试之后发现,真的想要做出像样的游戏,远远没有想想那么简单。 通过市面上的AI工具,不需要自己亲自写一行代码,就能做出一个完整的「愤怒的小鸟」?! 最近,外国网友分享了自己花了1...
-
GPT-4+Midjourney零代码做「愤怒的南瓜」!实测体验:门槛不低,很难复现
通过市面上的AI工具,不需要自己亲自写一行代码,就能做出一个完整的「愤怒的小鸟」?! 最近,外国网友分享了自己花了10个小时,通过GPT-4和DALL-E 3/Midjourney做了个愤怒的小鸟的教程,3天之内已经超过了270万的浏览。 图片 还曾登顶...
-
行业首创!广汽“昊铂大模型座舱”开启公测招募:支持智能语音交互
快科技11月2日消息,我们从昊铂官方了解到,旗下昊铂大模型座舱”将于11月2日-15日开启公测招募。 本次招募面向已提车的昊铂 GT 用户,是 OTA 正式版本发布前的抢先体验活动。 值得一提的是,该测试版本可能存在一定的不稳定性。 据悉,广汽 AI...
-
中农网宣布内测白糖产业AI大模型“AI糖”
中农网旗下沐甜科技股份有限公司于10月31日下午在海口召开了“白糖产业AI大模型1.0推介会”,正式发布了名为“AI糖”的大模型的内测版本。 这一生成式自然语言模型旨在服务于白糖全产业链的用户,为那些有采购需求、从事期现交易、或对白糖行业资讯有长期需求的用...
-
给终端装上大模型,对打工人来说究竟是福还是孽?
各行业的打工人从最开始担心被AI替代,到现在的“真香”,已经开始能够利用这一“利器”在工作中不断提高效率,大胆创新。根据速途网与大模型之家联合发布的报告显示,到 2023 年,全球大模型市场规模将达到 210 亿美元,到 2028 年,其规模将增长到...
-
AI玩推理桌游一眼识破骗局!清华通院联合推出心智理论新框架,六个指标评估表现均明显优于思维链
清华自动化系团队联合北京通用人工智能研究院,让几个AI智能体玩起了桌游! 游戏名叫阿瓦隆,是一个策略性的社交推理游戏,玩家被隐秘地分为“正义”与“邪恶”两派,通过任务投票、互相猜测与欺骗来完成或阻止任务,最终确定胜负。 为了能让AI智能体成功识别并应...
-
重磅!GPT-4又进化了!画图、插件、代码等能力被整合,超级智能体来了
夕小瑶科技说 原创 作者 | 小戏、ZenMoore 就在今天!OpenAI 闷声放了一个大招! 图片 还没有官宣,还没有发布会,也没有大肆报道与关注。OpenAI 这次仅仅以灰度测试的方式,给部分用户发布了一个可以说“整合了几乎所有可用工具”的完全版...
-
智谱的“GPT-4V”来了,CEO张鹏说他们就是奔着AGI去的
时隔仅仅四个月,智谱大模型再度升级。在沈阳举办的2023中国计算机大会CNCC2023上,智谱介绍了新一代ChatGLM3大模型。 根据智谱官方的表述,尽管新的大模型名字中带有Chat,但实际上这是一个全新版本的基座模型,它的完全版和上一代一样拥有1300...
-
AI智能超越人类终解开!李飞飞高徒新作破圈,5万个合成数据碾压人类示例,备咖啡动作超丝滑
AI巨佬Geoffrey Hinton称,「科技公司们正在未来18个月内,要使用比现在GPT-4多100倍的算力训练新模型」。 更大参数的模型,对算力需求巨大的同时,对数据也提出了更高的要求。 但是,更多的高质量数据该从何来? 英伟达高级科学家Jim F...
-
正面硬刚OpenAI!智谱AI推出第三代基座模型,功能对标GPT-4V,代码解释器随便玩
国产大模型估值最高创企,为何是智谱AI? 仅用4个月时间,这家公司就甩出最新成绩证明了自己—— 自研大模型ChatGLM3,不止是底层架构,就连模型功能都进行了全方位大升级。 性能上,最直观的表现就是“疯狂屠榜”,所有50个大模型公开性能测评数据集中,拿下...
-
智谱AI推出第三代基座大模型 上线新一代「智谱清言」
智谱AI宣布于2023中国计算机大会(CNCC)上,推出了全自研的第三代基座大模型 ChatGLM3及相关系列产品。 据介绍,今年以来,这是智谱AI第三次对ChatGLM基座模型进行了深度优化,拥有了更强大的功能。智谱AI采用了独创的多阶段增强预训练方法,...
-
文心大模型4.0实现突破!百度文心大模型4.0版本怎么使用
随着人工智能的不断发展,"文心大模型4.0" 的发布无疑为我们打开了新的大门。这款产品在"百度世界2023"发布并开启了邀请测试,这意味着我们将有机会体验到最前沿的人工智能技术。那么,让我们来看看"文心大模型4.0"究竟有哪些突破,并探究它是如何使用的。...
-
AI视野:百度开放文心4.0开发权限申请;腾讯混元大模型开放文生图功能;谷歌AI应用禁止生成受限内容;Midjourney新网站上线测试版
????大模型动态 百度开放文心4.0开发权限申请 在2023年百度世界大会上,百度发布了文心大模型4.0,提升了理解、生成、逻辑、记忆等四个方面,现在开发者可以申请使用 ERNIE Bot SDK 开发与接入该模型的应用。 申请地址:https://a...
-
出版商屏蔽AI网络爬虫 Direcqt开发AI聊天机器人
随着越来越多的媒体出版商开始阻止人工智能网络爬虫访问其内容,一家名为 Direqt 的初创公司正与他们合作,提供定制的聊天机器人解决方案。 Direqt 了解到即时通讯应用正在占据越来越多的消费者时间,因此看到了为出版商构建专门聊天机器人平台的机会。这些聊...
-
AI视野:高通发布骁龙X Elite芯片;AutoGPT获1200万美元融资;AI社交产品Airchat火了;百度Comate智能代码助手上线SaaS版本
???AI新鲜事 高通发布骁龙X Elite芯片 电脑可运行130亿参数大模型 高通发布骁龙X Elite芯片,成为全球性能最强的CPU,能在PC上运行130亿参数的大模型,实现离线AI应用。 爆火智能体项目AutoGPT获1200万美元融资 Auto...
-
Meta普林斯顿提出LLM上下文终极解决方案!让模型化身自主智能体,自行读取上下文节点树
到底什么才是LLM长上下文模型的终极解决方案? 最近由普林斯顿大学和Meta AI的研究者提出了一种解决方案,将LLM视为一个交互式智能体,让它决定如何通过迭代提示来读取文本。 论文地址:https://arxiv.org/abs/2310.05029...
-
让AI帮你跳槽,涨薪50% 不是问题
这篇文章将教你使用 AI 打磨一份几乎完美的简历;教你用 AI 模拟面试场景,遍历所有面试问题,让你在面试时游刃有余。 关键信息:协助回顾职业履历;根据履历生成简历;根据岗位要求优化简历;模拟招聘方优化简历;构建“智能体”模拟面试遍历问题。 本文适合下列人...
-
AI视野:WPS AI宣布接入WPS Mac版;爱奇艺推出AI搜索;苹果计划明年推出生成式AI功能;DALL-E3易受越狱攻击
???AI应用 爱奇艺推出AI搜索 将生成式AI技术应用于剧情搜索等场景 爱奇艺升级AI搜索,区别于传统搜索第一步只能搜到片名,升级后的爱奇艺AI搜索主打让观众在搜索环节便能一键直达心仪内容。 WPS AI 宣布接入 WPS Mac 版 提供内容生成等功...
-
机器人学会转笔、盘核桃了!GPT-4加持,任务越复杂,表现越优秀
大数据文摘出品 家人们,继人工智能(AI)攻占象棋、围棋、Dota之后,转笔这一技能也被 AI 机器人学会了。 上面这个笔转的贼溜的机器人,得益于名叫Eureka的智能体(Agent),是来自英伟达、宾夕法尼亚大学、加州理工学院和得克萨斯大学奥斯汀分...
-
DeepMind:大模型又曝重大缺陷,无法自我纠正推理,除非提前得知正确答案
大语言模型又一项重大缺陷被DeepMind曝光! LLM无法纠正自己推理中的错误。 「Self-Correction」作为一种让模型修正自己回答的技术,在很多类型的任务中都能明显改进模型的输出质量。 但是最近,谷歌DeepMind和UIUC的研究人员却发...
-
有了GPT-4之后,机器人把转笔、盘核桃都学会了
在学习方面,GPT-4 是一个厉害的学生。在消化了大量人类数据后,它掌握了各门知识,甚至在聊天中能给数学家陶哲轩带来启发。 与此同时,它也成为了一名优秀的老师,而且不光是教书本知识,还能教机器人转笔。 这个机器人名叫 Eureka,是来自英伟达、宾夕法...
-
Meta重磅更新,小扎在元宇宙里养了会做家务的狗!人形化身超逼真,AI智能体在真实物理世界和人互动
今天开始,人类离帮忙做家务的机器人,又近了一步! Meta宣布推出Habitat 3.0,目的是开发出社会化的AI智能体,这意味着社交智能机器人已经进入新的里程碑阶段。 这些具身智能背后的关键,当然就是AI Agent。有了它们,机器人可以和人类协作...