-
GPT-4完成正确率仅6%!北大等提出首个「多轮、多模态」PPT任务完成基准PPTC
【新智元导读】为了填补LLM在复杂多模态环境中利用复杂工具完成多轮、多模态指令的评估空白,研究人员引入了PowerPoint任务完成(PPTC)基准测试,以评估LLM创建和编辑PPT文档的能力。 最近对大型语言模型(例如ChatGPT和GPT-4)进行的评...
-
深夜炸场,ChatGPT一周年:无需编程,全民定义GPT的时代,来了!
撰稿 | 云昭 深夜又是一场王炸!在ChatGPT发布一周年之际,OpenAI 创始人Altman 在首届开发者大会上全场放大招,台下掌声不断。 无需编程,甚至无需敲键盘,单纯通过语音聊天就能构建一个专属自定义的GPT!这个消息实在太燃了!以至于推特...
-
xAiGrok官网使用地址 马斯克版GPTAi模型体验下载
xAI Grok是一款利用大型语言模型(LLM)的智能对话助手,提供人机对话交互。它能够帮助用户理解各种问题,并提供关于各种主题的知识和见解。xAI Grok具备强大的理解能力和广泛的知识库,以便用户能够获取准确、全面的答案。该产品的定价非常灵活,适用于个...
-
科普神文,GPT背后的Transformer模型
上次《解读AI大模型,从了解token开始》一文中,我从最基础的概念“token”着手,跳过了复杂的算法逻辑,相信已经让大家建立起对AI大模型工作原理的清晰认知。 但如果仅仅只是依靠对文本的编码与数据分析,那人工智能时代应该早就到来了,为什么唯独是GPT...
-
AI视野:OpenAI发布GPT-4Turbo;xAI推出PromptIDE工具;美团首个AI产品“Wow”亮相;百家号AI笔记功能将下线
???AI新鲜事 OpenAI发布GPT-4Turbo和自定义GPTs服务 在OpenAI首届开发者大会DevDay活动上,OpenAI发布了GPT-4Turbo模型和自定义GPTs服务,以及其他新功能和API,如Assistants API和新的模态AP...
-
微软推出 “从错误中学习” 模型训练法,号称可“模仿人类学习过程,改善 AI 推理能力”
IT之家 11 月 7 日消息,微软亚洲研究院联合北京大学、西安交通大学等高校,提出了一项名为“从错误中学习(Learning from Mistake,LeMA)”的 AI 训练方法,号称可以通过模仿人类学习知识的过程,来改进 AI 推理能力。 当下...
-
OpenAI CEO:AI聊天机器人ChatGPT周活跃用户数已达1亿
11月7日消息,据外媒报道,在当地时间周一举行的OpenAI首届开发者大会上,OpenAI CEO萨姆•奥尔特曼(Sam Altman)宣布,该公司旗下AI聊天机器人ChatGPT的周活跃用户数已达到1亿。 据悉,ChatGPT是OpenAI于2022年1...
-
生成式AI喧嚣之下:CIO选择谨慎行事尚未全力投入
大多数CIO已经开始探索生成式AI,以确保他们跟上发展步伐,但很多人发现市场上的技术尚未达到宣传的效果。米其林全球首席信息官Yves Caseau表示:“在对GitHub copilot和ChatGPT进行了六个多月的试验后,我对生成式AI的发展速度感...
-
YouTube测试生成式AI功能:包括YouChat工具和AI总结评论
Google旗下的YouTube宣布,他们正在为其高级订阅用户推出一系列实验性生成式人工智能功能。这一系列功能旨在提升用户对内容的互动和理解。 最引人注目的功能之一是名为“YouChat”的工具。YouTube表示,这将帮助观众更深入地了解他们正在观看的...
-
让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider
大语言模型因其强大而通用的语言生成、理解能力,展现出了成为通用智能体的潜力。与此同时,在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此,大语言模型如何适配开放世界是一个重要的研究问题。 北京大学和北京智源人工智能研究院的团队针对这个问题提出了...
-
北大&智源提出训练框架LLaMA-Rider 让大模型自主探索开放世界
北京大学和北京智源人工智能研究院的团队提出了名为LLaMA-Rider的训练框架,旨在让大型语言模型在开放世界中具备自主探索和学习任务的能力。这个框架通过反馈-修改机制来实现主动探索,使模型在环境中接收反馈信息,不断调整决策,从而逐渐适应开放环境。 项目...
-
德国初创公司 Aleph Alpha 完成 5 亿美元 B 轮融资,挑战 OpenAI
德国初创公司 Aleph Alpha 在周一宣布,已完成由博世、SAP 和惠普企业等支持的 5 亿美元融资。这家公司构建了自己的大型语言模型,并在 B 轮融资中筹集了这笔新资金,这是该公司的第二轮主要融资,也是一笔不同寻常的巨额 B 轮投资。 这轮融资主...
-
联发科发布天玑9300生成式AI移动芯片 支持运行330亿参数大模型
昨日晚间,联发科技发布了天玑9300旗舰5G 生成式 AI 移动芯片,采用台积电第三代4nm 制程。该芯片预计于2023年底上市。 这款芯片采用全大核架构设计,提供高智能、高性能、高能效、低功耗的特性,为用户带来卓越的生成式 AI 体验。 天玑9300采...
-
这些浏览器中的 AI 扩展太香了
众所周知,浏览器只有添加了扩展才能让其火力全开,效率翻倍,而当有了AI的加持后,直接起飞。 本期将整理一些目前非常火的基于AI语言模型的扩展程序,大大提高生产力,一起看看吧! ChatGPT for Google https://chrome.go...
-
OpenAI推出用户自定义版ChatGPT:可在商城自由交易
快科技11月7日消息,Open AI最近在开发者大会上表示,将会允许用户构建自定义版ChatGPT,来完成特定的个人和专业任务。 OpenAI称,用户能快速创建自己专用版本的ChatGPT,可以用于帮助教孩子数学或解释棋盘游戏的规则。 OpenAI还计划在...
-
微软将人工智能引入 Xbox,帮助开发者生成 AI 角色、故事剧情等
IT之家 11 月 7 日消息,微软宣布将与 Inworld AI 合作开发 Xbox 工具,使开发者能够创建基于 AI 的角色、故事和任务。 据介绍,此次合作主要将包括一个“AI 设计 Copilot”系统,Xbox 开发者可以借助该系统创建详细的脚...
-
YouTube 测试新的 AI 驱动聊天机器人「YouChat」以增强观看体验
YouTube 正在测试一款新的人工智能聊天机器人,能够与观众交谈,让他们「更深入地了解他们正在观看的内容。」 YouTube 宣布,这个新的交流工具将提供「对你正在观看的视频的问题的回答,相关内容的推荐等,所有这些都不会中断播放。」这项名为「YouCh...
-
想快速进入人工智能领域的Java程序员?你准备好了吗?
引言 今天我们来探讨一下作为Java程序员,如何迅速融入人工智能的领域。,当前有一些流行的LLMs选择,例如ChatGPT、科大讯飞的星火、通义千问和文心一言等。如果你还没有尝试过这些工具,那么现在也不失为一个很好的机会,赶快体验一下吧。这些工具不仅能够...
-
天玑9300 AI能力飙升:最高支持330亿参数的AI大语言模型
快科技11月6日消息,联发科今晚正式发布天玑9300旗舰5G生成式AI移动芯片,支持在端侧生成式AI、游戏、影像等方面定义旗舰新体验。 据介绍,天玑9300集成MediaTek第七代AI处理器APU 790,为生成式AI而设计,其性能和能效得到显著提升,整...
-
AI创企xAI发布首款人工智能聊天机器人Grok
据外媒报道,特斯拉CEO埃隆·马斯克(Elon Musk 旗下人工智能初创公司xAI发布了首款生成式人工智能聊天机器人——Grok。 上周,马斯克警告称,人工智能是“对人类最大的威胁之一”。然而,这并没有阻止他参与其中。上周六,他通过一系列推文透露了G...
-
xAI Grok内测资格在哪里申请 Grok资格申请入口介绍
马斯克近日正式宣布推出xAI Grok大模型,这是xAI团队发布的首个AI大模型产品。据xAI的声明称,该产品“有智慧,还有叛逆的性格”,并且能回答被大多数其他AI系统拒绝的辛辣问题。 xAI Grok现在已经可以进行内测资格申请(点击进入),用户可在官...
-
AI视野:xAI首个大模型Grok炸场;李开复官宣开源大模型Yi-34B;ChatGPT原型Gizmo新功能曝光;百度网盘引入大模型智能助理
????大模型动态 李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字 零一万物发布全球最强的开源大模型Yi-34B,具备超强的语言理解和处理能力,支持处理40万汉字,在中文指标上表现卓越,标志着中国在大模型领域的重大突破。 项目地址:htt...
-
大型语言模型(LLM)技术精要,不看亏了
哈喽,大家好。 今天分享一篇知乎高赞文章,作者是张俊林老师。 图片 读完收获很多,能帮大家更好地理解、学习大模型。原文有2.8w字,我提炼了核心要点,阅读需要10min。 ChatGPT的出现给很多人带来了惊喜和醒悟。有人惊喜地发现大型语言模型(LLM)...
-
AI治理的内容、方式及其产生的原因
自诞生以来,AI一直是一个强大的工具,通过自动化任务和简化操作,构建更好的技术,并使最终用户体验更轻松和更个性化,帮助改善内部运营。虽然AI对社会的影响并不新鲜,但更先进的AI解决方案的崛起引发了人们对这些技术将如何利用的担忧。 AI的繁荣创造了对强大...
-
迪拜将举办“全球AI挑战赛”,冠军可获近200万元奖金
迪拜哈姆丹亲王宣布将举办一项以生成式人工智能为重点的全球AI挑战赛,冠军将获得100万迪拉姆(约合人民币198.28万元)的奖金。这一挑战赛是迪拜在转向未来经济的过程中的一部分,旨在推动迪拜成为全球领先的人工智能创新中心。 图源备注:图片由AI生成,图片...
-
DB-GPT:使用专有LLM技术改变与数据库互操作的方式
DB-GPT是一个开源项目,旨在改变与数据库的互操作方式,它采用了本地化的大型GPT模型,为处理各种数据库相关情境提供了全面的解决方案。这个工具强调了隐私和数据安全,通过业务模块的定制化实施和分割,确保了LLM功能的完全机密性、安全性和可管理性。 随着大...
-
红帽将IBM Watsonx 代码生成应用于 Ansible 自动化
红帽(Red Hat Inc)近日宣布,搭载IBM watsonx Code Assistant(一种用于信息技术自动化的生成式人工智能服务)的Ansible Lightspeed已全面上市。 该服务于今年5月发布,接受用户输入的提示,并与watson...
-
马斯克xAI公布大模型详细进展,Grok只训练了2个月
近几日,马斯克的人工智能公司 xAI 公布了他们用来对标 OpenAI ChatGPT 的产品 ——Grok ,直接把网友的好奇心拉满。 和总是一本正经回答问题的 ChatGPT 不同,Grok 自带幽默和嘲讽技能。 就像下图所展示的,Grok 在被...
-
Together AI发布RedPajama v2 用于大模型训练
Together AI发布了RedPajama v2,这是一个包含30万亿标记的数据集,旨在支持大型语言模型的研究和开发。高质量的数据对于这些模型的成功至关重要,但获取适当的数据集是一项繁琐的任务,需要大量时间、资源和金钱。 研究人员从CommonCraw...
-
元象XVERSE开源650亿参数通用大模型XVERSE-65B
元象XVERSE宣布 开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用。 XVERSE-65B 是由深圳元象科技开发的一种支持多语言的大型语言模型。它采用了 Transformer 网络结构,参数规模达到了650亿。 模型通过训练了2....
-
北大具身智能新成果:无需训练,听指令就能灵活走位
北京大学董豪团队具身导航最新成果来了: 无需额外建图和训练,只需说出导航指令,如: Walk forward across the room and walk through the panty followed by the kitchen. Stan...
-
李开复称其创立的AI公司零一万物估值已超10亿美元 发布大模型Yi-34B
此前,李开复成立了一家初创公司,名为零一万物(01.AI),旨在为中国市场开发本土大型语言模型(LLM)。日前,李开复在接受采访时解释了创建零一万物的动机:“我认为需求是创新之母,在中国显然存在巨大的需求。与世界其他地方不同,中国无法使用OpenAI和Go...
-
中科院物理研究所等发布材料合成AI大语言模型MatChat
近期,中国科学院计算机网络信息中心人工智能部和物理研究所SF10组合作,通过使用来自400多万篇论文中提取的35675个无机材料固相反应合成过程,将数据处理为13878条高可信度的合成路径描述数据,并对开源大语言模型LLaMA2-7B进行微调训练,研发了专...
-
一篇学会大模型浪潮下的时间序列预测
今天跟大家聊一聊大模型在时间序列预测中的应用。随着大模型在NLP领域的发展,越来越多的工作尝试将大模型应用到时间序列预测领域中。这篇文章介绍了大模型应用到时间序列预测的主要方法,并汇总了近期相关的一些工作,帮助大家理解大模型时代时间序列预测的研究方法。...
-
20步内越狱任意大模型!更多“奶奶漏洞”全自动发现
1分钟不到、20步以内“越狱”任意大模型,绕过安全限制! 而且不必知道模型内部细节—— 只需要两个黑盒模型互动,就能让AI全自动攻陷AI,说出危险内容。 听说曾经红极一时的“奶奶漏洞”已经被修复了: 那么现在搬出“侦探漏洞”、“冒险家漏洞”、“作家漏...
-
大模型落地最后一公里:111页全面综述大模型评测
当前,大模型正凭借其强大的能力和无限的潜力引领着新一轮技术革命,众多科技巨头纷纷围绕大模型进行布局,进一步推动大模型不断向前发展。然而,尽管大模型能够协助我们完成各种任务,改变我们的生产和生活的方式,提高生产力,为我们带来便利,但大模型的发展也伴随着诸多...
-
AI能理解自己生成的东西吗? 在GPT-4、Midjourney上实验后,有人破案了
从 ChatGPT 到 GPT4,从 DALL・E 2/3 到 Midjourney,生成式 AI 引发了前所未有的全球关注。强大的潜力让人们对 AI 产生了许多期待,但是强大的智能也会引发人们的恐惧和担忧。近期大牛们针对该问题还上演了一场激烈的论战。先...
-
360大模型“奇元大模型”通过备案落地
近日,360智脑官方宣布,其自主研发的“奇元大模型”已通过备案并成功落地。值得一提的是,今年9月,该模型已获批面向公众开放,使得360成为国内首家两个大模型均通过备案的科技企业。 据了解,360智脑大模型具备生成创作、多轮对话、逻辑推理等十大核心能力,覆盖...
-
ChatGPT 和 GPT-4 均无法通过成为 CFA 所需的所有级别的考试
根据最近的一项研究,ChatGPT 未能通过特许金融分析师(CFA)考试——这是许多华尔街金融专业人士的基准资格。这项研究由摩根大通的 AI 研究团队和大学学者联合进行,他们使用 CFA 风格的问题测试了 ChatGPT 和 GPT-4(两款由 OpenA...
-
2024年人工智能安全发展十大预测
本周三,包括英国、美国和中国在内的近30个国家(以及欧盟)在人工智能安全峰会上达成首个全球性人工智能安全协议,并发布了《人工智能安全宣言》,这标志着人工智能正式进入安全发展的强监管时代。 峰会期间,人工智能意见领袖们就人工智能安全风险的严重性判断产生重...
-
人工智能进入强监管时代
以ChatGPT为代表的基于LLM(大语言模型 的生成式人工智能应用正风靡全球,各行各业都在争先恐后将其集成到前端和后端的各种系统中,与此同时生成式人工智能面临的安全风险也正随着其热度上升而凸显。 生成式人工智能自身正面临提示注入等多种攻击,很可能给企...
-
民调显示:58%美国成年人认为AI将在2024年选举中增加虚假信息
美国联合通讯社(Associated Press)与芝加哥大学哈里斯公共政策学院最新的民调显示,在2024年即将来临之际,人工智能工具的快速发展可能会以前所未有的规模加剧选举中的虚假信息。根据这项民调,几乎六成(58% 的成年人认为人工智能工具会增加明年选...
-
AI视野:Gen-2支持生成4K高清视频;Midjourney推出Style Tuner工具;钉钉 AI 魔法棒正式上线;马斯克𝕏AI团队首批产品曝光
???AI应用 Gen-2史诗级更新 允许用户通过简单文本生成4K高清视频 Runway的AI视频生成工具Gen-2经历了一次重大更新,允许用户通过简单的文本输入来生成4K高清视频,彻底改变了创意软件的方式。 Gen-2体验地址:https://rese...
-
AI 模型的开源定义需要改变
你认为开源许可证应当进行演变吗? 2023 年,我们以人工智能(AI)崭露头角开始了新的一年,同时也见证了众多公司全力以赴投身于 AI。 比如说 Mozilla,它在 2023 年初制定了 开源 AI 计划,以开发各种 AI 驱动的解决方案。而 Hug...
-
库克关于苹果生成式AI计划说辞毫无新意 引发股东不满
苹果CEO蒂姆·库克关于苹果生成式人工智能计划的解释,似乎已经变得毫无新意,引发了股东的不满。虽然苹果尚未推出与ChatGPT和Google Bard等产品竞争的生成式人工智能产品,但库克在回答有关苹果生成式人工智能计划的问题时,似乎已经达到了“大规模生产...
-
SAP 让每位开发者都成为生成式人工智能开发人员:旨在推动 AI 时代的业务转型
在 2023 年的 SAP TechEd 活动中,SAP SE 宣布了一系列全面的生成式人工智能(AI)能力和进步,旨在赋予所有技能水平的开发者,在 AI 时代为其业务注入强大动力。 SAP 揭示了生成式 AI 应用开发和向量数据库能力的创新,以及为开发...
-
隐私浏览器Brave发布“匿名且安全”AI聊天机器人Leo 承诺不用户数据训练AI
隐私导向的浏览器Brave最近推出了名为Leo的本地AI助手,该公司声称相比其他AI聊天机器人服务,Leo提供了“无与伦比的隐私”。 经过数月的测试,Leo现在可供所有运行浏览器版本1.60的Brave桌面用户免费使用,而且将在未来几个月内分阶段推出到An...
-
科普神文,一次性讲透AI大模型的核心概念
图片 令牌,向量,嵌入,注意力,这些AI大模型名词是否一直让你感觉熟悉又陌生,如果答案肯定的话,那么朋友,今天这篇科普神文不容错过。我将结合大量示例及可视化的图形手段,为你由浅入深一次性讲透AI大模型的核心概念。 引言 随着科技公司及国际竞争的不断推进,...
-
大模型: 模型大了难在哪里?
大家好,我是Tim。 自从GPT模型诞生以来,其参数规模就在不停的扩大。但模型并非简单的直接变大,需要在数据、调度、并行计算、算法和机器资源上做相应的改变。 今天就来总结下,什么是大模型,模型变大的难在哪里以及对于CV/NLP或者搜推广场景上有什么应对策...
-
蚂蚁集团发布DevOps领域大模型评测基准DevOps-Eval
蚂蚁集团联合北京大学发布了面向 DevOps 领域的大语言模型评测基准 ——DevOps-Eval。 该评测基准包含了计划、编码、构建、测试、发布、部署、运维和监控等8个类别的选择题,共计4850道题目。 此外,还针对 AIOps 任务做了细分,并添加了日...