-
大型语言模型(LLM)技术精要,不看亏了
哈喽,大家好。 今天分享一篇知乎高赞文章,作者是张俊林老师。 图片 读完收获很多,能帮大家更好地理解、学习大模型。原文有2.8w字,我提炼了核心要点,阅读需要10min。 ChatGPT的出现给很多人带来了惊喜和醒悟。有人惊喜地发现大型语言模型(LLM)...
-
DB-GPT:使用专有LLM技术改变与数据库互操作的方式
DB-GPT是一个开源项目,旨在改变与数据库的互操作方式,它采用了本地化的大型GPT模型,为处理各种数据库相关情境提供了全面的解决方案。这个工具强调了隐私和数据安全,通过业务模块的定制化实施和分割,确保了LLM功能的完全机密性、安全性和可管理性。 随着大...
-
马斯克xAI公布大模型详细进展,Grok只训练了2个月
近几日,马斯克的人工智能公司 xAI 公布了他们用来对标 OpenAI ChatGPT 的产品 ——Grok ,直接把网友的好奇心拉满。 和总是一本正经回答问题的 ChatGPT 不同,Grok 自带幽默和嘲讽技能。 就像下图所展示的,Grok 在被...
-
李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字
零一万物推出了「Yi」系列开源大模型,其中Yi-34B在全球开源大模型排行榜上取得了显著成就,击败了其他竞品模型,成为双料冠军,尤其在中文指标上表现卓越。Yi-34B的性能超越了全球其他大模型,拥有强大的语言理解和处理能力,可以满足国内市场的需求。 ht...
-
Together AI发布RedPajama v2 用于大模型训练
Together AI发布了RedPajama v2,这是一个包含30万亿标记的数据集,旨在支持大型语言模型的研究和开发。高质量的数据对于这些模型的成功至关重要,但获取适当的数据集是一项繁琐的任务,需要大量时间、资源和金钱。 研究人员从CommonCraw...
-
谷歌DeepMind力证:GPT-4终局是人类智慧总和!Transformer模型无法超越训练数据进行泛化
Transformer模型是否能够超越预训练数据范围,泛化出新的认知和能力,一直是学界争议已久的问题。 最近谷歌DeepMind的3位研究研究人员认为,要求模型在超出预训练数据范围之外泛化出解决新问题的能力,几乎是不可能的。 LLM的终局就是人类智慧总和...
-
北大具身智能新成果:无需训练,听指令就能灵活走位
北京大学董豪团队具身导航最新成果来了: 无需额外建图和训练,只需说出导航指令,如: Walk forward across the room and walk through the panty followed by the kitchen. Stan...
-
Together AI发布RedPajama v2:包内30万亿token数据集,用于训练大型语言模型
Together AI最近发布了RedPajama v2,这是一个庞大的在线数据集,包含了30万亿token,成为目前公开可用的最大数据集之一,专门用于学习型机器学习系统的培训。 对于像Llama、Mistral、Falcon、MPT和RedPajama等...
-
李开复称其创立的AI公司零一万物估值已超10亿美元 发布大模型Yi-34B
此前,李开复成立了一家初创公司,名为零一万物(01.AI),旨在为中国市场开发本土大型语言模型(LLM)。日前,李开复在接受采访时解释了创建零一万物的动机:“我认为需求是创新之母,在中国显然存在巨大的需求。与世界其他地方不同,中国无法使用OpenAI和Go...
-
王者GPT-4已来,32k上下文!OpenAI首届开发者大会最新爆料,全新UI可定制GPT,xAI大模型大范围可用
OpenAI首届开发者大会开启前,ChatGPT各种爆料已出,全新UI界面,人人可定制GPT,将引领「智能体工程师」新职业诞生。另一边,马斯克自家的xAI大模型也开启了大范围内测。 OpenAI首届开发者大会,开启了倒计时! 还记得周一,OpenAI悄无...
-
一篇学会大模型浪潮下的时间序列预测
今天跟大家聊一聊大模型在时间序列预测中的应用。随着大模型在NLP领域的发展,越来越多的工作尝试将大模型应用到时间序列预测领域中。这篇文章介绍了大模型应用到时间序列预测的主要方法,并汇总了近期相关的一些工作,帮助大家理解大模型时代时间序列预测的研究方法。...
-
给大模型评分的基准靠谱吗?Anthropic来了次大评估
现阶段,大多数围绕人工智能 (AI)对社会影响的讨论可归结为 AI 系统的某些属性,例如真实性、公平性、滥用的可能性等。但现在面临的问题是,许多研究人员并没有完全意识到建立稳健可靠的模型评估是多么困难。当今许多现有的评估套件在各个方面的表现都很有限。 A...
-
大模型落地最后一公里:111页全面综述大模型评测
当前,大模型正凭借其强大的能力和无限的潜力引领着新一轮技术革命,众多科技巨头纷纷围绕大模型进行布局,进一步推动大模型不断向前发展。然而,尽管大模型能够协助我们完成各种任务,改变我们的生产和生活的方式,提高生产力,为我们带来便利,但大模型的发展也伴随着诸多...
-
AI能理解自己生成的东西吗? 在GPT-4、Midjourney上实验后,有人破案了
从 ChatGPT 到 GPT4,从 DALL・E 2/3 到 Midjourney,生成式 AI 引发了前所未有的全球关注。强大的潜力让人们对 AI 产生了许多期待,但是强大的智能也会引发人们的恐惧和担忧。近期大牛们针对该问题还上演了一场激烈的论战。先...
-
CMU清华MIT引爆全球首个Agent无限流,机器人「007」加班自学停不下来!具身智能被革命
全球首个生成式机器人Agent发布了! 长久以来,相比于语言或者视觉模型可以在大规模的互联网数据上训练,训练机器人的策略模型需要带有动态物理交互信息的数据,而这些数据的匮乏一直是具身智能发展的最大瓶颈。 最近,来自CMU、清华、MIT,UMass等机构的...
-
字节“开盒”OpenAI所有大模型,揭秘GPT-3到GPT-4进化路径!把李沐都炸出来了
GPT-3究竟是如何进化到GPT-4的? 字节给OpenAI所有大模型来了个“开盒”操作。 结果还真摸清了GPT-4进化路上一些关键技术的具体作用和影响。 比如: SFT是早期GPT进化的推动者 帮助GPT提升编码能力的最大功臣是SFT和RLHF 在...
-
北京人形机器人创新中心成立,将打造全球首个软硬件“母平台”
11 月 4 日消息,据《北京青年报》等报道,国内首家省级人形机器人创新中心 —— 北京人形机器人创新中心有限公司本周四在北京经开区机器人创新产业园正式注册,这标志着国内首家省级人形机器人创新中心成立。 ▲ 图源公众号“北京亦庄” 据介绍,该公司由机器...
-
谷歌推出“先进天气预报 AI”MetNet-3,号称预测结果超过传统物理模型
11 月 3 日消息,谷歌研究院与 DeepMind 合作开发了最新的天气模型 MetNet-3,该模型以之前的 MetNet 和 MetNet-2 为基础,能够提前 24 小时,能够对全球天气情况进行高解析度预测,包括降水、表面温度、风速、风向和体感...
-
新突破:科学家研发类脑纳米线网络,让 AI 模仿人类实时学习和记忆
11 月 3 日消息,科研人员近日模仿大脑中的神经网络,成功开发出一种可以动态学习和记忆的物理神经网络。该物理神经网络由微小的纳米线组成,并模仿大脑中的突触,通过响应电线相交点处的电子电阻变化来执行任务。 该物理神经网络通过识别和调用电脉冲序列,能够...
-
研究称:向GPT-4等AI模型添加“情感提示词”会提高性能
最新研究发现,当用户表达紧急感或压力等情感时,AI模型如GPT-4可以表现得更好。这一发现对于在其AI应用中的开发者和企业家具有重要意义,提示了一种引入情感语境的新方法,以提高AI性能。 这项研究发现,添加情感因素的提示,被称为“情感提示”,可以提高AI在...
-
人工智能进入强监管时代
以ChatGPT为代表的基于LLM(大语言模型 的生成式人工智能应用正风靡全球,各行各业都在争先恐后将其集成到前端和后端的各种系统中,与此同时生成式人工智能面临的安全风险也正随着其热度上升而凸显。 生成式人工智能自身正面临提示注入等多种攻击,很可能给企...
-
AI视野:Gen-2支持生成4K高清视频;Midjourney推出Style Tuner工具;钉钉 AI 魔法棒正式上线;马斯克𝕏AI团队首批产品曝光
???AI应用 Gen-2史诗级更新 允许用户通过简单文本生成4K高清视频 Runway的AI视频生成工具Gen-2经历了一次重大更新,允许用户通过简单的文本输入来生成4K高清视频,彻底改变了创意软件的方式。 Gen-2体验地址:https://rese...
-
AI 模型的开源定义需要改变
你认为开源许可证应当进行演变吗? 2023 年,我们以人工智能(AI)崭露头角开始了新的一年,同时也见证了众多公司全力以赴投身于 AI。 比如说 Mozilla,它在 2023 年初制定了 开源 AI 计划,以开发各种 AI 驱动的解决方案。而 Hug...
-
代码能力超越GPT-4,这个模型登顶Big Code排行榜,YC创始人点赞
一款号称代码能力超越GPT-4的模型,引发了不少网友的关注。 准确率比GPT-4高出超过10%,速度却接近GPT-3.5,而且窗口长度也更长。 据开发者描述,他们的模型取得了74.7%的Pass@1通过率,超过了原始GPT-4的67%,登上了Big C...
-
科普神文,一次性讲透AI大模型的核心概念
图片 令牌,向量,嵌入,注意力,这些AI大模型名词是否一直让你感觉熟悉又陌生,如果答案肯定的话,那么朋友,今天这篇科普神文不容错过。我将结合大量示例及可视化的图形手段,为你由浅入深一次性讲透AI大模型的核心概念。 引言 随着科技公司及国际竞争的不断推进,...
-
英国拟投资 2.25 亿英镑研发超级计算机,用于 AI 大模型领域
11 月 2 日消息,英国政府日前宣布,为了进一步提高该国人工智能能力,对人工智能研究资源的投资从 2023 年 3 月宣布的 1 亿英镑(IT之家备注:当前约 8.9 亿元人民币)增加两倍,达到 3 亿英镑(当前约 26.7 亿元人民币)。 据介绍...
-
NTU华科等最新研究:全自动化「提示越狱」,能打败大模型的只有大模型!登安全顶会NDSS
今年,被网友戏称为「奶奶漏洞」的大语言模型「越狱」方法,可以说是火了火。 简单来说,对于那些会被义正言辞拒绝的需求,包装一下话术,比如让ChatGPT「扮演已经过世的祖母」,它大概率就会满足你了。 不过,随着服务提供商不断地更新和强化安全措施,越狱攻击...
-
不到 600 行代码实现了《愤怒的小鸟》翻版,GPT-4+DALL·E 3+Midjourney撼动游戏圈
把草图变网站,用几秒复现一款经典小游戏...随着 GPT-4与 Midjourney、DALL•E3等 AIGC 工具的强强联合,其带给游戏行业的震撼不是一星半点。 昨日,正值万圣节之际,一位名为Javi Lepez的外国小哥使用Midjourney、DA...
-
目前CIO们仍在谨慎地探索GenAI在企业中的应用价值
多数CIO已经开始探索GenAI,以确保企业跟上技术发展的趋势,但许多人发现,市场上的技术还没有达到理想的水平。米其林全球CIO Yves Caseau表示:“在对GitHub Copilot和ChatGPT进行了六个多月的试验后,GenAI的发展速度令...
-
复合年增长率 31.4%,IDC 预估 2027 年全球 AI 软件营收 2790 亿美元
11 月 2 日消息,根据市场调查机构 IDC 公布的最新预估报告,2022 年全球 AI 软件市场规模为 640 亿美元,预估 2027 年将增加到 2790 亿美元,复合年增长率 (CAGR) 为 31.4%。 IT之家注:AI 软件包括 AI 平...
-
阿里云推出“通义灵码”AI 编程工具,支持 VS Code、JetBrains 等主流 IDE
11 月 1 日消息,阿里云目前推出了一款 AI 编程工具“通义灵码”,号称基于自家通义大模型打造,IT之家的小伙伴们可以点击此处访问项目官网。 据悉,“通义灵码”兼容 Visual Studio Code、JetBrains IDEs 等主流 IDE...
-
特斯拉 Optimus 机器人项目招兵买马,聘请强化学习等领域工程师
11 月 1 日消息,特斯拉正在加速招聘人形机器人项目 Optimus 的工程师,包括一些强化学习方面的专家。 很多人对这个项目并不看好,认为它只是一个噱头。然而,特斯拉却非常认真地推进这个项目。最近,特斯拉展示了 Optimus 的最新原型,表现...
-
人工智能时代如何保护人权和民主
近年来,人工智能(AI 系统的受欢迎程度显著提高,尤其是在2023年,随着一种被称为“大型语言模型”(LLM 的特定类型系统的引入,人工智能(AI 系统将成为人们关注的焦点。这类系统的例子包括ChatGPT和Bard。 尽管人工智能技仍在发展中,但很明...
-
利用AI辅助工具Userdoc定义软件需求
Userdoc是一个AI辅助服务,可以帮助创建软件需求文档。在最近举行的AI工程师峰会上,笔者与Userdoc的创始人Chris Rickard进行了交流。 译自 AI for Dev Tools: Create Software Requirement...
-
AI自动生成创意视频:如何让大模型助你一臂之力
作者 | 崔皓 审校 | 重楼 摘要 本文探讨了如何利用大语言模型和AI视频生成模型来创建高度个性化和创意丰富的视频内容。文章详细介绍了从构思到实现的全过程,包括问题分析、目标设定、工具和模型选择,以及实际操作步骤。使用的技术和工具包括OpenAI的G...
-
人工智能如何增强可观测性
当前的时代背景下,理解怀念过去是可以理解的,但我们正处在这样的环境里,因此,可观测性永远不会和从前一样了。 译自 How AI Can Supercharge Observability 。 最近,可观测性变得越来越复杂,肯定比IT监控的早期阶段要复杂得...
-
AI玩推理桌游一眼识破骗局!清华通院联合推出心智理论新框架,六个指标评估表现均明显优于思维链
清华自动化系团队联合北京通用人工智能研究院,让几个AI智能体玩起了桌游! 游戏名叫阿瓦隆,是一个策略性的社交推理游戏,玩家被隐秘地分为“正义”与“邪恶”两派,通过任务投票、互相猜测与欺骗来完成或阻止任务,最终确定胜负。 为了能让AI智能体成功识别并应...
-
使用Llama index构建多代理 RAG
检索增强生成(RAG 已成为增强大型语言模型(LLM 能力的一种强大技术。通过从知识来源中检索相关信息并将其纳入提示,RAG为LLM提供了有用的上下文,以产生基于事实的输出。 但是现有的单代理RAG系统面临着检索效率低下、高延迟和次优提示的挑战。这些问题...
-
谷歌 DeepMind 联合创始人:到 2028 年人类有 50% 的可能实现 AGI
10 月 31 日消息,据科技播客 Dwarkesh Patel 报道,谷歌 DeepMind 人工智能实验室的联合创始人 Shane Legg 在近日的一次采访中表示,他仍然认为,到 2028 年,研究人员有 50% 的可能实现人类水平的人工智能...
-
图模型也要大?清华朱文武团队有这样一些观点
在大模型时代,图机器学习面临什么样的机遇和挑战?是否存在,并该如何发展图的大模型?针对这一问题,清华大学朱文武教授团队首次提出图大模型(Large Graph Model)概念,系统总结并梳理了图大模型相关的概念、挑战和应用;进一步围绕动态性和可解释性,...
-
吴恩达加入图灵三巨头混战,炮轰Sam Altman:AI监管「不会管不如不管」,LeCun转赞
就在前几天,Benjio等一批大佬针对人工智能可能危及人类命运的议题,又一次公开签署了一封联名信。 Hinton,Benjio在信中继续呼吁加强对于AI技术发展的监管。 然而,以LeCun为首的「LLM成不了气候」派公开表态,AI监管弊大于利! 他们认...
-
情境化如何释放生成式人工智能潜力
随着生成式人工智能(GenAI 以闪电般的速度发展,情境化对于想要利用其真正价值的企业至关重要。 眨眼间,生成式人工智能已经从科幻小说转变为现实,让企业竞相跟上其快速发展并辨别其实际应用。据最近的一项调查显示,70%的组织正在探索利用这项技术力量的方法...
-
AI如何影响数字化转型
数字化转型是十多年来业务转型的核心,随着AI的崛起,数字化转型本身也在发生改变。AI正在极大地改变数字化转型,从企业设定的目标到从业者用来推进倡议的工具。 产生影响的因素包括传统的AI技术,如ML,以及快速增长的GenAI领域,后一种技术正迅速在企业I...
-
Meta AI研究负责人倡导开源许可制度变革
Meta公司最近发布的大型语言模型Llama2备受争议,因其并未完全满足开源倡议的要求。尽管Llama2相对较为开放和免费,但在开源软件领域,一些人仍对该公司的开放性持有异议。 具体来说,Meta公司的许可协议使Llama2对许多人免费,但它仍然是有限的,...
-
安全公司:超六成白帽对生成式 AI 感兴趣,寻找漏洞的最大动机是为了赚钱
10 月 30 日消息,安全公司兼漏洞悬赏平台 HackerOne 上周公布了 2023 年的黑客安全报告(Hacker-Powered Security Report),发现有 61% 的白客正在利用生成式 AI 来开发各种黑客工具,以用来发现更...
-
图灵奖得主吵起来了,LeCun:Bengio、Hinton等的AI灭绝论是荒谬的
关于 AI 风险的问题,各路大佬们也是意见不统一。有人带头签署联名信,呼吁 AI 实验室应立即暂停研究,深度学习三巨头 Geoffrey Hinton、Yoshua Bengio 等都支持这一观点。 就在近几日,Bengio、Hinton 等再发联名信《...
-
MLCommons宣布成立人工智能安全工作组
人工智能基准组织MLCommons宣布成立人工智能安全(AIS:AI Safety)工作组。AIS将开发一个平台和来自许多贡献者的测试库,以支持不同用例的人工智能安全基准。 人工智能系统为社会提供了巨大利益的潜力,但它们并非没有风险,如有害性、错误信息...
-
多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟
视觉幻觉是常见于多模态大语言模型(Multimodal Large Language Models, MLLMs)的一个典型问题。 简单来说就是:模型输出的描述与图片内容不相符。 下图中体现了两种幻觉,红色部分错误地描述了狗的颜色(属性幻觉),蓝色部分描...
-
为何GPT-4P容易受到多模态提示注入图像攻击?
OpenAI新的GPT-4V版本支持图像上传后,带来了一条全新的攻击途径,使大型语言模型(LLM)容易受到多模态注入图像攻击。攻击者可以在图像中嵌入命令、恶意脚本和代码,随后模型会遵从行事。 多模态提示注入图像攻击可以泄露数据、重定向查询、生成错误信息,...
-
如何应对人工智能幻觉?
人工智能现在可以对看似怪异的人类问题做出回应。但有时,人工智能会给出答案。这些虚构的反应是真实的幻觉,还是别的什么? 要点: 研究发现,93%的受访者认为,人工智能幻觉可能会以某种方式导致实际伤害。 虽然ChatGPT可能是一种快捷工作方式,但更多人与...