-
通过学习曲线识别过拟合和欠拟合
本文将介绍如何通过学习曲线来有效识别机器学习模型中的过拟合和欠拟合。 欠拟合和过拟合 1、过拟合 如果一个模型对数据进行了过度训练,以至于它从中学习了噪声,那么这个模型就被称为过拟合。过拟合模型非常完美地学习了每一个例子,所以它会错误地分类一个看不见的...
-
超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题
哭死啊,全球狂炼大模型,一互联网的数据不够用,根本不够用。 训练模型搞得跟《饥饿游戏》似的,全球AI研究者,都在苦恼怎么才能喂饱这群数据大胃王。 尤其在多模态任务中,这一问题尤为突出。 一筹莫展之际,来自人大系的初创团队,用自家的新模型,率先在国内把“模...
-
OpenAI 对手xAI即将融资60亿美元 估值180亿美元
据techcrunch报道,一位了解该交易的可信消息人士透露,xAI 是埃隆·马斯克 (Elon Musk) 成立10个月以来人工智能巨头 OpenAI 的竞争对手,即将完成融资60亿美元,投前估值为180亿美元。除非交易条款发生变化,否则这笔交易将让投资...
-
一文解决任何机器学习问题!
前言 数据挖掘大神Abhishek Thakur,很多数据挖掘kaggler对他都非常熟悉,他在 Linkedin 发表了一篇名为Approaching (Almost Any Machine Learning Problem(几乎解决任何机器学习...
-
如何在工业自动化中有效应用生成式AI?
围绕 ChatGPT、Bard、Bing Chat 和其他生成式人工智能(AI)工具的炒作正在增加。AI工具推广者的承诺是,未经培训的用户可以使用这些工具来创建书面内容、计算机代码甚至法律文件。工业生成式AI战略应该包括具有自动化或应用专业知识(或两者兼...
-
一次性讲明白,如何搞定一个可以支持多芯混合训练的 AI 集群
由于外部环境的变化,适用于大模型训练任务的 GPU 整体规模无法继续增长。这些存量 GPU 组成的集群,仍然是当前加速大模型训练的主要 AI 算力来源。同时,各类国产 AI 芯片开始大规模投入实际生产任务。在未来一段时间内,数据中心的 AI 算力将保持多...
-
模糊图像重建重大进展!DeblurGS:相机位姿不准也能极致渲染!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 尽管在从运动模糊图像中重建清晰的3D场景方面取得了重大进展,但向现实世界应用的过渡仍然具有挑战性。主要障碍源于严重的模糊,这导致通过“Structure-from-M...
-
OpenAI Preparedness团队首席Aleksander Madry:机器学习模型的内部计算如何将输入转化为预测?
考虑一个标准的ResNet50模型,该模型经过训练用于图像分类任务。我们是否能够理解这个模型中的卷积滤波器如何将输入图像转换为其预测的标签?或者,GPT-3中的注意力头如何contribute到下一个标记的预测?理解这些模型组件——包括滤波器或头等架构...
-
LLM 安全 | 大语言模型应用安全入门
一、背景 2023年以来,LLM 变成了相当炙手可热的话题,以 ChatGPT 为代表的 LLM 的出现,让人们看到了无限的可能性。ChatGPT能写作,能翻译,能创作诗歌和故事,甚至能一定程度上做一些高度专业化的工作,比如法律服务和医疗诊断咨询。...
-
股价飙升!商汤大模型挑战GPT4
4月24日,商汤集团在港交所暂停交易前股价上涨31.15%。商汤集团表示,其大模型日日新5.0发布会受到市场极大关注,公司将进一步刊发相关公告。在“2024年商汤技术交流日”上,商汤发布了其最新的大模型——SenseNova5.0,旨在追赶GPT-4,这反...
-
苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相
要说 ChatGPT 拉开了大模型竞赛的序幕,那么 Meta 开源 Llama 系列模型则掀起了开源领域的热潮。在这当中,苹果似乎掀起的水花不是很大。 不过,苹果最新放出的论文,我们看到其在开源领域做出的贡献。 近日,苹果发布了 OpenELM,共四种变...
-
微软3.8B模型媲美GPT-3.5!小到用iPhone就能跑起来,网友:Good data is all you need!
撰文、整理 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 这周,“小模型”之战打得可谓精彩非凡,让人目不暇接。前脚,小扎刚在采访中自豪地宣布Llama3 80亿模型几乎与此前Llama2 700亿模型的性能差不多...
-
防止AI系统受到提示注入攻击的五个方法
译者 | 布加迪 审校 | 重楼 提示注入攻击是一种网络安全威胁,专门针对基于人工智能(AI)的系统,包括聊天机器人、虚拟助理及其他基于AI的界面。当攻击者以某种方式操纵AI模型的输入,导致模型执行意外操作或泄露敏感信息时,就会发生这类攻击。这种操纵可以...
-
微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了
Llama 3发布刚几天,微软就出手截胡了? 刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。 其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B。 为了方便开源社区使用,还特意设计成了与Llama系列兼容的结...
-
发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试
上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。 却没想到发布几小时之后,立马被删除了。 有网友突然发现,WizardLM的模型权重、公告帖子全部被删除,并且不再微软集合中,除了提到站点之外,却找不到任何证据证明这个微软的官方项目。...
-
微软发布iPhone可运行的ChatGPT级AI模型Phi-3系列 挑战OpenAI地位
近日,微软推出了一款名为Phi-3系列的小型AI模型,该模型在AI领域引起了广泛关注。Phi-3系列中的Phi-3-mini模型,仅拥有3.8B参数,却在多项基准测试中超越了拥有8B参数的Llama3模型。 微软特别强调,经过4bit量化处理的Phi-3-...
-
一文了解大语言模型(LLM)
人工智能的发展给我们的生活带来很多不一样的体验。面部识别可以解锁设备,激光雷达可以实现自动驾驶。当2023年,OpenApi的chatGPT可以“理解”人类的语言并与我们进行沟通时,大语言模型的概念出现在我们面前。 在自然语言处理领域的大语言模型(La...
-
ChatGPT能预测未来特定事件,准确率高达97%
贝勒大学经济学院的Pham Hoang Van和Scott Cunningham两位教授,基于OpenAI的GPT-3.5、GPT-4深度研究了大模型对事情的预测能力。 研究人员使用了直接预测和未来叙述(Future Narrative)两种提示方法,进行...
-
牛津大学最新!Mickey:3D中的2D图像匹配SOTA!(CVPR'24)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 项目链接:https://nianticlabs.github.io/mickey/ 给定两张图像,可以通过建立图像间的对应关系来估计它们之间的相机相对姿态。通常,这些对应关系是二维到二维的...
-
集体智慧:LLM预测能力与人群可相互媲美
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 现在,AI系统的预测准确率达到甚至超过了人群。 在不断发展的人工智能(AI)领域,语言模型已取得了重大进展,实现了曾经被认为人类认知...
-
预测性人工智能将如何帮助实现净零排放
预测性人工智能是生成式人工智能 (AI 的表亲,其使用历史数据中的模式来预测未来结果或对未来事件进行分类,有专家表示,该技术可用于提供可操作的见解并辅助决策和战略制定。 在过去一年左右的时间里,我们看到能源行业出现了许多新的、令人兴奋的预测性人工智...
-
小即是大?HuggingFace CEO预测小模型元年将至,将成为AI的下一个“大事件”
编译 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 在人工智能领域的竞争中,科技巨头们一直在竞相构建越来越大的语言模型。Scaling Law 信仰随着模型规模的增加,其性能会指数提升,展现出更好的泛化能力,甚至在某些情况下展现出“...
-
微软紧急撤回最先进的AI大模型:居然忘了测试了
快科技4月21日消息,Meta发布超级彪悍的大语言模型Llama 3之后,微软也很快推出了自己的新一代WizardLM2 8x22B,号称迄今最强大,完全超越Claude 3 OpusSonnet、GPT-4等竞品,而且开源,但是马上又把它撤回去了。 没有...
-
微软推出新型AI工具VASA-1:可将照片转化为视频
快科技4月21日消息,据媒体报道,微软亚洲研究院近期推出了一款革命性的人工智能工具VASA-1,这一工具的推出引起了业界和公众的广泛关注。 VASA-1的独特之处在于,它能够将静态图像或绘画与音频文件结合,生成具有动态面部表情和头部动作的面孔。这意味着,仅...
-
引人注意的十大由AI造成的灾难案例
2017年,《经济学人》宣称数据已取代石油成为世界上最有价值的资源,这一说法自此一直被重复。跨越各个行业的企业一直在投资数据和分析,并将持续大举投资,但就像石油一样,数据和分析也有其阴暗面。 根据《CIO》杂志2023年的《CIO状态报告》,26%的I...
-
Llama3突然来袭!开源社区再次沸腾:GPT4级模型自由访问时代到来
Llama 3来了! 就在刚刚,Meta官网上新,官宣了Llama 3 80亿和700亿参数版本。 并且推出即为开源SOTA: Meta官方数据显示,Llama 3 8B和70B版本在各自参数规模上超越一众对手。 8B模型在MMLU、GPQA、Huma...
-
六种方式快速体验最新发布的 Llama 3!
昨晚, Meta 发布了 Llama 3 8B 和 70B 模型,Llama 3 指令调整模型针对对话/聊天用例进行了微调和优化,在常见基准测试中优于许多现有的开源聊天模型。比如,Gemma 7B 和 Mistral 7B。 Llama 3 模型将...
-
全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用
LLM界的「真·Open AI」,又来整顿AI圈了! 业内惊呼:首个开源GPT-4级的模型,终于来了!开源模型追上闭源模型的历史性一刻,或许就在眼前了? 一石激起千层浪,Llama3才刚刚发布没几小时,就破纪录地登顶了Hugging Face排行榜。 这...
-
Meta 发布Llama 3,能力直逼GPT-4,一己之力拉高开源大模型水位
编辑|伊风、诺亚 出品 | 51CTO技术栈(微信号:blog51cto) Meta麾下“羊驼”一路狂奔在开源的大道上。 在过去的一年里,Llama系列可以说开辟了开源LLM的半壁江山。 嫌弃开源模型能力只有GPT-3.5,不够用? 如今Llam...
-
开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4
扎克伯格:「有了 Llama3,全世界就能拥有最智能的 AI。」 ChatGPT 拉开了大模型竞赛的序幕,Meta 似乎要后来居上了。 本周四,AI 领域迎来重大消息,Meta 正式发布了人们等待已久的开源大模型 Llama3。 扎克伯格在 Faceboo...
-
通透!机器学习各大模型原理的深度剖析!
通俗来说,机器学习模型就是一种数学函数,它能够将输入数据映射到预测输出。更具体地说,机器学习模型就是一种通过学习训练数据,来调整模型参数,以最小化预测输出与真实标签之间的误差的数学函数。 机器学习中的模型有很多种,例如逻辑回归模型、决策树模型、支持向量...
-
基于因果推断的推荐系统:回顾和前瞻
本次分享的主题为基于因果推断的推荐系统,回顾过去的相关工作,并提出本方向的未来展望。 为什么在推荐系统中需要使用因果推断技术?现有的研究工作用因果推断来解决三类问题(参见 Gao et al.的 TOIS 2023 论文 Causal Inference...
-
“梗王”大模型,靠讲笑话登上CVPR | 中山大学
谁能想到,只是让大模型讲笑话,论文竟入选了顶会CVPR! 没开玩笑,这还真真儿的是一项正儿八经的研究。 例如看下面这张图,如果让你根据它来讲个笑话或梗,你会想到什么? 现在的大模型看完后会说: 脑子短路。 再看一眼 蜘蛛侠 的海报,大模型会配一句“刚擦的...
-
效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 标注之殇 静态物体检测(Static object detection,SOD),包括交通信号灯、导向牌和交通锥,大多数算法是数据驱动深度神经网络,需要大量的训练数据。现在的做法通常是对大量的训练样本...
-
史上首次,AI超越人类奥赛金牌得主!吴方法加持,30题做出27道破纪录
首位超越国际奥林匹克竞赛金牌得主的AI,刚刚诞生了! 印度理工学院海得拉巴分校、图宾根AI中心、剑桥大学的研究者发现—— 通过「吴方法」,可以让AI变成和人类数学奥赛银牌得主同样的水平,而「AI数学大师」AlphaGeometry,则直接超越了IMO金牌...
-
十个大型语言模型(LLM)常见面试问题和答案解析
今天我们来总结以下大型语言模型面试中常问的问题 一、哪种技术有助于减轻基于提示的学习中的偏见? A.微调 Fine-tuning B.数据增强 Data augmentation C.提示校准 Prompt calibration D.梯度裁剪 Gra...
-
文生图——stable diffusion生成有趣的动漫图像
Stable Diffusion是一个文本转图像的模型,由CompVis、Stability AI和LAION共同开发。它能够从一段简单的文本输入中快速生成相应的图像。此外,它还可以导入图像并配合文本对其进行处理。从技术角度来看,Stable Diffus...
-
生成式AI大模型之提示词工程实践
提示工程是一个新兴的领域,专注于开发、设计和优化提示,以增强 LLM 的输出,从而满足您的需求。它为您提供了一种引导模型的行为从而达到您想要实现的结果的方法。 提示工程与微调不同。在微调中,使用训练数据调整权重或参数,目标是优化成本函数。就计算时间和实...
-
Llama架构比不上GPT2?神奇token提升10倍记忆?
一个 7B 规模的语言模型 LLM 能存储多少人类知识?如何量化这一数值?训练时间、模型架构的不同将如何影响这一数值?浮点数压缩 quantization、混合专家模型 MoE、以及数据质量的差异 (百科知识 vs 网络垃圾 又将对 LLM 的知识容量...
-
美国新法案要AI公司透露用于训练AI模型受版权保护的作品
美国国会于周二提出了一项法案,旨在强制人工智能公司透露他们用于训练生成 AI 模型的受版权保护的材料。这项立法进一步加入了立法者、新闻机构和艺术家为了确定 AI 公司如何使用诸如歌曲、视觉艺术、书籍和电影等创作作品来训练他们的软件,并且这些公司是否违法侵犯...
-
【总结】在嵌入式设备上可以离线运行的LLM--Llama
文章目录 Llama 简介 运用 另一种:MLC-LLM 一个令人沮丧的结论在资源受限的嵌入式设备上无法运行LLM(大语言模型)。 一丝曙光:tinyLlama-1.1b(10.1亿参数,需要至少2.98GB的RAM) Llam...
-
破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」
【新智元导读】大语言模型的「逆转诅咒」,被解开了。近日,来自Meta FAIR的研究人员推出了反向训练大法,让模型从反方向上学到了事实之间的逻辑,终于改进了这个困扰人们已久的问题。 大语言模型的「逆转诅咒」,被解开了! 这个诅咒在去年9月首次被发现,一时间...
-
120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B
继16亿轻量级Stable LM 2推出之后,12B参数的版本在今天亮相了。 见状,不少网友纷纷喊话:干的漂亮!但,Stable Diffusion 3啥时候出啊? 总得来说,Stable LM 2 12B参数更多,性能更强。 120亿参数版本包含了...
-
一文了解人工智能如何让机器进行学习?
在《一文了解人工智能(AI)》文章中我们介绍了AI可以解决哪些复杂的问题。这些问题无法通过固定的规则进行解决,需要机器根据以往的事例进行比较评估,作出最终的判断。机器需要模仿人类对事物进行学习。 人类的学习过程可以拆分为以下几个阶段:感知、记忆、对比和...
-
RWKV 模型启动工具 RWKV Runner 进阶教程(下)
在 RWKV Runner 教程的上篇(新手教程),我们讲述了如何使用 RWKV Runner 本地部署并运行 RWKV 模型: RWKV模型启动工具RWKV Runner新手教程(上) 而在今天发布的教程下篇,我们将主要介绍 RWKV Runner...
-
破除36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」
大语言模型的「逆转诅咒」,被解开了! 这个诅咒在去年9月首次被发现,一时间引起LeCun、Karpathy、马库斯等一众大佬的惊呼。 因为风光无两、不可一世的大模型竟存在着“阿克琉斯之踵”:一个在「A是B」上训练的语言模型,并不能正确回答出「B是A」。...
-
融汇生成式人工智能,全面提升HPE Aruba Networking Central平台AIOps能力
美国德克萨斯州休斯顿-2024年4月8日-Hewlett Packard Enterprise(NYSE:HPE)日前宣布将在HPE Aruba Networking Central上集成多个生成式AI大语言模型,以拓展其AIOps网络管理能力。HPE...
-
Nightshade:使AI模型在未经许可的情况下无法训练图片
据报道,芝加哥大学的研究人员开发了一种名为Nightshade的工具,旨在防止未经许可的AI图像生成。该工具可以使AI图像生成器无法使用未经许可的图像进行训练,从而保护了艺术家和版权所有者的作品。 Nightshade的工作原理是在图像中添加隐藏信息,这...
-
你在小红书上关注的美女博主,可能是AI
在近年来,虚拟偶像、虚拟主播(VTuber)似乎已经不是什么新鲜事,人们就算没有成为虚拟偶像的粉丝,也一定都曾听说过初音未来的名字。只不过,一提及“初音未来们”,人们脑海里首先出现的标签或许还是“二次元”。但如今,在小红书等社交平台,一大批AI博主正凭借足...
-
标题:探索AI绘画:使用深度学习生成艺术
正文: 随着计算机技术的发展,人工智能在各个领域取得了显著的成果。 通过训练深度学习模型,AI可以学习大量的艺术作品,从而生成具有独特风格和创意的新作品。 本文将介绍如何使用Python和TensorFlow实现一个简单的AI绘画程序。...