-
大模型落地最后一公里:111页全面综述大模型评测
当前,大模型正凭借其强大的能力和无限的潜力引领着新一轮技术革命,众多科技巨头纷纷围绕大模型进行布局,进一步推动大模型不断向前发展。然而,尽管大模型能够协助我们完成各种任务,改变我们的生产和生活的方式,提高生产力,为我们带来便利,但大模型的发展也伴随着诸多...
-
AI能理解自己生成的东西吗? 在GPT-4、Midjourney上实验后,有人破案了
从 ChatGPT 到 GPT4,从 DALL・E 2/3 到 Midjourney,生成式 AI 引发了前所未有的全球关注。强大的潜力让人们对 AI 产生了许多期待,但是强大的智能也会引发人们的恐惧和担忧。近期大牛们针对该问题还上演了一场激烈的论战。先...
-
CMU清华MIT引爆全球首个Agent无限流,机器人「007」加班自学停不下来!具身智能被革命
全球首个生成式机器人Agent发布了! 长久以来,相比于语言或者视觉模型可以在大规模的互联网数据上训练,训练机器人的策略模型需要带有动态物理交互信息的数据,而这些数据的匮乏一直是具身智能发展的最大瓶颈。 最近,来自CMU、清华、MIT,UMass等机构的...
-
字节“开盒”OpenAI所有大模型,揭秘GPT-3到GPT-4进化路径!把李沐都炸出来了
GPT-3究竟是如何进化到GPT-4的? 字节给OpenAI所有大模型来了个“开盒”操作。 结果还真摸清了GPT-4进化路上一些关键技术的具体作用和影响。 比如: SFT是早期GPT进化的推动者 帮助GPT提升编码能力的最大功臣是SFT和RLHF 在...
-
AI生图太诡异?马里兰&NYU合力解剖神经网络,CLIP模型神经元形似骷髅头
AI黑盒如何才能解? 神经网络模型在训练的时,会有些ReLU节点「死亡」,也就是永远输出0,不再有用。 它们往往会被被删除或者忽略。 恰好赶上了模糊了生与死的界限的节日——万圣节,所以这是探索那些「死节点」的好时机。 对于大多数图像生成模型来说,会输出正...
-
科普神文,一次性讲透AI大模型的核心概念
图片 令牌,向量,嵌入,注意力,这些AI大模型名词是否一直让你感觉熟悉又陌生,如果答案肯定的话,那么朋友,今天这篇科普神文不容错过。我将结合大量示例及可视化的图形手段,为你由浅入深一次性讲透AI大模型的核心概念。 引言 随着科技公司及国际竞争的不断推进,...
-
蚂蚁集团发布DevOps领域大模型评测基准DevOps-Eval
蚂蚁集团联合北京大学发布了面向 DevOps 领域的大语言模型评测基准 ——DevOps-Eval。 该评测基准包含了计划、编码、构建、测试、发布、部署、运维和监控等8个类别的选择题,共计4850道题目。 此外,还针对 AIOps 任务做了细分,并添加了日...
-
使用Ray创建高效的深度学习数据管道
用于训练深度学习模型的GPU功能强大但价格昂贵。为了有效利用GPU,开发者需要一个高效的数据管道,以便在GPU准备好计算下一个训练步骤时尽快将数据传输到GPU。使用Ray可以大大提高数据管道的效率。 1、训练数据管道的结构 首先考虑下面的模型训练伪代码。...
-
机器学习 | PyTorch简明教程上篇
前面几篇文章介绍了特征归一化和张量,接下来开始写两篇PyTorch简明教程,主要介绍PyTorch简单实践。 1、四则运算 import torch a = torch.tensor([2, 3, 4] b = torch.tensor([3, 4,...
-
Jina AI 推出“jina-embeddings-v2”:全球首个8k 开源文本嵌入模型
Jina AI 公布了其第二代文本嵌入模型的最新进展:jina-embeddings-v2。这个最先进的模型是唯一支持8K(8192个token)上下文长度的开源解决方案。这一成就使其在功能和在大规模文本嵌入基准 (MTEB 排行榜上的性能方面与 Ope...
-
Nuscenes最新SOTA | DynamicBEV超越PETRv2/BEVDepth!
1. 论文信息 2. 引言 这篇论文介绍了一种新的3D object detection方法,这对于自动驾驶、机器人技术和监控等应用至关重要。传统的3D object detection方法使用鸟瞰视角(BEV)方法,将3D场景简化为2D表示。然而,常...
-
阿里云发布通义星尘、通义灵码等产品 推出大模型应用开发平台阿里云百炼
在昨日的2023云栖大会上,阿里云发布了多个重要的产品和技术。 首先是通义大模型家族的更新。阿里云发布了千亿级参数规模的大模型通义千问2.0,综合性能超过了 GPT-3.5,正在追赶 GPT-4。此外,通义千问 APP 也在各大手机应用市场上线,用户可以直...
-
你应该知道的十种机器学习算法
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 毫无疑问,机器学习/人工智能领域在将来是越来越...
-
姚班斯隆奖马腾宇正式宣布大模型创业
清华姚班校友兼斯坦福大学助理教授马腾宇宣布了一个引人注目的创业项目,名为Voyage,旨在提供卓越的嵌入模型。这个嵌入模型在MTEB数据集上表现超越OpenAI,成为SOTA。该项目的成功也得益于三位知名教授,包括斯坦福人工智能实验室主任Christoph...
-
AI如何影响医疗保健行业的信息安全格局
在访谈中,Moss Adams的董事总经理Troy Hawes讨论了由AI支持的网络攻击如何影响医疗保健组织,AI支持的预测分析在抵御网络威胁方面可以发挥的关键作用,以及医疗保健组织如何保护其员工和患者免受网络攻击。 AI如何了改变医疗保健领域的网络...
-
全球最强长文本大模型,一次可读35万汉字:Baichuan2-192K上线
国内大模型创业公司,正在技术前沿创造新的记录。 10 月 30 日,百川智能正式发布 Baichuan2-192K 长窗口大模型,将大语言模型(LLM)上下文窗口的长度一举提升到了 192K token。 这相当于让大模型一次处理约 35 万个汉字,长度...
-
DeepMind曝新一代AlphaFold,预测准确率暴涨近10%!DNA和RNA的AlphaFold时刻来了
就在今天,DeepMind公布了AlphaFold最新进展——「AlphaFold-latest」。 根据DeepMind最新发布的技术报告,新一代的AlphaFold不仅仅能够以更高的准确性处理和预测蛋白质的结构。 ,时长01:32 它还能将相似的能力...
-
数据中心的未来:利用人工智能的优势促进经济增长和创新
当流行科幻小说描述“机器智能的崛起”时,它通常伴随着激光、爆炸,或者在一些温和的例子中,伴随着轻微的哲学恐惧。 但毫无疑问,人们对人工智能 (AI 和机器学习 (ML 在现实生活中应用的可能性的兴趣正在与日俱增,而且新的应用程序每天都在涌现。 全...
-
英伟达发布430亿参数大模型ChipNeMo
英伟达最新发布的430亿参数大语言模型ChipNeMo专注于辅助芯片设计,旨在提高工程师的工作效率。这一大语言模型的应用范围广泛,包括问答、EDA脚本生成和Bug总结等任务,使芯片设计变得更加便捷。 英伟达首席科学家Bill Dally强调,即使提高生产率...
-
独家 | GPT-4、Midjourney之外,谭平创业团队要造一个3D基础模型
前段时间,OpenAI 发布了文生图模型 DALL・E3,生成效果非常惊艳。比如,你可以让它一次画出几十个物体,然后再要求它把这些物体全部放到一个冲浪者的背上: 可以看到,DALL・E3不仅画出了足量的物体,就连冲浪者面对重压时的神情都刻画了出来。 但细心...
-
GPT-4V连小学生都不如?最新基准测试错误率竟高达90%:红绿灯认错、勾股定理也不会
GPT-4被吹的神乎其神,作为具备视觉能力的GPT-4版本——GPT-4V,也被大众寄于了厚望。 但如果告诉你,初中生都知道的勾股定理,只适用于直角三角形。 然而GPT-4V却自信将其用于钝角三角形中计算斜边长度。还有更离谱的,GPT-4V直接犯了致命的...
-
GPT-4、Midjourney之外,谭平创业团队要造一个3D基础模型
前段时间,OpenAI 发布了文生图模型 DALL・E 3,生成效果非常惊艳。比如,你可以让它一次画出几十个物体,然后再要求它把这些物体全部放到一个冲浪者的背上: 可以看到,DALL・E 3 不仅画出了足量的物体,就连冲浪者面对重压时的神情都刻画了...
-
图模型也要大?清华朱文武团队有这样一些观点
在大模型时代,图机器学习面临什么样的机遇和挑战?是否存在,并该如何发展图的大模型?针对这一问题,清华大学朱文武教授团队首次提出图大模型(Large Graph Model)概念,系统总结并梳理了图大模型相关的概念、挑战和应用;进一步围绕动态性和可解释性,...
-
情境化如何释放生成式人工智能潜力
随着生成式人工智能(GenAI 以闪电般的速度发展,情境化对于想要利用其真正价值的企业至关重要。 眨眼间,生成式人工智能已经从科幻小说转变为现实,让企业竞相跟上其快速发展并辨别其实际应用。据最近的一项调查显示,70%的组织正在探索利用这项技术力量的方法...
-
【深度学习】生成对抗网络(GANs)详解!
一、概述 生成对抗网络(Generative Adversarial Networks 是一种无监督深度学习模型,用来通过计算机生成数据,由Ian J. Goodfellow等人于2014年提出。模型通过框架中(至少 两个模块:生成模型(Generat...
-
Meta AI研究负责人倡导开源许可制度变革
Meta公司最近发布的大型语言模型Llama2备受争议,因其并未完全满足开源倡议的要求。尽管Llama2相对较为开放和免费,但在开源软件领域,一些人仍对该公司的开放性持有异议。 具体来说,Meta公司的许可协议使Llama2对许多人免费,但它仍然是有限的,...
-
从单机到多机的无人机与机器人集群的SLAM综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 前言 在本系列,我将会更新我的博士毕业论文“Decentralized and Distributed Collaborative Simultaneous Localization and Mapp...
-
ChatGPT、Llama-2等大模型,能推算出你的隐私数据!
ChatGPT等大语言模型的推理能力有多强大?通过你发过的帖子或部分隐私数据,就能推算出你的住址、年龄、性别、职业、收入等隐私数据。 瑞士联邦理工学院通过搜集并手工标注了包含520个Reddit(知名论坛)用户的个人资料真实数据集PersonalReddi...
-
苹果文生图大模型亮相:俄罗斯套娃式扩散,支持1024x1024分辨率
在生成式 AI 时代,扩散模型已经成为图像、视频、3D、音频和文本生成等生成式 AI 应用的流行工具。然而将扩散模型拓展到高分辨率领域仍然面临巨大挑战,这是因为模型必须在每个步骤重新编码所有的高分辨率输入。解决这些挑战需要使用带有注意力块的深层架构,这使...
-
像搭乐高一样做数学定理证明题,GPT-3.5证明成功率达新SOTA
背景 作为长链条严格推理的典范,数学推理被认为是衡量语言模型推理能力的重要基准,GSM8K 和 MATH 等数学文字问题(math word problem)数据集被广泛应用于语言模型的测评和比较中。事实上,数学作为一项科学研究并不仅仅包括计算具体实例,...
-
OpenAI API进阶-Function Calling实现插件!
Function Calling介绍 Function Calling是什么 OpenAI Chat API官方文档:Chat API[1] Function Calling官方介绍:Function Calling[2] 图片 开发者现在可以向 gp...
-
MLCommons宣布成立人工智能安全工作组
人工智能基准组织MLCommons宣布成立人工智能安全(AIS:AI Safety)工作组。AIS将开发一个平台和来自许多贡献者的测试库,以支持不同用例的人工智能安全基准。 人工智能系统为社会提供了巨大利益的潜力,但它们并非没有风险,如有害性、错误信息...
-
AI视野:百川发布Baichuan2-192K大模型;DALL·E3新增种子功能;ChatGPT Plus会员可上传和分析文件;谷歌Bard支持实时生成回复
????大模型动态 百川智能发布Baichuan2-192K大模型,可处理35万汉字 百川智能发布了Baichuan2-192K大模型,拥有全球最长的上下文窗口,处理约35万个汉字,超越了Claude2。 百川大模型官网:https://top.aibas...
-
北大团队:诱导大模型“幻觉”只需一串乱码!大小羊驼全中招
北大团队最新研究发现: 随机token都能诱发大模型出现幻觉! 比如喂给大模型(Vicuna-7B)一段“乱码”,它就莫名其妙弄错了历史常识。 或者是简单修改提示词,大模型也会掉入陷阱。 Baichuan2-7B、InternLM-7B、ChatGL...
-
为何GPT-4P容易受到多模态提示注入图像攻击?
OpenAI新的GPT-4V版本支持图像上传后,带来了一条全新的攻击途径,使大型语言模型(LLM)容易受到多模态注入图像攻击。攻击者可以在图像中嵌入命令、恶意脚本和代码,随后模型会遵从行事。 多模态提示注入图像攻击可以泄露数据、重定向查询、生成错误信息,...
-
如何应对人工智能幻觉?
人工智能现在可以对看似怪异的人类问题做出回应。但有时,人工智能会给出答案。这些虚构的反应是真实的幻觉,还是别的什么? 要点: 研究发现,93%的受访者认为,人工智能幻觉可能会以某种方式导致实际伤害。 虽然ChatGPT可能是一种快捷工作方式,但更多人与...
-
海洋工程中的生成式AI:专有数据集不足正限制其实际应用
现代计算正显著改进造船与海洋工程的设计与建造流程,但相当数据集的捉襟见肘正在阻碍其进一步融合。 造船与海洋工程(NAME)这一学科名称可能只有几百年的历史,但其起源却可以追溯至几千年之前的古代文明,当时人类就已经在建造船只来探索世界、开展商业活动。包括...
-
世界模型和DriveGPT这类大模型到底能给自动驾驶带来什么?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 大模型今年爆火,很多领域上的应用如雨后春笋般涌现,很多优秀的工作出现,主要集中在数据生成和场景分析表述两部分,重点解决自动驾驶的长尾分布问题和场景识别。今天自动驾驶之心带大家梳理下自动驾驶行业上的大模...
-
智谱的“GPT-4V”来了,CEO张鹏说他们就是奔着AGI去的
时隔仅仅四个月,智谱大模型再度升级。在沈阳举办的2023中国计算机大会CNCC2023上,智谱介绍了新一代ChatGLM3大模型。 根据智谱官方的表述,尽管新的大模型名字中带有Chat,但实际上这是一个全新版本的基座模型,它的完全版和上一代一样拥有1300...
-
比Transformer更好,无Attention、MLPs的BERT、GPT反而更强了
从 BERT、GPT 和 Flan-T5 等语言模型到 SAM 和 Stable Diffusion 等图像模型,Transformer 正以锐不可当之势席卷这个世界,但人们也不禁会问:Transformer 是唯一选择吗? 斯坦福大学和纽约州立大学布法...
-
更高清写实的人体生成模型HyperHuman来了,基于隐式结构扩散,刷新多项SOTA
论文地址: https://arxiv.org/pdf/2310.08579.pdf Github 地址: https://github.com/snap-research/HyperHuman 1. 研究背景与动机 随着扩散模型的兴起,一些典型...
-
Agent 应用于提示工程
如果Agent模仿了人类在现实世界中的操作方式,那么,能否应用于提示工程即Prompt Engingeering 呢? 从LLM到Prompt Engineering 大型语言模型(LLM 是一种基于Transformer的模型,已经在一个巨大的语料库或...
-
AI智能超越人类终解开!李飞飞高徒新作破圈,5万个合成数据碾压人类示例,备咖啡动作超丝滑
AI巨佬Geoffrey Hinton称,「科技公司们正在未来18个月内,要使用比现在GPT-4多100倍的算力训练新模型」。 更大参数的模型,对算力需求巨大的同时,对数据也提出了更高的要求。 但是,更多的高质量数据该从何来? 英伟达高级科学家Jim F...
-
首个人体动捕基模型面世!SMPLer-X:横扫七大榜单
人体全身姿态与体型估计(EHPS, Expressive Human Pose and Shape estimation)虽然目前已经取得了非常大研究进展,但当下最先进的方法仍然受限于有限的训练数据集。 最近,来自南洋理工大学S-Lab、商汤科技、上海人...
-
最好7B模型再易主!打败700亿LLaMA2,苹果电脑就能跑
花500刀“调教”的70亿参数模型,打败700亿参数的Llama 2! 且笔记本就能轻松跑,效果媲美ChatGPT。 重点:免费、不要钱。 HuggingFace H4团队打造的开源模型Zephyr-7B,鲨疯了。 其底层模型是前段时间爆火、由有着“欧...
-
对比GPU,使用FPGA创建神经网络
当代的CPU按照一维方式进行计算,顺序执行指令,并将算法分解为逐条加载和执行的指令。然而,未来的计算发展趋势表明,我们将越来越多地依赖硬件加速器来支持并行执行,这将成为计算的常态。这种发展趋势将统一算法和硬件结构的利用,从而实现更快、更高效的解决方案。...
-
多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生
还在用指令微调解决多模态大模型的“幻觉”问题吗? 比如下图中模型将橙色柯基错认为“红狗”,还指出周围还有几条。 图片 现在,中科大的一项研究想到了一个全新办法: 一个免重训、即插即用的通用架构,直接从模型给出的错误文本下手,“倒推”出可能出现“幻觉”之处...
-
正面硬刚OpenAI!智谱AI推出第三代基座模型,功能对标GPT-4V,代码解释器随便玩
国产大模型估值最高创企,为何是智谱AI? 仅用4个月时间,这家公司就甩出最新成绩证明了自己—— 自研大模型ChatGLM3,不止是底层架构,就连模型功能都进行了全方位大升级。 性能上,最直观的表现就是“疯狂屠榜”,所有50个大模型公开性能测评数据集中,拿下...
-
小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大
大型语言模型 (LLMs 在各种自然语言任务中展现出了卓越的性能,但是由于训练和推理大参数量模型需要大量的计算资源,导致高昂的成本,将大语言模型应用在专业领域中仍存在诸多现实问题。因此,北理团队先从轻量级别模型入手,最大程度发挥数据和模型的优势,立足更...
-
生成的分子几乎 100% 有效,用于逆向分子设计的引导扩散模型
「从头分子设计」是材料科学的「圣杯」。生成深度学习的引入极大地推进了这一方向,但分子发现仍然具有挑战性,而且往往效率低下。 以色列理工学院(Technion-Israel Institute of Technology)和意大利威尼斯大学(Univers...