-
只需百行代码,让H100提速30%,斯坦福开源全新AI加速框架
AI 的快速发展,伴随而来的是大计算量。这就自然而然的引出了一个问题:如何减少 AI 对计算的需求,并提高现有 AI 计算效率。 为了回答这一问题,来自斯坦福的研究者在博客《GPUs Go Brrr》中给出了答案。 图片 博客地址:https://haz...
-
美国教授用2岁女儿训AI模型登Science!人类幼崽头戴相机训练全新AI
【新智元导读】为训练AI模型,纽约州立大学的一名教授Brenden Lake,竟让自己不到2岁女儿头戴相机收集数据!要知道,Meta训Llama3直接用了15万亿个token,如果Lake真能让AI模型学习人类幼崽,从有限的输入中学习,那LLM的全球数据荒...
-
Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动
Meta FAIR 联合哈佛优化大规模机器学习时产生的数据偏差,提供了新的研究框架。 众所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例,其训练总共需要 1,720,320 GPU hours。由...
-
KAN核心团队震撼力作!MIT华人用AI首次发现物理学全新方程
就在刚刚,MIT物理学家用AI发现了物理学中的新方程。 论文地址:https://arxiv.org/abs/2405.04484 作者表示:这篇论文并没有解决价值数百万美元的核聚变问题,而是在更简单的设置中,引入一个有前途的概念验证。 偏微分方程(P...
-
最详细人脑3D地图登Science!GPT-4参数只相当于人类0.2%
芝麻粒大小的人脑组织,突触规模就相当于一个GPT-4! 谷歌与哈佛联手,对局部人脑进行了纳米级建模,论文已登Science。 这是迄今为止最大、最详细的人脑复制品,首次展示出了大脑中的突触连接网络。 凭借超高分辨率,这个名为H01的重建,已经揭示了一些...
-
划重点!!因果推断两大算法框架解析
一、整体框架 因果推断的主要任务可分为三类。首先是因果结构的发现,即从数据中识别出变量之间的因果关系。其次是因果效应的估计,即从数据中推断一个变量对另一个变量的影响程度。需要注意的是,这种影响并非指相关性,而是指在对一个变量进行干预时,另一个变量的数值...
-
原作者带队,LSTM真杀回来了!
20 世纪 90 年代,长短时记忆(LSTM)方法引入了恒定误差选择轮盘和门控的核心思想。三十多年来,LSTM 经受住了时间的考验,并为众多深度学习的成功案例做出了贡献。然而,以可并行自注意力为核心 Transformer 横空出世之后,LSTM 自身所...
-
网传Ilya Sutskever的推荐清单火了,掌握当前AI 90%
随着生成式 AI 模型掀起新一轮 AI 浪潮,越来越多的行业迎来技术变革。许多行业从业者、基础科学研究者需要快速了解 AI 领域发展现状、掌握必要的基础知识。 如果有一份「机器学习精炼秘笈」,你认为应该涵盖哪些知识? 近日,一份网传 OpenAI 联合创...
-
Deepseek-V2技术报告解读!全网最细!
深度求索Deepseek近日发布了v2版本的模型,沿袭了1月发布的 Deepseek-MoE(混合专家模型)的技术路线,采用大量的小参数专家进行建模,同时在训练和推理上加入了更多的优化。沿袭了一贯的作风,Deepseek对模型(基座和对话对齐版本)进行了...
-
AlphaFold 3一夜预测地球所有生物分子,谷歌DeepMind颠覆生物学登Nature头版!
时隔3年,AlphaFold 3横空出世,再次掀起AI学术圈巨震! 初代AlphaFold诞生之后,一直停留在预测「蛋白质」的宇宙中。 今天,升级后的AlphaFold 3能够以前所未有的「原子精度」,预测出所有生物分子的结构和相互作用。 图片 最重要的...
-
清华首个AI医院小镇来了!AI医生自进化击败人类专家,数天诊完1万名患者
斯坦福AI小镇曾火遍了全网,25个智能体生活交友,堪称现实版的「西部世界」。 而现在,AI「医院小镇」也来了! 最近,来自清华团队的研究人员开发了一个名为「Agent Hospital」的模拟医院。 论文地址:https://arxiv.org/pdf...
-
爆火后反转?「一夜干掉MLP」的KAN:其实我也是MLP
多层感知器(MLP),也被称为全连接前馈神经网络,是当今深度学习模型的基础构建块。MLP 的重要性无论怎样强调都不为过,因为它们是机器学习中用于逼近非线性函数的默认方法。 但是最近,来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 ——KAN。...
-
LeCun转发,AI让失语者重新说话!纽约大学发布全新「神经-语音」解码器
脑机接口(BCI)在科研和应用领域的进展在近期屡屡获得广泛的关注,大家通常都对脑机接口的应用前景有着广泛的畅享。 比如,由于神经系统的缺陷造成的失语症不仅严重阻碍患者的日常生活,还可能限制他们的职业发展和社交活动。随着深度学习和脑机接口技术的迅猛发展,...
-
瑜伽球上遛「狗」!入选英伟达十大项目之一的Eureka有了新突破
机器狗在瑜伽球上稳稳当当的行走,平衡力那是相当的好: 各种场景都能拿捏,不管是平坦的人行道、还是充满挑战的草坪都能 hold 住: 甚至是研究人员踢了一脚瑜伽球,机器狗也不会歪倒: 给气球放气机器狗也能保持平衡: 上述展示都是 1 倍速,没有经过...
-
终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名
当前最火的大模型,竟然三分之二都存在过拟合问题? 刚刚出炉的一项研究,让领域内的许多研究者有点意外。 提高大型语言模型的推理能力是当前研究的最重要方向之一,而在这类任务中,近期发布的很多小模型看起来表现不错,比如微软 Phi-3、Mistral 8x2...
-
小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具
语言,不仅仅是文字的堆砌,更是表情包的狂欢,是梗的海洋,是键盘侠的战场(嗯?哪里不对)。 语言如何塑造我们的社会行为? 我们的社会结构又是如何在不断的言语交流中演变的? 近期,来自复旦大学和小红书的研究者们通过引入一种名为AgentGroupChat的...
-
老黄最新采访出炉!自述61年坚持成就了英伟达,AI革命点燃全世界
全球进入2万亿美元俱乐部的公司,仅有4家——微软、苹果、谷歌,以及英伟达。 在过去一年中,位于加利福尼亚的计算机芯片制造商英伟达,市值从1万亿,飙升到2万亿美元。 这得益于大模型掀起的AI狂潮,急剧放大了全世界对算力的需求。 从Grace架构,到全新的...
-
2024年你可以使用的4款最好用的免费AI音乐工具
什么是AI音乐工具 AI音乐工具通过模拟音乐创作过程,使用人工智能技术自动生成旋律、和声和节奏,服务于音乐制作、视频配乐、游戏音效等应用场景。这些工具简化了音乐创作流程,让非专业人士也能轻松制作出专业级的音乐作品。 2024 年最好用的AI音乐工具比较...
-
探讨自回归模型和扩散模型的发展应用
在当前大模型驱动的内容创新浪潮中,人工智能产业正以前所未有的力度拥抱一场由大模型技术策动的科技革新运动。这场革命不仅重塑了人机交互的边界,使其跃升至更高层次的认知协作,而且正在颠覆传统的计算思维与执行模式,催生出全新的计算范式,从而深刻地渗透并革新各行各...
-
苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相
要说 ChatGPT 拉开了大模型竞赛的序幕,那么 Meta 开源 Llama 系列模型则掀起了开源领域的热潮。在这当中,苹果似乎掀起的水花不是很大。 不过,苹果最新放出的论文,我们看到其在开源领域做出的贡献。 近日,苹果发布了 OpenELM,共四种变...
-
AI信任危机之后,揭秘预训练如何塑造机器的「可信灵魂」
图表 1: 大模型的通用训练流程 [1] 在人工智能的前沿领域,大语言模型(Large Language Models,LLMs)由于其强大的能力正吸引着全球研究者的目光。在 LLMs 的研发流程中,预训练阶段占据着举足轻重的地位,它不仅消耗了大量的计...
-
这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数
还记得去年 11 月底爆出来的 Q* 项目吗?这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下,可参看机器之心当时的报道《全网大讨论:引爆 OpenAI 全员乱斗的 Q * 到底是什么?》简而言之,Q* 很可能是...
-
AI成功改写人类DNA,全球首个基因编辑器震撼开源!近5倍蛋白质宇宙LLM全生成
AI,能够重写人类基因组了? 就在刚刚,初创公司Profluent宣布,完全由AI设计的基因编辑器,已经成功编辑了人类细胞中的DNA。 也就是说,世界上首个使用AI从头设计的分子级精确基因编辑器诞生了。 就像ChatGPT能生成诗歌一样,Proflue...
-
加州理工华人用AI颠覆数学证明!提速5倍震惊陶哲轩,80%数学步骤全自动化
Lean Copilot,让陶哲轩等众多数学家赞不绝口的这个形式化数学工具,又有超强进化了? 就在刚刚,加州理工教授Anima Anandkumar宣布,团队发布了Lean Copilot论文的扩展版本,并且更新了代码库。 图片 论文地址:https:/...
-
AI教母李飞飞:AI学术界没钱没资源!没有拨款将会凋亡
在计算机领域,究竟是搞工程还是做科研,一直都是一道不算容易的选择题。 不过,说到底程序员也是打工人。所以对大部分人来说,在拿更多的薪水和推动学术界进步之间,应该都会选前者。 而就收入来说,科技公司巨头从来都不吝啬给人才花钱——各种让普通打工人瞠目结舌的薪...
-
EMNLP 2023|利用LLM合成数据训练模型有哪些坑?
大家好,我是HxShine 今天我们将介绍EMNLP2023的一篇大模型(LLMs)生成文本分类任务合成数据的文章,标题是《Synthetic Data Generation with Large Language Models for Text Cla...
-
英特尔用 AI 简化酷睿 Ultra 处理器设计流程,将数周分析作业压缩至几分钟
4 月 17 日消息,英特尔在近日的一份博客中表示,其已将 AI 广泛用于包括酷睿 Ultra 处理器的热设计在内的工作中。 以酷睿 Ultra 处理器为代表的客户端产品在运行过程中严重依赖睿频功能。在睿频中处理器频率提升,同时产生更多的热量。 为了充...
-
自回归超越扩散!北大、字节 VAR 范式解锁视觉生成 Scaling Law
新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了!使 GPT 风格的自回归模型在图像生成首次超越扩散模型,并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task General...
-
史上首次,AI超越人类奥赛金牌得主!吴方法加持,30题做出27道破纪录
首位超越国际奥林匹克竞赛金牌得主的AI,刚刚诞生了! 印度理工学院海得拉巴分校、图宾根AI中心、剑桥大学的研究者发现—— 通过「吴方法」,可以让AI变成和人类数学奥赛银牌得主同样的水平,而「AI数学大师」AlphaGeometry,则直接超越了IMO金牌...
-
GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大
把论文丢给GPT-4进行撤稿预测,和人类审稿人给出的结果相似性近95%! 具体来说,来自人大与浙大学者团队的研究者们把涉及数千篇SCI/SSCI的期刊论文的10000多条推文喂给了GPT-4,让它根据推文回答“这篇论文是否有可能被撤稿”,然后和人类预测的...
-
GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%
把论文丢给GPT-4进行撤稿预测,和人类审稿人给出的结果相似性近95%! 具体来说,来自人大与浙大学者团队的研究者们把涉及数千篇SCI/SSCI的期刊论文的10000多条推文喂给了GPT-4,让它根据推文回答“这篇论文是否有可能被撤稿”,然后和人类预测的...
-
无需训练,这个新方法实现了生成图像尺寸、分辨率自由
近期,扩散模型凭借其出色的性能已超越 GAN 和自回归模型,成为生成式模型的主流选择。基于扩散模型的文本到图像生成模型(如 SD、SDXL、Midjourney 和 Imagen)展现了生成高质量图像的惊人能力。通常,这些模型在特定分辨率下进行训练,以确...
-
GitHub突破1000星!上交、清华开源个性化联邦学习算法库PFLlib
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 我们在 GitHub 上开源了一个个性化联邦学习算法仓库(PFLlib),目前已经获得 1K+ 个 Star 和 200+ 个 Fork...
-
斯坦福团队新作:喊话就能指导机器人,任务成功率暴增,网友:特斯拉搞快点
斯坦福的ALOHA家务机器人团队,发布了最新研究成果—— 项目名为Yell At Your Robot(简称YAY),有了它,机器人的“翻车”动作,只要喊句话就能纠正了! 而且机器人可以随着人类的喊话动态提升动作水平、即时调整策略,并根据反馈持续自我改进...
-
CVPR 2024录用结果出炉!2719篇论文被接收,录用率23.6%
想了解更多AIGC的内容: 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ CVPR 2024最终录用结果公布了! 刚刚,CVPR官方发文称,今年共提交了11532份有效论文,2719篇论文被接收,录用率为23...
-
Scaling Law被证伪,谷歌研究人员实锤研究力挺小模型更高效,不局限于特定采样技术!
出品 | 51CTO技术栈(微信号:blog51cto) “模型越大,效果越好”,Scaling Law再次被OpenAI带火了,但谷歌的研究人员的最新研究证伪了这一观点。 在周一发表的一项研究中,谷歌研究院和约翰霍普金斯大学的研究人员对人工智能 (AI...
-
谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 文本嵌入模型在自然语言处理中扮演着重要角色,为各种文本相关任务提供了强大的语义表示和计算能力。 在语义表示上,文本嵌入模型将文本转换为高...
-
论文如何降低AIGC?七大策略助你攻克学术挑战
大家好,小发猫降ai今天来聊聊论文如何降低AIGC?七大策略助你攻克学术挑战,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 论文如何降低AIGC?七大策略助你攻克学...
-
中科大等意外发现:大模型不看图也能正确回答视觉问题!
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 大模型不看图,竟也能正确回答视觉问题?! 中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。 他们首先看到像...
-
让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 在探索人工智能边界时,我们时常惊叹于人类孩童的学习能力 —— 可以轻易地将他人的动作映射到自己的视角,进而模仿并创新。当我们追求更高阶...
-
音乐ChatGPT 2.0来了!AI作曲家被踢馆,亲测周杰伦爆款大翻车
【新智元导读】200名音乐人联名信抗议的消息刚出,Stability AI的新音乐工具就来了!刚刚发布的Stable Audio2.0,可以创作长达3分钟的音乐,哼哼几句就能给你创作出一段音乐了!不过广大网友和音乐人试用后表示:有点失望…… 200多名音乐...
-
文心一言论文查重重复率高吗?深度解析与应对策略
大家好,小发猫降重今天来聊聊文心一言论文查重重复率高吗?深度解析与应对策略,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 文心一言论文查重重复率高吗?深度解析与应对策略 在学术研究领域,论文...
-
降重神器还是智商税?深度解析降aigc大发猫免费版
大家好,小发猫降ai今天来聊聊降重神器还是智商税?深度解析降aigc大发猫免费版,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 红薯伪原创官网 - http://h...
-
长文本之罪:Claude团队新越狱技术,Llama 2到GPT-4无一幸免
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 刚刚,人工智能初创公司 Anthropic 宣布了一种「越狱」技术(Many-shot Jailbreaking)—— 这种技术可以用来...
-
元象发布 XVERSE-MoE-A4.2B 大模型 可免费商用
元象发布了 XVERSE-MoE-A4.2B 大模型,采用混合专家模型架构,激活参数为4.2B,效果媲美13B 模型。该模型全开源,免费商用,可用于海量中小企业、研究者和开发者,推动低成本部署。 该模型具有极致压缩和超凡性能两大优势,采用稀疏激活技术,效果...
-
文言一心与文心一言:究竟有何不同?
大家好,小发猫降ai今天来聊聊文言一心与文心一言:究竟有何不同?,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 文言一心与文心一言:究竟有何不同? 当我们谈论自然...
-
华为诺亚频域LLM「帝江」:仅需1/50训练成本,7B模型媲美LLaMA,推理加速5倍
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 基于 Transformer 架构的大语言模型在 NLP 领域取得了令人惊艳的效果,然而,Transformer 中自注意力带来的二次复...
-
ChatDev官网体验入口 低代码开发人工智能AI软件工具使用地址
ChatDev是一个虚拟软件公司,利用集体智能研究创建的软件开发工具。它由扮演不同角色的智能体组成,通过参与设计、编码、测试等功能研讨会来协作开发软件。ChatDev提供了一个易于使用、高度可定制和可扩展的框架,基于大型语言模型(LLM ,旨在研究集体智能...
-
维普AIGC检测怎么规避?七步走策略助你应对
大家好,小发猫降ai今天来聊聊维普AIGC检测怎么规避?七步走策略助你应对,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 维普AIGC检测怎么规避?七步走策略助你应...
-
AI写作工具的重复性问题:Perplexity与Burstiness的探讨
大家好,小发猫降重今天来聊聊AI写作工具的重复性问题:Perplexity与Burstiness的探讨,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI写作工具的重复性问题:Perplexi...