-
我们一起聊聊AI模型组合指南
实施需要周密的计划、资源管理以及采用现代部署实践和工具。 译自A Guide to Model Composition,作者 Sherlock Xu。 考虑一款旨在识别和分类野生动物照片的 AI 驱动的图像识别应用程序。您上传一张远足时拍摄的照片,几分钟...
-
腾讯 PCG 搜广推机器学习框架GPU 性能优化实践
一、为什么 GPU 推荐模型训练框架是刚需 1. PCG 算力集群缺点 最开始的时候,腾讯 PCG 所有的推荐模型训练都是使用 CPU。但随着业务的深入,以及深度学习模型的发展,PCG 算力集群在做下一代推荐模型时会遇到各种问题: 首先,系统网络带宽...
-
Hugging Face承诺免费提供1000万美元GPU计算资源,帮助小型开发者对抗大型AI公司
机器学习公司 Hugging Face 承诺投入1000万美元的 GPU 计算资源,帮助开发者和初创公司对抗大型人工智能公司。 Hugging Face 的首席执行官 Clem Delangue 表示:“我们很幸运能够投资社区。” 该公司最近筹集了2.35...
-
GPU需求增长但费用高昂,微云服务成为企业新宠
GPU的需求如今呈现出极大的增长,它们对于运行和训练生成式人工智能(GenAI)模型来说至关重要。微云(microclouds)提供的GPU服务可能成为一种可行的替代方案。微云市场规模正在快速增长。CoreWeave、Lambda Labs、Volta...
-
DLRover 如何拯救算力浪费?10 分钟自动定位故障机,1 秒内保存 Checkpoint!
欢迎大家在 GitHub 上 Star 我们: 分布式全链路因果学习系统 OpenASCE:https://github.com/Open-All-Scale-Causal-Engine/OpenASCE 大模型驱动的知识图谱 OpenSPG:http...
-
只需百行代码,让H100提速30%,斯坦福开源全新AI加速框架
AI 的快速发展,伴随而来的是大计算量。这就自然而然的引出了一个问题:如何减少 AI 对计算的需求,并提高现有 AI 计算效率。 为了回答这一问题,来自斯坦福的研究者在博客《GPUs Go Brrr》中给出了答案。 图片 博客地址:https://haz...
-
从零开始手搓GPU,照着英伟达CUDA来,只用两个星期
「我花两周时间零经验从头开始构建 GPU,这可比想象的要难多了。」 总有人说老黄的芯片供不应求,大家恨不得去手搓 GPU,现在真的有人试了。 近日,美国一家 web3 开发公司的创始工程师之一 Adam Majmudar 分享了他「手搓 GPU」成功...
-
小米13 Ultra获1.0.9.0版更新 新增大师人像、AISP功能
站长之家(ChinaZ.com)5月11日 消息:小米13Ultra手机迎来了澎湃HyperOS1.0.9.0的系统更新,这次更新不仅融入了2024年4月的安全补丁,加强了系统安全性,更在相机应用上实现了显著的功能升级,引入了备受期待的“大师人像”功能以及...
-
苹果启动AI云服务器计划,芯片直接用M2 Ultra
尽管苹果在生成式 AI 方面的进展没有像谷歌、Meta 和微软等竞争对手那样高调,但该公司一直在进行相关研究,其构筑新生态的思路总是显得与众不同。 5 月 7 日晚,苹果在春季新品发布特别活动中回应了大家的关注:「跨越极其强大的 M3 芯片,直接来到下一...
-
万字长文超全总结Pytorch核心操作!
在深度学习与人工智能领域,PyTorch已成为研究者与开发者手中的利剑,以其灵活高效的特性,不断推动着新技术的边界。对于每一位致力于掌握PyTorch精髓的学习者来说,深入了解其核心操作不仅是提升技能的关键,也是迈向高级应用与创新研究的必经之路。本文精心...
-
苹果推出新款iPad M4处理器加入AI PC竞赛
苹果公司近日推出了搭载M4处理器的新款iPad,标志着其在人工智能PC竞赛中的强势入场。尽管面临高通、英特尔和英伟达等竞争对手的激烈竞争,苹果依然自信宣称其NPU为市场最强。 据悉,M4处理器是苹果下一代内部SoC,相较于M3和M2,性能有了显著提升。苹果...
-
干翻AI PC!苹果M4芯片首发 新款iPad Pro顶配超2万
在春季新品发布会上,苹果公司展示了其最新技术和产品革新,包括配备M4芯片和双层OLED屏幕的新款iPad Pro,以及Apple Pencil Pro和更大尺寸的iPad Air。 iPad Pro升级亮点 超薄设计:新款iPad Pro以超薄机身亮相...
-
苹果深夜扔出M4核弹,iPad Pro碾压所有AI PC!280亿晶体管3nm工艺称霸地表
不出所料,发布会上,苹果又开大了! 此次发布会的一系列重磅更新,都是围绕着主角iPad展开。 库克直言:这将是iPad诞生以来的一个里程碑。 新款iPad Pro,轻薄到不可思议,直接让便携性和性能提升到史诗级水平。用苹果的话说就是——我们在打破iPa...
-
苹果正式发布M4:AI飙升两倍多!其他相当牙膏
快科技5月8日消息,苹果在今天凌晨的发布会上正式推出了新一代iPad Pro、iPad Air,其中前者直接全球首发M4处理器,只可惜它的变化并不是很大,有点像是M3的升级版,只有AI性能提升较多,工艺、CPU、GPU、内存上则是略有提升。 M4的制造工艺...
-
联发科最强5G AI芯片!天玑9300 发布:支持阿里云、文心等大模型
快科技5月7日消息,今日,联发科天玑9300 旗舰5G生成式AI移动芯片正式发布,不仅进一步提升性能,还带来了突破性生成式AI体验。 据了解,天玑9300 是业界首款实现更高速Llama2 7B端侧运行、业界首款生成式AI端侧双LORA融合的芯片,并且支持...
-
联发科天玑 9300+ 处理器发布 支持Llama27B端侧大模型运行
在今日上午的MediaTek天玑开发者大会MDDC2024上,备受瞩目的天玑9300++旗舰处理器终于揭开了神秘的面纱。这款处理器的CPU架构精心布局,融合了1个高达3.40GHz的Cortex-X4核心,3个2.85GHz的核心,以及4个2.00GHz的...
-
MLP一夜被干掉!MIT加州理工等革命性KAN破记录,发现数学定理碾压DeepMind
一夜之间,机器学习范式要变天了! 当今,统治深度学习领域的基础架构便是,多层感知器(MLP)——将激活函数放置在神经元上。 那么,除此之外,我们是否还有新的路线可走? 就在今天,来自MIT、加州理工、东北大学等机构的团队重磅发布了,全新的神经网络结构...
-
12年前上手深度学习,Karpathy掀起一波AlexNet时代回忆杀,LeCun、Goodfellow等都下场
没想到,自 2012 年 AlexNet 开启的深度学习革命已经过去了 12 年。 而如今,我们也进入了大模型的时代。 近日,知名 AI 研究科学家 Andrej Karpathy 的一条帖子,让参与这波深度学习变革的许多大佬们陷入了回忆杀。从图灵奖得主...
-
关于人工智能,专家不愿透露的秘密!
如今,人工智能(AI 已经成为我们生活中不可分割的一部分。专家们通常会指出人工智能的优势,但可能不会很快提到这项技术的问题。本文将深入挖掘人工智能专家不愿意透露的隐藏秘密。 1.人工智能并非万无一失 虽然人工智能系统可以使数字更精确的许多倍,但并非完美...
-
MindSpore强化学习:使用PPO配合环境HalfCheetah-v2进行训练
本文分享自华为云社区《MindSpore强化学习:使用PPO配合环境HalfCheetah-v2进行训练》,作者: irrational。 半猎豹(Half Cheetah)是一个基于MuJoCo的强化学习环境,由P. Wawrzyński在“A Cat...
-
大模型时代,九章云极DataCanvas点亮五座“灯塔”
“计算”是贯穿人类文明史的一大主题。 早在茹毛饮血的原始社会,先民们就开始结绳记事;进入20世纪,世界上首台数字式电子计算机ENIAC诞生,标志着人类算力正式跨越阈限;随后半导体技术出现,芯片成为了算力的主要载体;科技巨轮驶入21世纪,云计算的发展再度为...
-
为了应对AI热潮专家讨论了液体冷却策略
科学家预测,在未来几十年内全球温度可能会稳步上升,数据中心经理们不需要等那么久,一股热浪正因最新的GPU、CPU和AI应用而向他们袭来。 “AFCOM数据中心报告”的作者Bill Kleyman强调:“随着AI需求的增长,数据中心运营商必须调整其基础...
-
人工智能的十大局限性
在技术创新领域,人工智能(AI 是我们这个时代最具变革性和前景的发展之一。人工智能凭借其分析大量数据、从模式中学习并做出智能决策的能力,已经彻底改变了从医疗保健和金融到交通和娱乐等众多行业。然而,在取得显著进步的同时,人工智能也面临着阻碍其充分发挥潜力的...
-
一次性讲明白,如何搞定一个可以支持多芯混合训练的 AI 集群
由于外部环境的变化,适用于大模型训练任务的 GPU 整体规模无法继续增长。这些存量 GPU 组成的集群,仍然是当前加速大模型训练的主要 AI 算力来源。同时,各类国产 AI 芯片开始大规模投入实际生产任务。在未来一段时间内,数据中心的 AI 算力将保持多...
-
Docker三分钟搞定LLama3开源大模型本地部署
概述 LLaMA-3(Large Language Model Meta AI 3)是由Meta公司开发的大型开源生成式人工智能模型。它在模型结构上与前一代LLaMA-2相比没有大的变动。 LLaMA-3模型分为不同规模的版本,包括小型、中型和大型,以适...
-
老黄亲自上门送超算!OpenAI奥特曼签收后到斯坦福演讲GPT-5
皮衣老黄亲自上门送货!OpenAI收到世界上第一台DGX H200超算。 致推进人工智能、计算和人类发展。 图片 这下呼吁快发布GPT-5的声音更高了。 图片 在OpenAI负责模型微调的员工Steven Heidel开玩笑说:“老黄签过名上了Buff的...
-
点云处理绕不开的算法!如何高效搜索最近邻?开源工具库汇总
本文经自动驾驶之心公众号授权转载,转载请联系出处。 一 ANN benchmark 链接:https://github.com/erikbern/ann-benchmarks 在高维空间中快速搜索最近的邻居是一个越来越重要的问题,尽管显然需要这样来推动...
-
什么是高性能计算?
随着数据量呈指数级增长,计算需求也变得越来越复杂,一个经常被提及的术语是“高性能计算”或HPC。但它究竟意味着什么?数据中心运营商如何利用它来增强运营? 高性能计算使用超级计算机和计算机集群来解决高级计算问题。这些系统旨在提供比传统计算设置高得多的性能...
-
OpenAI陷巨大算力荒,国内大厂抢先破局!打破单芯片限制,算力效率提升33%
国内AI不行,是因为芯片不行? 我们跟国外的差距,是因为和英伟达芯片的差距过大? 最近,圈内有许多这样的论调。 其实深挖下去,就会发现事实完全不是这样。即使是英伟达最先进的芯片,依然无法满足当下人工智能在算力上的需求。 随着模型参数量和数据量的增加,智慧...
-
AI PC,是联想们的销量解药吗?
4月16日,AMD推出了适用于商用笔记本电脑和台式机的AI芯片;英特尔去年底就推出了Core Ultra芯片,今年还计划推出新一代英特尔酷睿Ultra客户端处理器家族,并预计年出货4000万台AI PC。 随着全球芯片制造商的AI技术越来越成熟,不断推出新...
-
五种搭建LLM服务的方法和代码示例
在不断发展的大型语言模型(LLMs)领域中,用于支持这些模型的工具和技术正以与模型本身一样快的速度进步。在这篇文章中,我们将总结5种搭建开源大语言模型服务的方法,每种都附带详细的操作步骤,以及各自的优缺点。 1、Anaconda + CPU 我们首先介...
-
英特尔构建全球最大的神经形态系统,以促进更可持续的AI
英特尔宣布,已经建造了世界上最大的神经形态系统,代号为Hala Point,这一大规模神经形态系统最初部署在桑迪亚国家实验室,采用英特尔的Loihi 2处理器,旨在支持未来以大脑启发的AI研究,并解决当前AI在效率和可持续性方面的挑战。Hala Po...
-
英特尔用 AI 简化酷睿 Ultra 处理器设计流程,将数周分析作业压缩至几分钟
4 月 17 日消息,英特尔在近日的一份博客中表示,其已将 AI 广泛用于包括酷睿 Ultra 处理器的热设计在内的工作中。 以酷睿 Ultra 处理器为代表的客户端产品在运行过程中严重依赖睿频功能。在睿频中处理器频率提升,同时产生更多的热量。 为了充...
-
人工智能如何给智能手机带来革命性的转变?
人工智能(AI 一直被认为是各领域的核心功能技术,智能手机是展现新一代可能性和能量的典型例子。人工智能不再仅仅是匹配人类界面水平的问题,而是让设备比以往任何时候都表现得更好的问题。本文将讨论智能手机的人工智能,以及它将如何给现代智能手机带来革命性的变化...
-
高通骁龙X系列AI PC处理器将于4月24日发布
在社交平台上,高通已经提前宣布了一个令人激动的消息——全新的高通骁龙X系列AI PC处理器将于4月24日正式亮相。此次发布会的焦点无疑是两款新的芯片:骁龙X Elite和骁龙X Plus。 骁龙X Elite作为这次发布会的重头戏,其技术实力不容小觑。它基...
-
量子人工智能:创新与协作的交响曲
在不断发展的人工智能领域,量子人工智能的到来是一个关键时刻,它提供了创新与协作的和谐融合。随着高质量的深度伪造挑战数字内容的真实性,量子人工智能成为一股变革力量,为各个领域带来无与伦比的机遇和挑战。 提升深度伪造检测能力:量子人工智能的卓越处理能力,有...
-
史上首次,AI超越人类奥赛金牌得主!吴方法加持,30题做出27道破纪录
首位超越国际奥林匹克竞赛金牌得主的AI,刚刚诞生了! 印度理工学院海得拉巴分校、图宾根AI中心、剑桥大学的研究者发现—— 通过「吴方法」,可以让AI变成和人类数学奥赛银牌得主同样的水平,而「AI数学大师」AlphaGeometry,则直接超越了IMO金牌...
-
为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑
几天前,前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 发布了一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」。 llm.c 旨在让大模型(LM)训练变得简单...
-
得物 AIGC 算法岗(日常实习生) 面经分享
节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 最大的感受就是,今年的算法面试...
-
谷歌向微软英特尔全面宣战:首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
昨晚的Google Cloud Next2024大会上,谷歌接连放出一堆模型和产品王炸:Gemini1.5Pro公开可用、上线音频处理能力;代码模型CodeGemma上新,首款自研Arm处理器Axion正式向微软和亚马逊宣战……这次,谷歌要以量取胜。 昨天...
-
最简单的AI绘画软件,roop下载分享(可直播)
前段时间给大家介绍过“地表最强”的Rope 今天要说的Roop看起来和Rope师出同门,但两者之间并没有直接关系,生成的效果也各有千秋 在讲解前,先附上一张经过roop“调教”后的寡姐,啊,不是~ 你能看出哪张是原图吗(doge)? roop有...
-
小米 14 / Pro 获得大师人像、AISP 功能更新推送
今日,小米14和小米14Pro手机迎来了重要的系统更新。此次更新的一大亮点在于,小米14Ultra的出色影像功能被下放至这两款手机上,为用户带来了更为卓越的拍照体验。 更新内容中,新增的大师人像功能备受瞩目,它提供了大师人像和徕卡人像两种画质风格,为用户的...
-
英伟达竞品来了,训练比H100快70%,英特尔发最新AI加速卡
英伟达的 AI 加速卡,现在有了旗鼓相当的对手。 今天凌晨,英特尔在 Vision 2024 大会上展示了 Gaudi 3,这是其子公司 Habana Labs 的最新一代高性能人工智能加速器。 Gaudi 3 将于 2024 年第三季度推出,英特尔现...
-
谷歌向微软英特尔全面宣战!首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
昨天的谷歌Next大会可是太精彩了,谷歌一连放出不少炸弹。 - 升级「视频版」Imagen 2.0,下场AI视频模型大混战 - 发布时被Sora光环掩盖的Gemini 1.5 Pro,正式开放 - 首款Arm架构CPU发布,全面对垒微软/亚马逊/英伟达/...
-
AI绘图cuda与stable diffusion安装部署始末与避坑
stable diffusion的安装说起来很讽刺,最难的不是stable diffusion,而是下载安装cuda。下来我就来分享一下我的安装过程,失败了好几次,几近放弃。 一、安装cuda 我们都知道cuda是显卡CPU工作的驱动(或者安装官网的...
-
AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速
快科技4月9日消息,AMD今天宣布,旗下的Versal自适应片上系统(SoC 产品升级全新第二代,包括面向AI驱动型嵌入式系统的AI Edge 2VE3000系列、面向经典嵌入式系统的Prime系列。 新一代产品很好地平衡了性能、功耗、面积,以及先进的功...
-
不牺牲算法,不挑剔芯片,这个来自中科院的团队正在加速国产AI芯片破局
在《沙丘》构建的未来世界里,「得香料者得天下」。但在生成式 AI 席卷的智能世界里,得 GPU 者得天下。 前段时间,外媒 The Information 曝出了一则重磅消息:微软和 OpenAI 正在规划一个雄心勃勃的数据中心项目 —— 建造一台名...
-
纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了
众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截? 也许很多人开过这样的脑洞,现在有大佬实现了。 今天凌晨,前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy...
-
Ascend C 自定义算子 Kernel Launch调用入门
本文分享自华为云社区《Ascend C 自定义算子 Kernel Launch调用入门》,作者: jackwangcumt。 1 Kernel Launch概述 根据官方说明文档的介绍,Ascend C对外开放核函数的基础调用(Kernel Lau...
-
RWKV 模型启动工具 RWKV Runner 进阶教程(下)
在 RWKV Runner 教程的上篇(新手教程),我们讲述了如何使用 RWKV Runner 本地部署并运行 RWKV 模型: RWKV模型启动工具RWKV Runner新手教程(上) 而在今天发布的教程下篇,我们将主要介绍 RWKV Runner...