-
深度技术分析:Meta Llama 3模型训练故障剖析
## 摘要 Meta公司在一项涉及16,384个Nvidia H100 80GB GPU的Llama 3 405B模型训练中,遭遇了频繁的硬件故障。在54天的训练期间,平均每三小时就发生一次组件故障,其中半数故障与GPU或其HBM3内存有关。尽管面临如此挑...
-
AIGC时代!AI的“iPhone时刻”与投资机遇
AIGC时代!AI的“iPhone时刻”与投资机遇 前言 AI的“iPhone时刻”与投资机遇 前言 AIGC,也就是人工智能生成内容,它就像是一股汹涌的浪潮,席卷了整个科技世界。它的出现,让我们看到了人工智能的无限潜力,也让我们...
-
OpenAI融资70亿,只剩孤家寡人?众人怒揭奥特曼真面目!
【新智元导读】眼看OpenAI要融资70亿,2025年收入预计高达116亿美元,奥特曼却忽然墙倒众人推。高管离职潮后,外界对他的嘲讽和质疑翻了天:爱权斗、爱push员工、给钱小气,甚至图谋颠覆非营利组织结构,公开抢夺数十亿美元资金!奥特曼这一波,还能坐稳吗...
-
最强服务器CPU来了!AI性能直接翻倍
服务器CPU领域持续多年的核心数量大战,被一举终结了! 英特尔最新发布的至强®6性能核处理器(P-core系列),超越了过去单一维度的竞争,通过“升维”定义了新的游戏规则: 在过去,CPU升级换代往往要在单个芯片上集成更多的核心,但这难免会受到工艺和芯...
-
AI几小时设计芯片超越人类!谷歌AlphaChip登Nature,已设计出三代旗舰TPU
【新智元导读】谷歌的AlphaChip,几小时内就能设计出芯片布局,直接碾压人类专家!这种超人芯片布局,已经应用在TPU、CPU在内的全球硬件中。人类设计芯片的方式,已被AI彻底改变。 能设计芯片的AI黑科技来了! 就在刚刚,谷歌DeepMind推出名为A...
-
OpenAI开启推理算力新Scaling Law,AI PC和CPU的机会来了
OpenAI的新模型o1,可谓是开启了Scaling Law的新篇章—— 随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算 ,o1在逻辑推理能力上已经达到了目前天花板级别。 尤其是在北大给出的一项评测中,o1-mini模型的跑分比o1-prev...
-
AIGC的算力与云边协同及应用创新
1)AI的新时代,生成式AI技术重新塑造AI技术的开发及应用 AI的新时代:更关注如何利用生成式AI技术在涉及数字内容的诸多领域实现改变及突破,生成式AI实际上扩大了“内容”的含义,凡是可以数字化的内容形式均为生成对象,而非传统意义下媒体环境的内容。...
-
马斯克追击万亿OpenAI
OpenAI很强,要给这种强悍标一个数,那这个数可能是1500亿美元。 当地时间9月11日,彭博社报道称,OpenAI正在以1500亿美元的估值进行融资,向投资者筹集65亿美元,还在商谈以循环贷款的形式向银行借款50亿美元。 OpenAI要融资的消息从八月...
-
PPTV创始人姚欣AI再创业,“分布式推理”终于有人做了
这个月,PPTV创始人姚欣再次站到了聚光灯下,组织了一场分布式云计算论坛,向外界揭开了他的新篇章。 姚欣的第二次创业,瞄准了云服务,要打造 AI 时代的基础设施。 但姿势独特:公司没有自建IDC和购买GPU,而是通过独特的方式成为了全国最多节点的云服务商。...
-
AMD放弃旗舰游戏显卡,专注AI,新统一架构挑战英伟达CUDA生态
短短几天内,AMD连续宣布两项颠覆性的转变: 放弃旗舰游戏显卡,转而抢占中低端市场份额 专注AI,统一现在并存的两种GPU微架构,挑战英伟达CUDA生态 两条策略背后还有一个统一的目标:扩大生态规模。 这次苏姿丰没有出面,由AMD计算和图形主管Ja...
-
电动汽车有多耗电:比尔盖茨称AI用电量跟它比小得多
快科技9月9日消息,之前外界猛批AI,认为围绕它搭建的设施太耗电,不过比尔盖茨却不这么认为。 微软和其他科技公司致力于寻找清洁能源,并成为这些新技术的先驱者,包括地热、核裂变、核聚变等前沿技术。 对此,比尔盖茨表示,即便在极端预估下,AI 数据中心的能耗增...
-
全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了
【新智元导读】两天前,马斯克得意自曝:团队仅用122天,就建成了10万张H100的Colossus集群,未来还会扩展到15万张H100和5万张H200。此消息一出,奥特曼都被吓到了:xAI的算力已经超过OpenAI了,还给员工承诺了价值2亿期权,这是要上天...
-
猫头虎 Gemma和Gemini模型的区别是什么?
猫头虎 ? Gemma和Gemini模型的区别是什么? 摘要? 在这篇文章中,我们将深入探讨Gemma和Gemini这两个由Google开发的AI模型。我们会对比它们的参数规模、计算资源需求和集成难度,帮助大家了解这两者之间的主要区别。无论你是AI...
-
英伟达Blackwell称霸MLPerf!推理性能暴涨30倍,新一代「AI怪兽」诞生
【新智元导读】MLPerf Inference发布了最新测试结果,英伟达最新的Blackwell架构芯片上场与谷歌、AMD同场竞技,展现出明显的性能提升,甚至刷新了部分任务上的测试纪录。 大语言模型(LLM)推理是一个全栈挑战。 为了实现高吞吐量、低延迟的...
-
液冷技术:迎接AIGC时代数据中心的散热挑战
随着人工智能生成内容(AIGC)的跨越式发展,算力需求呈爆炸式增长,带动了数据中心的功耗和热管理需求的飞速上升。AI模型训练和推理过程中的高计算资源需求,导致服务器发热量大幅增加,对散热技术提出了更高的要求。根据Colocation America发布的数...
-
NVIDIA将发近年最重要科技财报!市场期待能否戳破AI泡沫论
快科技8月25日消息,美东时间8月28日,半导体巨头NVIDIA将公布其2025财年第二财季业绩,市场普遍预期这将是近年来科技界最重要的一份财报。 虽然多位分析师都给出了乐观预期,但不可否认的是,投资AI是场回报率难达预期的泡沫”疑虑仍难消解。 如果NVI...
-
弹幕背后:B站UP主创作服务解析
引言 在B站,每一条飘过的弹幕都是一个故事的碎片,它们汇聚成一幅幅生动的社交画卷。这里,不仅仅是一个视频分享平台,弹幕背后更是一个充满活力的创作者生态系统。B站以其独特的弹幕文化,为创作者和观众之间搭建起了一座互动的桥梁,让创意与情感在虚拟空间中自由...
-
JuiceFS 在多云架构中加速大模型推理
在大模型的开发与应用中,数据预处理、模型开发、训练和推理构成四个关键环节。本文将重点探讨推理环节。在之前的博客中,社区用户 BentoML 和贝壳的案例提到了使用 JuiceFS 社区版来提高模型加载的效率。本文将结合我们的实际经验,详细介绍企业版在此场景...
-
网络爬虫必备工具:代理IP科普指南
文章目录 1. 网络爬虫简介 1.1 什么是网络爬虫? 1.2 网络爬虫的应用领域 1.3 网络爬虫面临的主要挑战 2. 代理IP:爬虫的得力助手 2.1 代理IP的定义和工作原理 2.2 爬虫使用代理IP的必要性 3. 代理IP的类型...
-
印度首款AI芯片来了!公司创始人被称为印度“马斯克”
快科技8月18日消息,据媒体报道,印度汽车制造商Ola近日宣布,将于2026年推出国内首款自研AI芯片,采用ARM架构。 Ola公司的创始人Bhavish Aggarwal,被誉为印度的马斯克”,他以其直言不讳的个性和对本地制造业的积极支持,与埃隆马斯克有...
-
Meta 刚刚发布 Llama 3.1 :在 AI 战斗中向 OpenAI 发起了大规模挑战|TodayAI
社交巨头 Facebook 母公司 Meta 公司近日发布了其 Llama 系列人工智能模型的最新版本 Llama 3.1,包括迄今为止最大的版本,容量达到 820GB。这一新版本标志着 Meta 在 AI 领域向 OpenAI 发起了大规模挑战,并宣称其...
-
黄仁勋自曝第一批Blackwell已出炉 AI助手将成为企业标配
在SIGGRAPH大会上,英伟达CEO黄仁勋宣布已向全球发送新一代AI芯片Blackwell的工程样片,并与Meta CEO马克·扎克伯格(小扎)进行了一场炉边对话。 Blackwell芯片的开发背后,AI技术发挥了关键作用,黄仁勋还展示了英伟达在AI领域...
-
不是NVIDIA!苹果官宣AI模型训练用的谷歌芯片
快科技7月30日消息,苹果公司在其技术论文中透露,其人工智能系统Apple Intelligence所依赖的模型并非基于NVIDIA芯片,而是在谷歌设计的云端芯片上进行预训练的。 NVIDIA的GPU一直以高价位和高需求著称,是许多大型科技公司AI训练的首...
-
OpenAI模型年化收入10亿美元,百度发布文心一言新模型、比尔·盖茨:不要“过分担心”AI 用电
ChatGPT狂飙160天,世界已经不是之前的样子。 更多资源欢迎关注 1、OpenAI AI模型销量超越微软同类产品!年化收入达10亿美元 在2019年与微软建立合作伙伴关系后,AI初创公司OpenAI显示出了惊人的销售能力,根据最新两家...
-
马斯克19天建成世界最强AI集群!10万块H100「液冷怪兽」即将觉醒
凌晨4:20,大洋彼岸的最大超算训练集群开始轰鸣。 「420」也是马斯克最喜欢玩的梗,象征着自由、不受约束和反传统。 马斯克频繁把「420」用在他的产品定价,公司开会时间和星舰一发射时间上等等。 网友也在评论区打趣马斯克超绝仪式感,不到4:20不开工。...
-
OpenAI 已与博通洽谈开发新型 AI 芯片以保持领先优势
OpenAI 正在与包括博通(Broadcom)在内的半导体设计公司进行谈判,讨论开发新芯片的事宜。这家人工智能公司希望借此减少对英伟达(Nvidia)的依赖,并加强其供应链。 这些谈判是由 OpenAI 的联合创始人兼首席执行官 Sam Altman...
-
AI巨头狂跌!NVIDIA蒸发1.5万亿、AMD跌超10%:后进者被盯上
快科技7月18日消息,当地时间7月17日,美国科技股出现罕见暴跌,其中,NVIDIA大跌6.62%,市值单日蒸发约2059亿美元(约合人民币1.5万亿元),阿斯麦跌超12%,AMD、应用材料、迈威尔科技等均跌超10%。 然而,华尔街并未因此对AI热潮失去信...
-
大模型AIGC转行记录(一)
自从22年11月chat gpt上线以来,这一轮的技术浪潮便变得不可收拾。我记得那年9月份先是在技术圈内讨论,然后迅速地,全社会在讨论,各个科技巨头、金融机构、政府部门快速跟进。 软件开发行业过去与现状 我19年决定转码的时候,互联网的情况可比现在好...
-
马斯克豪掷40亿训Grok-3,红杉高盛大泼冷水,AI收支鸿沟或已达5000亿美元
马斯克为Grok3要豪掷近40亿美元狂买10万张H100,GPT-6的训练则可能要耗资百亿。然而红杉和高盛近日都给行业泼了冷水:每年要挣6000亿美元才能支付的巨额硬件支出,换来的却只是OpenAI34亿美元的收入,绝大多数初创连1亿美元都达不到。而如果全...
-
马斯克豪掷40亿训Grok-3!红杉高盛大泼冷水,AI收支鸿沟或已达5000亿美元
【新智元导读】马斯克为Grok3要豪掷近40亿美元狂买10万张H100,GPT-6的训练则可能要耗资百亿。然而红杉和高盛近日都给行业泼了冷水:每年要挣6000亿美元才能支付的巨额硬件支出,换来的却只是OpenAI34亿美元的收入,绝大多数初创连1亿美元都达...
-
AI芯片成新一代电老虎:未来五年消耗全球1.5%以上的电力 产生11亿吨碳排放
快科技6月29日消息,AI芯片的快速增长,带来了耗电量的大幅增加。一些计算表明,AI所需的电力将在全球电力消耗中占据相当大的份额。 TechInsights表示,英伟达H100的峰值功耗为700瓦,与一台正在工作的微波炉的功耗大致相同。但随着超级芯片的更新...
-
NVIDIA起飞后忘记游戏玩家!黄仁勋:主业转至AI
快科技6月27日消息,NVIDIACEO黄仁勋在日前的股东大会上表示,公司已将业务重心从游戏转移到了数据中心,尤其是在人工智能(AI)领域。 黄仁勋强调,NVIDIA正寻求为AI创造新市场,包括工业机器人等,并计划与多家电脑制造商和云服务提供商合作以实现这...
-
打破 AIGC 算力困境,io.net 如何实现“GPU 互联网”?
AIGC 在全球快速发展的当下,诸多项目深陷 GPU 运力不足,速度放缓、任务宕机、项目崩溃等困境,作为瞄准 AI 理念和 DePIN 赛道的 Solana 生态项目新星 io.net 来说,如何集成项目控制与云计算服务成为抢占市场的重要发力方向。...
-
描述如何启用 Microsoft Copilot for Security
要开始使用 Microsoft Copilot for Security,组织需要采取措施来加入服务和用户。这些包括: 提供副驾驶容量 设置默认环境 分配角色权限 供给能力 Microsoft Copilot for Securi...
-
AIGC时代 可演进的私有云将蔚然成风
AIGC时代,IT基础设施如何兼顾原有资源和能力又能拥抱新技术应用,企业如何从资源上云到架构用云、从粗犷使用到精细治理?新旧相融难题已经成为了业界讨论的焦点。“以可演进的IT云敏捷支撑行业数字化转型”,浪潮数据云计算方案总监刘健一抛出此观点,便...
-
董事会与IT领导者之间的关系如何演变
作为CIO,他们非常清楚其物理基础设施环境的状态,基础设施是采用AI平台的最大财务成本,36%的人表示这是他们目前最大的支出项目,超过八成的CIO表示,他们认为为了使AI系统运行所需的数据量呈指数级增长,将使他们现有的数据中心无法承受,基础设施挑战可能...
-
Hinton为拒马斯克offer扯谎挂电话,警告AI取代人类比想象中快30年
Geoffrey Hinton老爷子——图灵奖得主、深度学习发明人、AI三巨头、Ilya之师,在最新专访中透露出这个令人心碎的消息。 就在这两天,Hinton接受了多家媒体的专访,既有老生常谈的内容,即他对AI发展安全的担忧;也有一些新的话题和八卦。 他提...
-
对国内AI算力紧缺问题的若干看法
今天凌晨的苹果WWDC证实了一点:AI推理算力将长期处于“云端为主”的状态,这个“长期”至少是三到五年。是的,苹果与OpenAI建立了战略合作,计划将下一代iOS系统与ChatGPT深度融合;但是绝大部分生成式AI推理,包括文字和图片生成任务,仍将上传到C...
-
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
快科技6月7日消息,Intel官方宣布,旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2(Qwen2)的全球发布提供支持,已取得ModelScope、阿里云PAI、OpenVINO等诸多创新成果。 为了最大限度地提升诸通义千问2等大模型的效率...
-
OpenAI将从CEO Sam Altman有关联的核聚变公司购买电力
据《华尔街日报》报道,OpenAI 正在与 Helion 洽购尚未可能实现的核聚变驱动发电机,以为其机器学习数据中心提供 “大量” 电力。OpenAI 的 CEO Sam Altman 同时担任 Helion 董事会主席,拥有该核能公司3.75亿美元的股份...
-
OpenAI前员工预测:2027年AGI降临!GPT智商飙升,4年从幼儿园蹿到高中生
AGI到底是科技公司画的大饼,还是可预测的未来? 几天前,Anthropic一名25岁的高管在博客上发文,表示自己已经准备好了3年后退休,让AI取代自己的工作。 最近,OpenAI前员工的一篇博客文章也有类似的观点。 图片 他不仅认为AGI很可能实现,而...
-
一夜暴富50亿,老黄新晋「流量明星」!英伟达市值破3万亿,超越苹果成全球第二
3万亿美元,英伟达市值再次创造历史! 当地时间周三,股价涨超5%。现在的英伟达,已经成为全球第二大市值最高的公司,超越苹果,仅次微软。 距离世界第一,仅差一步之遥。 而上一次英伟达市值首超苹果,还是2002年。当时,两家公司的市值不到100亿美元。...
-
存储器在工业应用中采用人工智能的关键作用
人工智能(AI 已经大规模地出现在人们的视野中,这项技术正在从数据中心扩散到广泛的分布式位置,这是由更强大的处理器和更创新的算法实现的。但其他技术也需要跟上步伐,否则就有可能成为瓶颈。 美光科技公司工业部门主管David Henderson在接受行业...
-
微软与日立签署价值189亿美元的生成式AI合作伙伴关系
微软与日本日立公司签署了一项为期三年的合作协议,旨在共同开展利用生成式人工智能技术的多项云计算项目,以推动数据中心安全、可持续性等领域的创新发展。根据协议,日立将整合微软的人工智能和云服务到其数字解决方案业务 Lumada 中。 图源备注:图片由AI生成...
-
苏妈杀疯了:移动端最强NPU算力达50TOPS,最强AI芯片挑战英伟达
一年一度的 Computex 科技大会成为了 GPU 厂商们秀肌肉的舞台,其中当属英伟达和 AMD 最为亮眼。英伟达现场拿出了量产版 Blackwell 芯片,还公布了未来三年的产品路线,包括下一代 Rubin AI 平台。 AMD 当然也不甘示弱,CE...
-
挑战英伟达!AMD亮出旗下最强AI芯片锐龙AI 300系列 算力达50TOPS
在一年一度的Computex科技大会上,GPU厂商们展示了他们的最新技术成果。其中,英伟达和AMD的表现尤为突出。 英伟达在会上展示了量产版的Blackwell芯片,并宣布了未来三年的产品路线图,包括下一代Rubin AI平台。而AMD的CEO苏姿丰则展示...
-
OpenAI 正在与 Helion Energy 洽谈“购买大量”聚变能源
据《华尔街日报》报道,西雅图地区的核聚变公司Helion Energy正在与OpenAI洽谈一项重大交易,计划为后者的数据中心提供大量电力。OpenAI首席执行官兼联合创始人Sam Altman已向Helion投资3.75亿美元,并担任该公司董事会主席。据...
-
一年一款大更新,英伟达AI芯片能打破摩尔定律?
是的,正如黄仁勋在台北电脑展2024展前演讲中所说,生成式AI技术正在不知不觉中影响着我们的生活与工作。而早在2014年就提出CUDA(通用计算平台)概念的英伟达,已经尝到人工智能带给它的甜头。 市值从1万亿美元到2.7万亿美元,英伟达仅仅用了一年左右的时...
-
下代GPU会非常难买!黄仁勋敦促企业快买AI芯片 买越多越省钱
快科技6月3日消息,近日,黄仁勋公开表示称,下代GPU会非常难买,并希望企业买多一些自家的AI芯片。 黄仁勋预警,下一代GPU会非常难买。同时他还敦促企业采购更多AI芯片。 你买的越多,省的就越多。这就是所谓的CEO数学。虽然不准确,但却是正确的。”黄仁勋...
-
老黄一口气解密三代GPU!粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题
想了解更多AIGC的内容, 请访问:51CTO AI.x社区 https://www.51cto.com/aigc/ 就在刚刚,老黄手持Blackwell向全世界展示的那一刻,全场的观众沸腾了。 它,是迄今为止世界最大的芯片! 眼前的这块产品,凝聚着数...