-
Meta训AI,成本已超阿波罗登月!谷歌豪言投资超千亿美元,赛过OpenAI星际之门
【新智元导读】近日访谈中,LeCun亲口证实:Meta为购入英伟达GPU已经花费了300亿美元,成本超过阿波罗登月。相比之下,微软和OpenAI打造的星际之门耗资1000亿美元,谷歌DeepMind CEO Hassabis则放出豪言:谷歌投入的,比这个数...
-
Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统
除了计算资源和训练数据这些硬实力外,Llama3模型开源的训练思路覆盖了LLM模型的全部生命周期,提供了各种开源生态系统下的工具。 Llama3的开源,再次掀起了一场大模型的热战,各家争相测评、对比模型的能力,也有团队在进行微调,开发衍生模型。 最近,M...
-
AMD AI 业务展望提升,股价仍受挫
美国微设备公司(AMD)周二发布的季度财报符合华尔街预期,但这并没有提振股价,因为公司的业绩中点与预期持平。AMD 还提高了其 MI300人工智能加速器产品的预期收入,预计今年将超过40亿美元,高于此前逾35亿美元的预期。 然而,一些华尔街人士曾希望 A...
-
MindSpore强化学习:使用PPO配合环境HalfCheetah-v2进行训练
本文分享自华为云社区《MindSpore强化学习:使用PPO配合环境HalfCheetah-v2进行训练》,作者: irrational。 半猎豹(Half Cheetah)是一个基于MuJoCo的强化学习环境,由P. Wawrzyński在“A Cat...
-
模型量化与量化在LLM中的应用 | 得物技术
【图片出处:Knowledge Distillation: A survey,2021,p2】 剪枝则是通过靠剪除模型中不重要的权重从而给模型“瘦身”,提高模型的推理效率,为了保证模型的能力,通常剪枝过程也需要伴随着模型基于训练数据的微调。根据剪除权重的...
-
大模型时代,九章云极DataCanvas点亮五座“灯塔”
“计算”是贯穿人类文明史的一大主题。 早在茹毛饮血的原始社会,先民们就开始结绳记事;进入20世纪,世界上首台数字式电子计算机ENIAC诞生,标志着人类算力正式跨越阈限;随后半导体技术出现,芯片成为了算力的主要载体;科技巨轮驶入21世纪,云计算的发展再度为...
-
史上最大重建25km²!NeRF-XL:真正有效利用多卡联合训练!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:NeRF-XL: Scaling NeRFs with Multiple GPUs 论文链接:https://research.nvidia.com/labs/toronto-ai/nerfx...
-
老黄最新采访出炉!自述61年坚持成就了英伟达,AI革命点燃全世界
全球进入2万亿美元俱乐部的公司,仅有4家——微软、苹果、谷歌,以及英伟达。 在过去一年中,位于加利福尼亚的计算机芯片制造商英伟达,市值从1万亿,飙升到2万亿美元。 这得益于大模型掀起的AI狂潮,急剧放大了全世界对算力的需求。 从Grace架构,到全新的...
-
单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源
FP8和更低的浮点数量化精度,不再是H100的“专利”了! 老黄想让大家用INT8/INT4,微软DeepSpeed团队在没有英伟达官方支持的条件下,硬生生在A100上跑起FP6。 测试结果表明,新方法TC-FPx在A100上的FP6量化,速度接近甚至...
-
特斯拉今年将投100亿美元加码AI 马斯克:否则无法参与竞争
快科技4月29日消息,特斯拉CEO马斯克在社交媒体上表示,今年特斯拉将会投资约100亿美元用于AI的训练和推理,而推理主要用于汽车。 马斯克补充道,任何公司如果不能达到这一水平的支出,且不能高效地进行支出,就无法参与竞争。 此前,马斯克就曾在不同场合提及特...
-
Nvidia GTC 24:你准备好迎接AI未来了吗?
2024 年 Nvidia GTC 大会涵盖了围绕 AI 时代的主题,这引出了以下总体问题:各行业组织的云和 IT 基础设施是否已为 AI 的未来做好准备? 在主题演讲中,Nvidia 首席执行官黄仁勋在加州圣何塞 SAP 中心向观众发表了两个小时的...
-
为了应对AI热潮专家讨论了液体冷却策略
科学家预测,在未来几十年内全球温度可能会稳步上升,数据中心经理们不需要等那么久,一股热浪正因最新的GPU、CPU和AI应用而向他们袭来。 “AFCOM数据中心报告”的作者Bill Kleyman强调:“随着AI需求的增长,数据中心运营商必须调整其基础...
-
无界AI算法总监邹国平:Midjourney领跑,没有标准答案的文生图,下半场还能怎么卷?
撰稿 | 李美涵 采访 | 云昭 嘉宾 | 邹国平 出品 | 51CTO技术栈(微信号:blog51cto) 进入2024,AI应用落地的步伐悄然加速。 AI文生图产品——连接着千行百业的设计需求,极大地压缩了创意实现的周期——正成为快速掘金的AI领域之...
-
如何将GPU云服务器集成到AI基础设施中?
GPU云服务器是基于云的计算资源,利用图形处理单元来处理高性能任务。与仅依赖CPU的传统服务器不同,GPU云服务器专为并行处理而设计,使其成为机器学习和人工智能等计算密集型应用的理想选择。 在B2B领域,将GPU云服务器集成到AI基础设施中已成为提升性能...
-
在云平台上部署LLM的三个“秘密”
译者 | 晶颜 审校 | 重楼 在过去两年里,我更多地参与了使用大型语言模型(LLM)而非传统系统的生成式人工智能项目。我开始怀念无服务器云计算。它们的应用范围从增强会话式人工智能到提供跨行业的复杂分析解决方案,以及其他许多功能。许多企业在云平台上部署这...
-
AI 计算创业公司FlexAI 获得3000万美元种子资金
AI 计算创业公司 FlexAI 近日宣布获得3000万美元的种子资金,正式走出隐形模式。该公司成立于去年,团队成员包括来自苹果、英特尔、英伟达和特斯拉的前员工。总部位于巴黎的 FlexAI 试图通过其按需云服务来颠覆基础设施市场。 图源备注:图片由AI...
-
受AI等推动,英特尔第一季度营收127亿美元、增长9%
英特尔公司在其新的财务架构模式下宣布了第一季度的业绩,旨在确立自己作为人工智能硬件领域的领导者。该公司今天报告的第一季度营收为127亿美元,同比增长9%。预测第二季度2024年的营收为125至135亿美元。 尽管第一季度超出了分析师的预期,但公司的第二季度...
-
马斯克旗下AI公司 xAI 将完成 60 亿美元融资
近日,马斯克旗下的人工智能公司xAI传来了振奋人心的消息,该公司即将完成一笔高达60亿美元的融资交易,标志着人工智能领域又迎来了一次重磅的资本运作。 这一轮融资不仅将显著提升xAI的资金实力,更将使其估值飙升至惊人的180亿美元,展现了公司巨大的发展潜力。...
-
一次性讲明白,如何搞定一个可以支持多芯混合训练的 AI 集群
由于外部环境的变化,适用于大模型训练任务的 GPU 整体规模无法继续增长。这些存量 GPU 组成的集群,仍然是当前加速大模型训练的主要 AI 算力来源。同时,各类国产 AI 芯片开始大规模投入实际生产任务。在未来一段时间内,数据中心的 AI 算力将保持多...
-
老黄亲自上门送超算!OpenAI奥特曼签收后到斯坦福演讲GPT-5
皮衣老黄亲自上门送货!OpenAI收到世界上第一台DGX H200超算。 致推进人工智能、计算和人类发展。 图片 这下呼吁快发布GPT-5的声音更高了。 图片 在OpenAI负责模型微调的员工Steven Heidel开玩笑说:“老黄签过名上了Buff的...
-
黄仁勋亲自给OpenAI送货,全球首台DGX H200开箱了
今天,黄仁勋又来送 AI 芯片了,还是超强悍的那种。 OpenAI 联合创始人、总裁 Greg Brockman 发推,晒出了自己、OpenAI CEO 奥特曼与英伟达创始人兼 CEO 黄仁勋的合照。 他表示,老黄亲自为 OpenAI 送来了全球第一台...
-
点云处理绕不开的算法!如何高效搜索最近邻?开源工具库汇总
本文经自动驾驶之心公众号授权转载,转载请联系出处。 一 ANN benchmark 链接:https://github.com/erikbern/ann-benchmarks 在高维空间中快速搜索最近的邻居是一个越来越重要的问题,尽管显然需要这样来推动...
-
Meta今年人工智能相关支出要增加数十亿美元
4月25日消息,当地时间周三,Facebook的母公司Meta公布了第一季度财报,显示公司营收同比增长27%,利润更是翻了一番多。公司表示,为了支持人工智能领域的发展,计划在基础设施方面的投入将超出预期,增加数十亿美元。 根据财报数据,拥有Facebo...
-
什么是高性能计算?
随着数据量呈指数级增长,计算需求也变得越来越复杂,一个经常被提及的术语是“高性能计算”或HPC。但它究竟意味着什么?数据中心运营商如何利用它来增强运营? 高性能计算使用超级计算机和计算机集群来解决高级计算问题。这些系统旨在提供比传统计算设置高得多的性能...
-
苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相
要说 ChatGPT 拉开了大模型竞赛的序幕,那么 Meta 开源 Llama 系列模型则掀起了开源领域的热潮。在这当中,苹果似乎掀起的水花不是很大。 不过,苹果最新放出的论文,我们看到其在开源领域做出的贡献。 近日,苹果发布了 OpenELM,共四种变...
-
OpenAI陷巨大算力荒,国内大厂抢先破局!打破单芯片限制,算力效率提升33%
国内AI不行,是因为芯片不行? 我们跟国外的差距,是因为和英伟达芯片的差距过大? 最近,圈内有许多这样的论调。 其实深挖下去,就会发现事实完全不是这样。即使是英伟达最先进的芯片,依然无法满足当下人工智能在算力上的需求。 随着模型参数量和数据量的增加,智慧...
-
云端部署大模型的三个秘密
编译 | 星璇 出品 | 51CTO技术栈(微信号:blog51cto) 在过去的两年里,我更多地参与了使用大型语言模型(LLMs)的生成式AI项目,而非传统的系统。我开始怀念无服务器云计算。它们的应用范围广泛,从增强对话式AI到为各行各业提供复杂的分...
-
加州理工华人用AI颠覆数学证明!提速5倍震惊陶哲轩,80%数学步骤全自动化
Lean Copilot,让陶哲轩等众多数学家赞不绝口的这个形式化数学工具,又有超强进化了? 就在刚刚,加州理工教授Anima Anandkumar宣布,团队发布了Lean Copilot论文的扩展版本,并且更新了代码库。 图片 论文地址:https:/...
-
用AI应对网络安全挑战,思科推出“HyperShield”安全系统
思科日前推出了一款新的安全产品,据称可以利用AI帮助用户保护关键系统。 思科表示,这项名为“HyperShield”的安全系统能够将多个IT资产转换为安全执行点,包括公共云中的虚拟机和Kubernetes集群,使用户能够更容易地阻止应用程序漏洞和黑客入...
-
AI PC,是联想们的销量解药吗?
4月16日,AMD推出了适用于商用笔记本电脑和台式机的AI芯片;英特尔去年底就推出了Core Ultra芯片,今年还计划推出新一代英特尔酷睿Ultra客户端处理器家族,并预计年出货4000万台AI PC。 随着全球芯片制造商的AI技术越来越成熟,不断推出新...
-
Llama 3每秒输出800个token逼宫openAI!下周奥特曼生日或放出GPT-5?
【新智元导读】Llama3的开源,或将催生数十亿美元新产业。发布不到一周的时间,全网各种测试微调都开启了。甚至,Llama3在Groq上的输出速度实现了每秒800个token。 Llama3诞生之后便艳压群雄,开源界已无「模」能敌。 甚至,让网友为Open...
-
五种搭建LLM服务的方法和代码示例
在不断发展的大型语言模型(LLMs)领域中,用于支持这些模型的工具和技术正以与模型本身一样快的速度进步。在这篇文章中,我们将总结5种搭建开源大语言模型服务的方法,每种都附带详细的操作步骤,以及各自的优缺点。 1、Anaconda + CPU 我们首先介...
-
英特尔构建全球最大的神经形态系统,以促进更可持续的AI
英特尔宣布,已经建造了世界上最大的神经形态系统,代号为Hala Point,这一大规模神经形态系统最初部署在桑迪亚国家实验室,采用英特尔的Loihi 2处理器,旨在支持未来以大脑启发的AI研究,并解决当前AI在效率和可持续性方面的挑战。Hala Po...
-
AI教母李飞飞:AI学术界没钱没资源!没有拨款将会凋亡
在计算机领域,究竟是搞工程还是做科研,一直都是一道不算容易的选择题。 不过,说到底程序员也是打工人。所以对大部分人来说,在拿更多的薪水和推动学术界进步之间,应该都会选前者。 而就收入来说,科技公司巨头从来都不吝啬给人才花钱——各种让普通打工人瞠目结舌的薪...
-
六种方式快速体验最新发布的 Llama 3!
昨晚, Meta 发布了 Llama 3 8B 和 70B 模型,Llama 3 指令调整模型针对对话/聊天用例进行了微调和优化,在常见基准测试中优于许多现有的开源聊天模型。比如,Gemma 7B 和 Mistral 7B。 Llama 3 模型将...
-
重构、定义、引领,九章云极DataCanvas智算操作系统重磅发布
4月18日,2024九章云极DataCanvas智算操作系统新品发布会于北京隆重召开,全新产品DATACANVAS AIDC OS智算操作系统(以下简称AIDC OS)正式官宣。AIDC OS以卓越的AI技术实力和AI基础软件为根基,以重新定义和突破...
-
洞察全球人工智能芯片竞赛
在当代技术领域,人工智能(AI 已经成为一股变革力量,渗透到现代生活的各个方面。从虚拟助手到自动驾驶汽车,人工智能应用依赖于专门的硬件来增强其计算能力。推动人工智能技术进步的关键组件之一是人工智能芯片的开发,也被称为人工智能加速器或神经处理单元(NPU...
-
K8s和大模型真的搭吗?
编译|言征 出品 | 51CTO技术栈(微信号:blog51cto) K8s和大模型真的搭吗? 本文抛出了一个问题,但答案仍有待验证。 1.K8s迎来了新的受众群体 假设一位机器学习研究人员阅读了一篇研究论文,并想在PyTorch环境中使用基于Pytho...
-
全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用
LLM界的「真·Open AI」,又来整顿AI圈了! 业内惊呼:首个开源GPT-4级的模型,终于来了!开源模型追上闭源模型的历史性一刻,或许就在眼前了? 一石激起千层浪,Llama3才刚刚发布没几小时,就破纪录地登顶了Hugging Face排行榜。 这...
-
开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4
扎克伯格:「有了 Llama3,全世界就能拥有最智能的 AI。」 ChatGPT 拉开了大模型竞赛的序幕,Meta 似乎要后来居上了。 本周四,AI 领域迎来重大消息,Meta 正式发布了人们等待已久的开源大模型 Llama3。 扎克伯格在 Faceboo...
-
5月7日见!联发科天玑开发者大会2024定档:开启万物AI时代
快科技4月12日消息,联发科官方已经宣布,将于5月7日在深圳召开天玑开发者大会(MDDC2024)。 此次开发者大会的主题是AI予万物”,AI与万物的结合将会是此次探讨重点,深化AI在各项体验中的应用。 在推进端侧生成式AI进化和普及上,联发科一直走在行业...
-
OpenAI CEO 寻求阿联酋迪拜加入全球人工智能计划
OpenAI CEO Sam Altman 最近前往阿联酋,提出了建立一个全球性政府和私人利益相关方联盟来资助、支持和供应人工智能产业的构想。 据报道,Altman 在本周会见了几位阿联酋官员和投资者,讨论了他们以及其他人如何共同努力以抵消人工智能基础设施...
-
Meta AI推MA-LMM:用于长视频理解的记忆增强多模态大模型
Meta AI近日推出了一种名为MA-LMM的新型模型,旨在解决长期视频理解中的挑战。LLMs在处理文本数据时表现出了令人印象深刻的能力,但在处理视频输入方面存在一些限制,例如上下文长度限制和GPU内存限制。 为了克服这些限制,研究人员提出了MA-LMM,...
-
Next ’24 - 踏上云端新旅程
作者 | Google Cloud CEO, Thomas Kurian 去年,全世界才开始想象生成式 AI 将为企业带来怎样的转变,如今这些转变正在逐步展开。 而 Google 一直遵循着相同的原则:打造人人都能受益的 AI 技术,尽力为更多人带来更...
-
量子人工智能:创新与协作的交响曲
在不断发展的人工智能领域,量子人工智能的到来是一个关键时刻,它提供了创新与协作的和谐融合。随着高质量的深度伪造挑战数字内容的真实性,量子人工智能成为一股变革力量,为各个领域带来无与伦比的机遇和挑战。 提升深度伪造检测能力:量子人工智能的卓越处理能力,有...
-
ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验
一、ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验 ROCm:一个可移植、高性能的GPU计算平台 随着AI时代的来临,显卡的作用不再仅仅只局限于游戏,特别是在Stable Diffusion火爆全网之后,越来越多的玩家...
-
大模型的学习 LLaMa和ChatGLM,minichatgpt4
LLaMa和ChatGLM,minichatgpt4 什么情况用Bert模型,什么情况用LLaMA、ChatGLM类大模型,咋选? 答:Bert 的模型由多层双向的Transformer编码器组成,由12层组成,768隐藏单元,12个head,总参数量...
-
十个大型语言模型(LLM)常见面试问题和答案解析
今天我们来总结以下大型语言模型面试中常问的问题 一、哪种技术有助于减轻基于提示的学习中的偏见? A.微调 Fine-tuning B.数据增强 Data augmentation C.提示校准 Prompt calibration D.梯度裁剪 Gra...
-
雨云GPU云服务器搭建SD(Stable Diffusion)的教程,搭建自己的AI绘画网站,AIGC
Stable Diffusion是什么 Stable Diffusion是一种基于潜在扩散模型(Latent Diffusion Models)的文本到图像生成模型,由CompVis、Stability AI和LAION的研究人员和工程师共同创建。...
-
如何使用 Midjourney?2024年最新更新
一:基础篇 1:注册 首先,你需要注册一个 Discord 账号,然后加入 Midjourney 的 Discord 服务器。或者去 Midjourney 的官网点击右下角的 Join the Beta: 2:在 Discord 公共服务器里使...