-
黄仁勋:下一场工业革命已开始 AI将成为引领者
站长之家(ChinaZ.com)5月23日 消息:今日凌晨,英伟达公司公布了其截至4月28日的2025财年第一财季财务报告,各项关键数据均远超市场预期,再次证明了其在全球半导体领域的领先地位。 据财报披露,英伟达在第一财季实现了260亿美元的营收,较上年同...
-
IBM加倍投入企业AI,发布 Watsonx 助手、模型更新
IIBM 公布了其生成式 AI 平台 watsonx 的新更新,包括新的助手工具、第三方模型和对开源 AI 的更广泛承诺。 在公司年度 Think 大会上,IBM 宣布将重点转向支持开源。该公司已经将其一系列 Granite 大型语言模型开源,这意味着企业...
-
Hinton万字访谈:用更大模型「预测下一个词」值得全力以赴
「这份访谈的每一秒都是精华。」最近,图灵奖得主 Geoffrey Hinton 的一个访谈视频得到了网友的高度评价。 视频链接:https://www.youtube.com/watch?v=tP-4njhyGvo&t=660s 在访谈中,Hi...
-
微软发布Phi-3 Vision等最新大模型系列
微软发布了其最新的大型语言模型系列,Phi-3,包括Phi-3Vision、Phi-3Small7B和Phi-3Medium14B型号。这些模型在性能上与当前领先的大型模型相媲美,同时在特定领域提供了一些独特的优势。 Phi-3Medium14B 型号的...
-
微软发布Copilot智能体 还带来了本机小语言模型
5月22日消息,当地时间周二,微软在Build开发者大会上发布Copilot新智能体,它就像虚拟员工一样,能自动执行任务。微软认为,这种人工智能将消除枯燥乏味的工作内容,而不是完全取代员工工作。 此外,微软还针对Copilot+ PC推出了本机小语言模...
-
均价300万美元?英伟达GH200超级芯片落地9个超算中心,每秒两百亿亿次flop
英伟达用Grace Hopper的实力证明,它可以成为AI超算的首选硬件,未来将不再局限于GPU。 5月12日,英伟达宣布,全球有9台新型超级计算机正在使用Nvidia Grace Hopper超级芯片来加速科学研究和发现,从而推动高性能计算(HPC)产...
-
案例分享|Alluxio在自动驾驶模型训练中的应用与部署
分享嘉宾: 杨林三-辉羲智能 关于辉羲智能: 辉羲智能是一家做自动驾驶芯片的初创公司,成立于2022年。致力打造创新车载智能计算平台,提供高阶智能驾驶芯片、易用开放工具链及全栈自动驾驶解决方案,助力车企实现优质高效的自动驾驶量产交付,构建低成本、大规...
-
KubeAI大模型推理加速实践|得物技术
除了上面提到的技术外,提高大模型推理速度的还有大模型的量化技术等,这里先不探讨,后面有机会,我们会单独发文章来介绍。 二、大模型发展面临的挑战 未来大模型的参数量肯定会越来越大,这也是大模型的发展趋势,对推理加速的要求会越来越高。 OpenAI在其论...
-
生成式AI能否推进私有云的复兴吗?
根据调研机构Forrester在2023年进行的一项有关云计算基础设施的调查,在接受调查的1300名企业云决策者中,79%的受访者表示他们的组织正在部署或采用私有云。 另据IDC的预测,全球企业私有云基础设施(包括硬件、软件和支持服务 2024年的支...
-
微软重新定义AI PC:与GPT-4o共享屏幕,看过的一切再也不会忘
今天,微软重新定义了个人电脑。 刚刚发布新一代Copilot+PC,让上市还没几天的第一批AI PC直接过时了。 在新一代PC里,打游戏时可与AI实时对话,提供吐槽陪玩或攻略指导,由GPT-4o提供支持。 任何文件或网页浏览记录都可以用自然语言搜索,轻...
-
生成式AI是否正在让私有云“复兴”
编译丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 在又一轮技术革命来袭之际,不少企业正面临着一个战略性的抉择:是继续依赖公共云的便利,还是回归私有云的怀抱?随着AI技术的飞速发展,这一决策变得更加紧迫。 根据Forrester于2...
-
首个GPU高级语言,大规模并行就像写Python,已获8500 Star
经过近 10 年的不懈努力,对计算机科学核心的深入研究,人们终于实现了一个梦想:在 GPU 上运行高级语言。 上周末,一种名为 Bend 的编程语言在开源社区引发了热烈的讨论,GitHub 的 Star 量已经超过了 8500。 GitHub:http...
-
我们一起聊聊AI模型组合指南
实施需要周密的计划、资源管理以及采用现代部署实践和工具。 译自A Guide to Model Composition,作者 Sherlock Xu。 考虑一款旨在识别和分类野生动物照片的 AI 驱动的图像识别应用程序。您上传一张远足时拍摄的照片,几分钟...
-
AI如何使机器人更具自主性和适应性?
在工业自动化技术领域,最近有两个热点很难被忽视:人工智能(AI 和英伟达(Nvidia 。 毫不意外,这两者密切相关,因为英伟达现在不仅仅局限于其最开始的图形处理单元(GPU ,正在将其GPU技术扩展到数字孪生领域,同时紧密连接着新兴的AI技术。 最近...
-
Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA
GPT-4o的横空出世,再次创立了一个多模态模型发展的新范式! 为什么这么说? OpenAI将其称为「首个『原生』多模态」模型,意味着GPT-4o与以往所有的模型,都不尽相同。 传统的多模态基础模型,通常为每种模态采用特定的「编码器」或「解码器」,将不...
-
腾讯 PCG 搜广推机器学习框架GPU 性能优化实践
一、为什么 GPU 推荐模型训练框架是刚需 1. PCG 算力集群缺点 最开始的时候,腾讯 PCG 所有的推荐模型训练都是使用 CPU。但随着业务的深入,以及深度学习模型的发展,PCG 算力集群在做下一代推荐模型时会遇到各种问题: 首先,系统网络带宽...
-
微博已接入阿里云通义大模型 覆盖AI评论、明星陪聊等功能
站长之家(ChinaZ.com)5月18日 消息:据阿里云官方消息,微博宣布已成功将阿里云的大模型技术融入其核心业务,开启了一个全新的智能互动时代。这一融合不仅覆盖了AI评论、AI明星陪聊、虚拟角色帐号、星座大模型,更在信息流广告创意生成等领域展现出了显著...
-
阿里云:微博已接入通义大模型 应用于AI评论、AI明星陪聊等
快科技5月17日消息,根据阿里云”官方消息,微博已成功将大模型技术融入其业务中,包括AI评论、AI明星陪聊、虚拟角色帐号、星座大模型以及信息流广告创意生成等多个方面,且已初显成效。 据悉,微博是阿里云的长期合作伙伴,双方的合作历史已近十年。在面对突发的热点...
-
微软向云计算客户提供 AMD 替代 Nvidia AI 处理器
微软于周四表示,计划为其云计算客户提供平台的人工智能芯片,以与由 Nvidia 制造的组件竞争。微软将在下周的 Build 开发者大上公布更多细节。此外,微软还将在会议上推出新 Cobalt100定制处理器的预,该处理器的性能预计比其他基于 Arm Hol...
-
Hugging Face承诺免费提供1000万美元GPU计算资源,帮助小型开发者对抗大型AI公司
机器学习公司 Hugging Face 承诺投入1000万美元的 GPU 计算资源,帮助开发者和初创公司对抗大型人工智能公司。 Hugging Face 的首席执行官 Clem Delangue 表示:“我们很幸运能够投资社区。” 该公司最近筹集了2.35...
-
AI日报:百度搜索11%结果由AI生成;腾讯混元支持生成16s视频;谷歌发布开源视觉语言模型PaliGemma;Hugging Face承诺免费提供1000万美元GPU计算资源
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、李彦宏:百度搜索已有11%结果...
-
马斯克旗下 xAI 与甲骨文接近达成 100 亿美元协议
马斯克旗下的 xAI 公司正与甲骨文进行谈判,计划投资100亿美元租用甲骨文的 AI 服务器。如果交易达成,xAI 将成为甲骨文最大的客户之一。此举将使 xAI 能够快速追赶竞争对手 OpenAI、谷歌和 Anthropic 等头部企业。 与此同时,xA...
-
李飞飞揭秘创业方向“空间智能”:视觉化为洞察,看见成为理解,理解导致行动
斯坦福李飞飞创业后,首次揭秘新概念“空间智能”。 这不仅是她的创业方向,也是指引她的“北极星”,被她认为是“解决人工智能难题的关键拼图”。 视觉化为洞察;看见成为理解;理解导致行动。 李飞飞最新15分钟TED演讲完整公开,从数亿年前生命进化的起源开始,...
-
告别3D高斯Splatting算法,带神经补偿的频谱剪枝高斯场SUNDAE开源了
本论文作者包括帝国理工学院硕士生杨润一、北航二年级硕士生朱贞欣、北京理工大学二年级硕士生姜洲、北京理工大学四年级本科生叶柏均、中国科学院大学本科大三学生张逸飞、中国电信人工智能研究院多媒体认知学习实验室(EVOL Lab)负责人赵健、清华大学智能产业研究...
-
GPU需求增长但费用高昂,微云服务成为企业新宠
GPU的需求如今呈现出极大的增长,它们对于运行和训练生成式人工智能(GenAI)模型来说至关重要。微云(microclouds)提供的GPU服务可能成为一种可行的替代方案。微云市场规模正在快速增长。CoreWeave、Lambda Labs、Volta...
-
字节跳动豆包大模型发布,火山引擎全栈 AI 服务助力企业智能化转型
火山引擎总裁 谭待 企业要做好大模型落地,面临模型效果、推理成本、落地难度的三大关键挑战:既要有好的基础大模型做支撑,解决复杂难题,也要有低成本的推理服务让大模型被广泛应用,还要更多工具、平台和应用帮助企业做好场景落地。 ——谭待 火山引擎总裁...
-
OpenAI发布新AI模型GPT-4o和桌面版ChatGPT
OpenAI新的更新将GPT-4带给所有人,包括OpenAI的免费用户,技术主管Mira Murati在直播活动中表示。她补充说,新的模型GPT-4o"快得多",并在文本、视频和音频方面有了改进的能力。OpenAI表示,最终计划使用户能够通过视频与C...
-
扎克伯格警告:AI GPU 瓶颈已缓解 但功耗将限制 AI 增长
在最近的一次采访中,Facebook 联合创始人兼首席执行官马克·扎克伯格表示,长期的GPU荒已经基本结束,人工智能的增长和发展短期内不会受到资本限制的影响,而是将面临能源问题的挑战。 他指出,新数据中心的能耗已经达到惊人的 50 至 100 兆瓦,甚至可...
-
DLRover 如何拯救算力浪费?10 分钟自动定位故障机,1 秒内保存 Checkpoint!
欢迎大家在 GitHub 上 Star 我们: 分布式全链路因果学习系统 OpenASCE:https://github.com/Open-All-Scale-Causal-Engine/OpenASCE 大模型驱动的知识图谱 OpenSPG:http...
-
看红帽如何在RHEL与OpenShift中玩转生成式AI
市场上有很多生成式AI平台的选择,为什么要选择红帽? 红帽总裁兼CEO Matt Hicks直言红帽的不同之处在于运行位置的核心灵活性。企业既可以对小型开源模型进行混合部署,也可以在公有云或自有数据中心训练模型,同时支持主要的GPU供应商。 最近在R...
-
只需百行代码,让H100提速30%,斯坦福开源全新AI加速框架
AI 的快速发展,伴随而来的是大计算量。这就自然而然的引出了一个问题:如何减少 AI 对计算的需求,并提高现有 AI 计算效率。 为了回答这一问题,来自斯坦福的研究者在博客《GPUs Go Brrr》中给出了答案。 图片 博客地址:https://haz...
-
Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动
Meta FAIR 联合哈佛优化大规模机器学习时产生的数据偏差,提供了新的研究框架。 众所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例,其训练总共需要 1,720,320 GPU hours。由...
-
从零开始手搓GPU,照着英伟达CUDA来,只用两个星期
「我花两周时间零经验从头开始构建 GPU,这可比想象的要难多了。」 总有人说老黄的芯片供不应求,大家恨不得去手搓 GPU,现在真的有人试了。 近日,美国一家 web3 开发公司的创始工程师之一 Adam Majmudar 分享了他「手搓 GPU」成功...
-
小米13 Ultra获1.0.9.0版更新 新增大师人像、AISP功能
站长之家(ChinaZ.com)5月11日 消息:小米13Ultra手机迎来了澎湃HyperOS1.0.9.0的系统更新,这次更新不仅融入了2024年4月的安全补丁,加强了系统安全性,更在相机应用上实现了显著的功能升级,引入了备受期待的“大师人像”功能以及...
-
AI日报:OpenAI重磅更新定档下周一;开源版EMO项目发布;微信读书上线AI问书功能;博主调教AI男友甜晕网友
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、OpenAI预告将直播Chat...
-
AI手机,活成产业“摇钱树”
早几年出现的折叠屏没能拯救颓势的手机市场,直接证据就是去年全球出货量依旧拉胯,同比下滑3.2%至11.7亿部,为近十年来最低。 好在Q4出现了些许回暖,全球和中国市场分别有8.5%和1.2%的同比增幅,尤其是后者,在连续同比下降10个季度后首次转正。 很难...
-
价值190亿美元的AI计算提供商CoreWeave将在伦敦开设欧洲总部
美国新泽西州的 GPU 云计算 CoreWeave 在最近一轮融资中估值高达190亿美元,紧随其后的是它在伦敦开设办室,成为其欧洲总部。 CoreWeave 宣布将在今年在英国开设两个数据中心,作为10亿镑(12.5亿美元)的投资的一部分,这也是其首次在美...
-
万字长文超全总结Pytorch核心操作!
在深度学习与人工智能领域,PyTorch已成为研究者与开发者手中的利剑,以其灵活高效的特性,不断推动着新技术的边界。对于每一位致力于掌握PyTorch精髓的学习者来说,深入了解其核心操作不仅是提升技能的关键,也是迈向高级应用与创新研究的必经之路。本文精心...
-
首席信息官必须了解的关于人工智能基础设施的五件事
生成式人工智能有潜力改变行业并产生难以估量的投资回报率,但前提是首席信息官和其他IT领导者了解一些基本要素。 生成式人工智能吸引了所有人的注意力,这有着充分理由。但是,从潜力到盈利并非没有风险,例如,假设部署主流企业IT基础设施的既定流程将在复杂的人工...
-
理论+实践,带你了解分布式训练
本文分享自华为云社区《大模型LLM之分布式训练》,作者: 码上开花_Lancer。 随着语言模型参数量和所需训练数据量的急速增长,单个机器上有限的资源已无法满足大语言模型训练的要求。需要设计分布式训练(Distributed Training)系统来解决...
-
苹果推出新款iPad M4处理器加入AI PC竞赛
苹果公司近日推出了搭载M4处理器的新款iPad,标志着其在人工智能PC竞赛中的强势入场。尽管面临高通、英特尔和英伟达等竞争对手的激烈竞争,苹果依然自信宣称其NPU为市场最强。 据悉,M4处理器是苹果下一代内部SoC,相较于M3和M2,性能有了显著提升。苹果...
-
干翻AI PC!苹果M4芯片首发 新款iPad Pro顶配超2万
在春季新品发布会上,苹果公司展示了其最新技术和产品革新,包括配备M4芯片和双层OLED屏幕的新款iPad Pro,以及Apple Pencil Pro和更大尺寸的iPad Air。 iPad Pro升级亮点 超薄设计:新款iPad Pro以超薄机身亮相...
-
苹果深夜扔出M4核弹,iPad Pro碾压所有AI PC!280亿晶体管3nm工艺称霸地表
不出所料,发布会上,苹果又开大了! 此次发布会的一系列重磅更新,都是围绕着主角iPad展开。 库克直言:这将是iPad诞生以来的一个里程碑。 新款iPad Pro,轻薄到不可思议,直接让便携性和性能提升到史诗级水平。用苹果的话说就是——我们在打破iPa...
-
超强Siri即将到来!苹果10篇重磅AI研究全总结,iOS 18关键一瞥
【新智元导读】一直以来,苹果在大模型、语音助手上的研究不断推陈出新,或许我们能够从中获得iOS18所具备AI能力的关键一瞥。 「Siri太笨,根本无法与ChatGPT竞争」,前苹果工程师John Burkey曾对Siri的评价如此不堪。 不过,诞生于11年...
-
苹果正式发布M4:AI飙升两倍多!其他相当牙膏
快科技5月8日消息,苹果在今天凌晨的发布会上正式推出了新一代iPad Pro、iPad Air,其中前者直接全球首发M4处理器,只可惜它的变化并不是很大,有点像是M3的升级版,只有AI性能提升较多,工艺、CPU、GPU、内存上则是略有提升。 M4的制造工艺...
-
联发科最强5G AI芯片!天玑9300 发布:支持阿里云、文心等大模型
快科技5月7日消息,今日,联发科天玑9300 旗舰5G生成式AI移动芯片正式发布,不仅进一步提升性能,还带来了突破性生成式AI体验。 据了解,天玑9300 是业界首款实现更高速Llama2 7B端侧运行、业界首款生成式AI端侧双LORA融合的芯片,并且支持...
-
英伟达在印度招聘 AI 工程师
NVIDIA 正在印度招聘经验丰富的 AI 工程师,加入其合作伙伴公司。被选中的候选人将作为员工加入 NVIDIA 合作伙伴网络,负责推动 NVIDIA 技术的采用,并在数据中心、边缘和云部署领域获取创新设计。 这些位基于班加罗尔和新德里,专注于深度学习...
-
12年前上手深度学习,Karpathy掀起一波AlexNet时代回忆杀,LeCun、Goodfellow等都下场
没想到,自 2012 年 AlexNet 开启的深度学习革命已经过去了 12 年。 而如今,我们也进入了大模型的时代。 近日,知名 AI 研究科学家 Andrej Karpathy 的一条帖子,让参与这波深度学习变革的许多大佬们陷入了回忆杀。从图灵奖得主...
-
58行代码把Llama 3扩展到100万上下文,任何微调版都适用
堂堂开源之王Llama 3,原版上下文窗口居然只有……8k,让到嘴边的一句“真香”又咽回去了。 在32k起步,100k寻常的今天,这是故意要给开源社区留做贡献的空间吗? 开源社区当然不会放过这个机会: 现在只需58行代码,任何Llama 3 70b的微调...
-
什么是AI网关?你还需要一个吗?
出品 | 51CTO技术栈(微信号:blog51cto) 作者 | Liam Crilly 编译 | 言征 从GitHub Copilot到Microsoft Office Copilot再到ChatGPT等,AI已经以光速从“总有一天我们会到达那里”转...