分布式训练 - AIGC资讯

绿色ai的实践：减少模型训练的碳足迹

标题：绿色AI的实践：减少模型训练的碳足迹在人工智能（AI）技术日新月异的今天，其对社会经济的推动作用日益显著。然而，随着AI应用的广泛深入，一个不容忽视的问题逐渐浮出水面——AI模型训练过程中的高能耗与碳排放。据估计，全球数据中心每年消耗的电量约占全球总...

人工智能 2025-07-18 人工智能

58阅读

分布式ai：边缘计算与云端协同的架构

标题：分布式AI：边缘计算与云端协同的架构探索随着人工智能技术的飞速发展，其在各行各业的应用日益广泛，从智能家居到自动驾驶，从医疗诊断到金融风控，AI正深刻改变着我们的生活方式和工作模式。然而，面对海量数据处理、低延迟响应以及隐私保护等挑战，传统的集中式A...

AIGC 2025-06-27 人工智能

103阅读

ai与能源消耗：大模型训练的碳足迹争议

标题：AI与能源消耗：大模型训练的碳足迹争议在人工智能（AI）技术日新月异的今天，大型语言模型、深度学习网络等先进算法正以前所未有的速度推动着科技进步和社会变革。然而，随着这些AI大模型性能的不断提升，其背后隐藏的能源消耗问题也逐渐浮出水面，引发了广泛的争...

AIGC 2025-06-27 人工智能

96阅读

基于spark的大规模数据挖掘

标题：基于Spark的大规模数据挖掘：技术、挑战与应用在大数据时代，数据的规模、复杂性和生成速度都在以前所未有的速度增长，这对数据处理和分析能力提出了更高要求。Apache Spark，作为一个开源的分布式计算系统，凭借其内存计算的优势、高效的数据处理速度...

生成式AI 2025-06-21 大数据

82阅读

数据与深度学习：如何构建高效神经网络

标题：数据与深度学习：构建高效神经网络的策略与实践在人工智能领域，深度学习与大数据的结合正引领着一场技术革命。深度学习，作为机器学习的一个分支，通过构建多层神经网络模型来模拟人脑的学习过程，实现了对复杂数据的高效处理与精准预测。而这一切成就的背后，离不开高...

大数据 2025-06-12 大数据

76阅读

数据预测分析模型发展趋势分析：深度学习与强化学习

标题：数据预测分析模型的发展趋势：深度学习与强化学习的融合探索随着信息技术的飞速发展，数据已成为21世纪最宝贵的资源之一。在海量数据的浪潮中，如何高效地提取有价值的信息，进行精准预测，成为企业决策、科学研究乃至日常生活的关键。在此背景下，数据预测分析模型，...

AIGC 2025-06-10 大数据

95阅读

大规模语言模型从理论到实践 LLaMA分布式训练实践

大规模语言模型从理论到实践 LLaMA分布式训练实践作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 1. 背景介绍 1.1 问题的由来随着深度学习的快速发展，大规模语言模型（La...

生成式AI 2024-09-19 人工智能

439阅读

论文分析｜高效长文本生成的技术与应用

Preface 前言目前大模型公司很多在追求长文a本，对算力需求极大，如何能够现实地处理该问题很重要。特别是随着Transformer模型尺寸和复杂性的增长，它们在训练期间的内存需求呈指数级增加。语言模型训练的瓶颈在于显存占用非常大，这需要创...

生成式AI 2024-08-30 人工智能

461阅读

探索Llama 3.1 : 405B参数模型：部署、硬件配置、测试与训练的心得

引言随着人工智能技术的快速发展，大规模语言模型（Large Language Models, LLMs）在自然语言处理（NLP）领域取得了显著的突破。MetaAI最新发布的Llama 3.1 : 405B参数模型，凭借其庞大的参数规模和先进的架构，展...

大数据 2024-08-30 人工智能

1512阅读

一文看懂llama2（原理&模型&训练）

Llama2（大型语言模型2） Llama2（大型语言模型2）主要基于近年来火爆的Transformer架构。下面是Llama2的几个核心原理： Transformer 架构: Llama2采用了Transformer网络，它通过自注意力机制来处理...

人工智能 2024-08-22 人工智能

548阅读

llama-factory源码详解——以DPO为例

本文记录了我在学习 llama-factory过程中对代码运行过程的梳理代码入口——src/train.py from llamafactory.train.tuner import run_exp def main( : run_exp...

大数据 2024-08-18 人工智能

1391阅读

LLAMA Factory: 简洁高效的大语言模型训练平台

LLAMA Factory: 简洁高效的大语言模型训练平台 LLaMA-Factory易于使用的LLM微调框架（LLaMA, BLOOM, Mistral, 百川， Qwen, ChatGLM）。项目地址:https://gitcode.com/gh_...

大数据 2024-08-17 人工智能

1174阅读

【项目记录】LLaMA-Factory + ModelScope 指令监督微调

LLaMA-Factory是大模型微调框架，内部集成了多种微调方法，可以直接调用。具体做法可以从官方github上找到：https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md...

大数据 2024-08-10 人工智能

950阅读

部署LLaMA-Factory及微调大模型测试

安装过程安装依赖按照GitHub上介绍的过程安装即可GitHub - hiyouga/LLaMA-Factory: Unify Efficient Fine-Tuning of 100+ LLMshttps://github.com/hiyouga...

生成式AI 2024-08-04 人工智能

638阅读

第43篇：实现企业级大型AIGC项目：模型并行与分布式训练

在构建企业级大型AIGC（人工智能生成内容）项目时，模型并行与分布式训练是提升计算效率和处理能力的关键技术。随着模型规模和数据量的不断增长，单台设备的计算能力往往无法满足需求。因此，利用多台设备进行并行计算和分布式训练成为了必然选择。本文将深入讲解模型并行...

人工智能 2024-07-27 人工智能

448阅读

Stable Diffusion秋叶AnimateDiff与TemporalKit插件冲突解决

文章目录 Stable Diffusion秋叶AnimateDiff与TemporalKit插件冲突解决描述错误描述：找不到模块imageio.v3 解决：参考地址其他文章推荐：专栏：人工智能基础知识点专栏：大语言模型LL...

生成式AI 2024-07-18 人工智能

817阅读

【人工智能】一文看懂 LLaMA 2：原理、模型与训练

LLaMA 2（Large Language Model for AI Modeling and Assistance）是近年来广受关注的大规模语言模型之一。它被广泛应用于自然语言处理（NLP）任务，如文本生成、机器翻译和问答系统。本文将深入介绍LLaMA...

大数据 2024-07-15 人工智能

564阅读

一文看懂Llama 2：原理、模型与训练

一文看懂Llama 2：原理、模型与训练 Llama 2是一种大规模语言模型（LLM），由Meta（原Facebook）研发，旨在推动自然语言处理（NLP）领域的发展。本文将详细介绍Llama 2的原理、模型架构及其训练方法，以帮助读者深入理解这一技术...

生成式AI 2024-06-25 人工智能

820阅读

[Bug]使用Transformers 微调 Whisper出现版本不兼容的bug

错误的现象 ImportError Traceback (most recent call last <ipython-input-20-6958d7eed552> in ( from transformers...

大数据 2024-06-23 人工智能

736阅读

20K star！搞定 LLM 微调的开源利器LLaMA Factory

20K star！搞定 LLM 微调的开源利器LLaMA Factory 关于LLM 微调优化型技术计算型技术 LLaMA Factory 是什么使用 LLaMA Factory 模型导出 LLaMA-Factory 结构总结项目...

AIGC 2024-06-10 人工智能

788阅读

快手版Sora「可灵」开放测试：生成超120s视频，更懂物理，复杂运动也能精准建模

什么？疯狂动物城被国产AI搬进现实了？与视频一同曝光的，是一款名为「可灵」全新国产视频生成大模型。它采用了Sora相似的技术路线，结合多项自研技术创新，生成的视频不仅运动幅度大且合理，还能模拟物理世界特性，具备强大的概念组合能力和想象力。数据上看...

大数据 2024-06-06 人工智能

540阅读

什么是LLM大模型训练，详解Transformer结构模型

本文分享自华为云社区《LLM 大模型学习必知必会系列(四：LLM训练理论篇以及Transformer结构模型详解》，作者：汀丶。 1.模型/训练/推理知识介绍深度学习领域所谓的“模型”，是一个复杂的数学公式构成的计算步骤。为了便于理解，我们以一...

生成式AI 2024-06-04 人工智能

596阅读

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE 性能强劲成本更低

在大模型技术迅速发展的背景下，昆仑万维公司开源了一个具有里程碑意义的稀疏大型语言模型Skywork-MoE。这个模型不仅在性能上表现出色，而且还大幅降低了推理成本，为应对大规模密集型LLM带来的挑战提供了有效的解决方案。 Skywork-MoE模型特点:...

AIGC 2024-06-04 人工智能

517阅读

昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE

2024年6月3日，昆仑万维宣布开源了一个性能强劲的2千亿稀疏大模型，名为 Skywork-MoE。这个模型是在之前开源的 Skywork-13B 模型的基础上扩展而来的，是首个完整应用并落地 MoE Upcycling 技术的开源千亿级 MoE 大模型。...

大数据 2024-06-03 人工智能

443阅读

7B？13B？175B？解读大模型的参数

大模型也是有大有小的，它们的大小靠参数数量来度量。GPT-3就有1750亿个参数，而Grok-1更是不得了，有3140亿个参数。当然，也有像Llama这样身材苗条一点的，参数数量在70亿到700亿之间。这里说的70B可不是指训练数据的数量，而是指模型中...

生成式AI 2024-06-03 人工智能

1042阅读

32专家MoE大模型免费商用！性能全面对标Llama3，单token推理消耗仅5.28%

每个token只需要5.28%的算力，精度就能全面对标Llama 3。开源大模型，再添一位重量级选手—— 来自浪潮信息的32专家MoE模型，源2.0-M32。不仅拥有极高的回报投入比，而且全面开放，训练代码和模型权重都可任意下载，商业使用也免费、无需...

生成式AI 2024-05-30 人工智能

484阅读

探秘Faster Whisper：一款加速 Whisper 模型训练的高效工具

探秘Faster Whisper：一款加速 Whisper 模型训练的高效工具项目地址:https://gitcode.com/SYSTRAN/faster-whisper 在自然语言处理（NLP）领域，Transformer架构的模型如Whis...

生成式AI 2024-05-28 人工智能

692阅读

DLRover 如何拯救算力浪费？10 分钟自动定位故障机，1 秒内保存 Checkpoint！

欢迎大家在 GitHub 上 Star 我们：分布式全链路因果学习系统 OpenASCE:https://github.com/Open-All-Scale-Causal-Engine/OpenASCE 大模型驱动的知识图谱 OpenSPG:http...

人工智能 2024-05-13 人工智能

453阅读

理论+实践，带你了解分布式训练

本文分享自华为云社区《大模型LLM之分布式训练》，作者：码上开花_Lancer。随着语言模型参数量和所需训练数据量的急速增长，单个机器上有限的资源已无法满足大语言模型训练的要求。需要设计分布式训练（Distributed Training）系统来解决...

AIGC 2024-05-09 人工智能

593阅读

史上最大重建25km²！NeRF-XL：真正有效利用多卡联合训练！

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：NeRF-XL: Scaling NeRFs with Multiple GPUs 论文链接：https://research.nvidia.com/labs/toronto-ai/nerfx...

大数据 2024-04-30 人工智能

476阅读

2024-03-26 AIGC-大模型学习路线

摘要: 2024-03-26 AIGC-大模型学习路线大模型学习路线建议先从主流的Llama开始，然后选用中文的Qwen/Baichuan/ChatGLM，先快速上手体验prompt工程，然后再学习其架构，跑微调脚本如果要深入学习，建...

大数据 2024-04-11 人工智能

1663阅读

提高 AI 训练算力效率：蚂蚁 DLRover 故障自愈技术的创新实践

本文来自蚂蚁 DLRover 开源负责人王勤龙（花名长凡）在 2024 全球开发者先锋大会(GDC 的分享——《DLRover 训练故障自愈：大幅提升大规模 AI 训练的算力效率》。王勤龙，长期在蚂蚁从事 AI 基础设施的研发，主导了蚂蚁分布式训练的弹...

大数据 2024-04-09 人工智能

497阅读

马斯克突发Grok 1.5！上下文长度至128k、HumanEval得分超GPT-4

就在刚刚，马斯克Grok大模型宣布重大升级。难怪之前突然开源了Grok-1，因为他有更强的Grok-1.5了，主打推理能力。来自xAI的官方推送啥也没说，直接甩链接。主打一个“字少事大” 图片新版本Grok有啥突破？一是上下文长度飙升，从8192...

人工智能 2024-04-01 人工智能

445阅读

开源11天，马斯克再发Grok-1.5！128K代码击败GPT-4

Grok-1官宣开源不过半月，新升级的Grok-1.5出炉了。刚刚，马斯克xAI官宣，128K上下文Grok-1.5，推理能力大幅提升。并且，很快就会上线。 11天前，Grok-1模型的权重和架构开源，展示了Xai在去年11月之前取得的进展。 Gr...

生成式AI 2024-03-29 人工智能

469阅读

Grok-1.5官网体验入口马斯克xAI最新超长文本模型使用地址

当地时间 3 月 28 日，人工智能初创公司xAI宣布即将推出Grok-1.5模型，该模型具有长语境理解和高级推理能力。不久后，Grok-1.5将向X平台的用户和早期测试者开放。 Grok-1.5是一种先进的大型语言模型，具有出色的长文本理解和推理能力。它...

生成式AI 2024-03-29 人工智能

491阅读

X AI 发布Grok-1.5更新：性能显著提升支持128K上下文长度

昨天，X AI 发布了其最新的大型语言模型更新——Grok-1.5。该版本在编码和与数学相关的任务中表现出了显著的性能提升。据详细介绍，Grok-1.5在 MATH 基准测试中获得了50.6%的分数，在 GSM8K 基准测试中获得了90%的分数，这标志着...

AIGC 2024-03-29 人工智能

454阅读

llama factory学习笔记

模型模型名模型大小默认模块 Template Baichuan2 7B/13B W_pack baichuan2 BLOOM 560M/1.1B/1.7B/3B/7.1B/176B query_key_value - BLOOM...

大数据 2024-03-28 人工智能

769阅读

【在线回放】NVIDIA GTC 2024 大会 | 如何降低 AI 工程成本？蚂蚁从训练到推理的全栈实践

本文内容来源于蚂蚁集团 AI Infra部门负责人张科，在 GTC 2024 大会 China AI Day 线上专场的演讲。在演讲中张科分享了 AI 工程当前的现状和主要挑战，以及蚂蚁集团在 AI 工程领域的实践经验和开源项目，也欢迎 AI 工程领域的同...

AIGC 2024-03-27 人工智能

525阅读

50+国内外大模型专家齐聚，全球机器学习技术大会第二批嘉宾阵容公布！

50+ 国内外大模型重磅专家智谱、百川、零一万物、智源、面壁智能微软、阿里通义、小米、北大、复旦 eBay、恒生、达观、金山、度小满等共同探讨 AI 前沿发展与落地实践全球机器学习技术大会第二批嘉宾重磅出炉 Daniel Povey 博士毕业于英...

人工智能 2024-03-20 人工智能

443阅读

字节万卡集群技术细节公开：2天搞定GPT-3训练，算力利用率超英伟达Megatron-LM

随着对Sora技术分析的展开，AI基础设施的重要性愈发凸显。来自字节和北大的一篇新论文在此时吸引关注：文章披露，字节搭建起的万卡集群，能在1.75天内完成GPT-3规模模型（175B）的训练。具体来说，字节提出了一个名为MegaScale的生产系...

大数据 2024-03-01 人工智能

468阅读

使用deepspeed继续训练LLAMA

目录 1. 数据训练配置 2. 模型载入 3. 优化器设置 4. DeepSpeed 设置 5. DeepSpeed 初始化 6. 模型训练 LLAMA 模型子结构： 1. 数据训练配置利用 PyTorch 和 Transfo...

生成式AI 2024-02-15 人工智能

549阅读

拼多多大模型团队招兵买马；披荆斩棘的AI博士们；淘宝双十一AIGC设计经验分享；亚马逊免费AI技能培训；Claude新版本支持200K token | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 拼多多杀入大模型，年薪百万招兵买马 https://careers.pinduoduo.com/jobs 拼多多已经成立了一个数十人的...

人工智能 2024-02-08 人工智能

591阅读

谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络

2005年，划时代之作「The Graph Neural Network Model」的问世，将图神经网络带到每个人面前。在此之前，科学家处理图数据的方式是，在数据预处理阶段，将图转换为一组「向量表示」。而CNN的出现彻底改变这种信息丢失的弊端，近2...

生成式AI 2024-02-07 人工智能

469阅读

【AIGC扫盲】人工智能大模型快速入门

人工智能大模型的技术框架主要有以下几种： TensorFlow：这是一个由Google Brain团队开发的开源库，用于进行高性能数值计算，特别是用于训练和运行深度学习模型。TensorFlow提供了一种称为计算图的编程模型，它允许用户定义复杂的计算...

生成式AI 2024-02-07 人工智能

561阅读

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法

优化语义分割模型常用的损失有Soft Jaccard损失，Soft Dice损失和Soft Tversky损失，但它们都和软标签不兼容，所以无法支持一些重要的训练技术（例如标签平滑，知识蒸馏，半监督学习，多标注员等）。另一方面，语义分割常用的评价指标...

大数据 2024-02-06 人工智能

525阅读

【部署LLaMa到自己的Linux服务器】

部署LLaMa到自己的Linux服务器一、官方方法（知道就好，具体操作用不上这个） 1、Llama2 项目获取方法1：有git可以直接克隆到本地方法2：直接下载 2、LLama2 项目部署 3、申请Llama2许可 4、下载模型权重...

生成式AI 2024-02-04 人工智能

993阅读

LLaMA Efficient Tuning

文章目录 LLaMA Efficient Tuning 安装数据准备浏览器一体化界面单 GPU 训练 train_bash 1、预训练 pt 2、指令监督微调 sft 3、奖励模型训练 rm 4、PPO 训练 ppo 5、DPO 训练...

AIGC 2024-01-29 人工智能

480阅读

人工智能时代：让AIGC成为你的外部智慧源（文末送书）

?个人主页：聆风吟?系列专栏：数据结构、网络奇遇记?少年有梦不应止于心动，更要付诸行动。文章目录 ?前言一. 什么是AIGC? 二. AIGC如何运作？ 2.1 步骤一：收集数据 2.2 步骤二：模型训练 2.3 步骤三：内容生成...

生成式AI 2024-01-26 人工智能

545阅读

LLaMA Board: 通过一站式网页界面快速上手 LLaMA Factory

原文：https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md ? 加入我们的微信群。 [ English | 中文 ] LLaMA Board: 通过一站式网页界面快速上手...

大数据 2024-01-21 人工智能

624阅读

AIGC和ChatGPT推进百度、阿里、腾讯、华为大模型技术创新

生成式AI 2024-01-15 人工智能

627阅读