分布式训练第2页

五种资源类别，如何提高大语言模型的资源效率，超详细综述来了

近年来，大型语言模型（LLM）如 OpenAI 的 GPT-3 在人工智能领域取得了显著进展。这些模型，具有庞大的参数量（例如 1750 亿个参数），在复杂度和能力上实现了飞跃。随着 LLM 的发展趋势朝着不断增大的模型规模前进，这些模型在从智能聊天机器...

大数据 2024-01-15 人工智能

1188阅读

拆掉英伟达护城河，细节曝光！世界最快超算用3072块AMD GPU训完超万亿参数LLM

用AMD的软硬件系统也能训练GPT-3.5级别的大模型了。位于美国橡树岭国家实验室（Oak Ridge National Laboratory）的全世界最大的超算Frontier，集合了37888个MI250X GPU和9472个Epyc 7A53 C...

大数据 2024-01-15 人工智能

853阅读

实战AI大模型：AIGC及经典模型

今天，人工智能技术的快速发展和广泛应用已经引起了大众的关注和兴趣，它不仅成为技术发展的核心驱动力，更是推动着社会生活的全方位变革。特别是作为AI重要分支的深度学习，通过不断刷新的表现力已引领并定义了一场科技革命。大型深度学习模型（简称AI大模型）以其强大的...

大数据 2024-01-14 人工智能

1206阅读

国内多所高校共建开源社区LAMM，加入多模态语言模型大家庭的时候到了

ChatGPT问世以来，大语言模型（LLM）实现了跳跃式发展，基于自然语言进行人机交互的AI范式得到广泛运用。然而，人类与世界的交互中不仅有文本，其他诸如图片、深度等模态也同样重要。然而，目前的多模态大语言模型（MLLM）研究大多数闭源，对高校和大多数研...

大数据 2024-01-14 人工智能

1021阅读

AIGC之GPT-4：GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略

AIGC之GPT-4：GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议、使用方法、案例应用(计算能力/代码能力/看图能力等之详细攻略解读：在2022年11月横空出世的ChatGPT，打遍天下无敌手的时候，就知道会有这么一天，...

AIGC 2024-01-07 人工智能

891阅读

人工智能时代：AIGC的横空出世

?个人主页：聆风吟?系列专栏：数据结构、网络奇遇记?少年有梦不应止于心动，更要付诸行动。文章目录 ?前言一. 什么是AIGC? 二. AIGC的主要特征 2.1 文本生成 2.2 图像生成 2.3 语音生成 2.4 视频生成三...

AIGC 2024-01-07 人工智能

953阅读

一个评测模型+10个问题，摸清盘古、通义千问、文心一言、ChatGPT的“家底”！...

‍数据智能产业创新服务媒体 ——聚焦数智 · 改变商业毫无疑问，全球已经在进行大模型的军备竞赛了，“有头有脸”的科技巨头都不会缺席。昨天阿里巴巴内测了通义千问，今天华为公布了盘古大模型的最新进展。不久前百度公布了文心一言...

生成式AI 2024-01-06 人工智能

966阅读

同花顺推出问财大模型HithinkGPT 开启内测申请

同花顺问财推出了 HithinkGPT 大模型，采用 transformer 的 decoder-only 架构。提供7B、13B、30B、70B 和130B 五种版本选择，最大允许32k 文本输入，支持 API 接口调用、网页嵌入、共建、私有化部署等能力...

AIGC 2024-01-03 人工智能

870阅读

100000000！文心一言披露最新用户规模

“文心一言用户规模突破1亿。” 12月28日，百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在第十届WAVE SUMMIT深度学习开发者大会上宣布。会上，王海峰以《文心加飞桨，翩然赴星河》为题作了主旨演讲，分享了飞桨和文心的最新成果。...

AIGC 2023-12-30 人工智能

847阅读

百度CTO王海峰：文心一言用户规模破1亿

“文心一言用户规模突破1亿。”12月28日，百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在第十届WAVE SUMMIT深度学习开发者大会上宣布。会上，王海峰以《文心加飞桨，翩然赴星河》为题作了主旨演讲，分享了飞桨和文心的最新成果。...

AIGC 2023-12-28 人工智能

836阅读

百度文心一言，不做ChatGPT的中国翻版

‍数据智能产业创新服务媒体 ——聚焦数智 · 改变商业 3月16日，百度的文心一言终于正式邀请测试了。据李彦宏介绍，文心一言可以实现文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等。通过观看直...

大数据 2023-12-26 人工智能

901阅读

关于生成式语言大模型的一些工程思考 paddlenlp & chatglm & llama

生成式语言大模型，随着chatgpt的爆火，市场上涌现出一批高质量的生成式语言大模型的项目。近期百度飞桨自然语言处理项目paddlenlp发布了2.6版本。更新了以下特性：全面支持主流开源大模型Bloom, ChatGLM, GLM, Llama, OPT...

生成式AI 2023-12-22 人工智能

970阅读

大语言模型分布式训练的量化分析与优秀实践,以 GPT-175B 为例

一、Transformer 大语言模型的 SOTA 训练技术 1、大语言模型的发展背景与挑战首先和大家分享下大语言模型的发展背景。过去的几年内，无论从数据量的维度还是从模型规模的维度，语言模型规模都扩大了非常多的数量级。随着数据量和模型规模的扩大，也...

AIGC 2023-12-07 人工智能

912阅读

Python从零开始进行AIGC大模型训练与推理

本专栏将详细介绍从零开始进行AIGC大模型训练与推理（Python），包括文本生成（GPT系列）和图片生成（Stable Diffusion系列）等，初步计划从以下提纲逐步进行博文分享，欢迎关注。 1 AIGC（人工智能生成）技术背景与发...

人工智能 2023-12-04 人工智能

859阅读

LLMs之Colossal-LLaMA-2：Colossal-LLaMA-2的简介(基于LLaMA-2架构+中文优化+扩充词表+仅千美元成本)、安装、使用方法之详细攻略

LLMs之Colossal-LLaMA-2：Colossal-LLaMA-2的简介(基于LLaMA-2架构+中文优化+扩充词表+仅千美元成本、安装、使用方法之详细攻略导读：2023年9月25日，Colossal-AI团队推出了开源模型Colos...

AIGC 2023-12-02 人工智能

1084阅读

通义千问720亿参数模型开源，率先实现“全尺寸全模态”开源

12月1日，阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练，在10个权威基准测评中夺得开源模型最优成绩，在部分测评中超越闭源的GPT-3.5和GPT-4。在英语任务上，Qwen-72B在MMLU基准测...

AIGC 2023-12-01 人工智能

1001阅读

深度解读AIGC存储解决方案

5月26日，2023数据基础设施技术峰会在苏州举办，腾讯云首席存储技术专家温涛受邀出席并分享了腾讯云领先的存储技术在AIGC场景中的应用，通过对AIGC业务流程和场景的提炼，从内容生成、内容审核和内容智理三要素介绍了如何智能的存储和管理数据。下面我们一起回...

大数据 2023-11-26 人工智能

1075阅读

淘天集团联合爱橙科技开源大模型训练框架Megatron-LLaMA

9月12日，淘天集团联合爱橙科技正式对外开源大模型训练框架——Megatron-LLaMA，旨在让技术开发者们能够更方便地提升大语言模型训练性能，降低训练成本，并保持和LLaMA社区的兼容性。测试显示，在32卡训练上，相比HuggingFace上直接获得的...

生成式AI 2023-11-24 人工智能

930阅读

腾讯披露最新大模型训练方法，可节省50%算力成本

在算力紧缺的背景下，如何提升大模型训练和推理的效率，并降低成本，成为业界关注的焦点。 11月23日，腾讯披露，腾讯混元大模型背后的自研机器学习框架Angel再次升级，大模型训练效率提升至主流开源框架的2.6倍，千亿级大模型训练可节省50%算力成本。升级后...

人工智能 2023-11-23 人工智能

896阅读

LLMs之Colossal-LLaMA-2：源码解读(train.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插

LLMs之Colossal-LLaMA-2：源码解读(train.py文件基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插件 →数据预处理(初始化分词器+数据处理器+数据加载器 ...

大数据 2023-11-22 人工智能

793阅读

QPS提升近10倍！解读飞桨加持下的文心一言满月成绩单

近期，一直犹抱琵琶半遮面的国内各路AI相关厂商，扎堆发布大模型。一时间，百“模”大战，鱼龙混杂。此前，作为全球第一个正式发布大模型的大厂，百度文心一言的一举一动，成为业界关注的焦点。就在4月19日，时隔文心一言发布1个月又3天，一张“百度飞桨对文心...

AIGC 2023-11-21 人工智能

910阅读

【云上探索实验室】活动小记-《使用 Amazon SageMaker 构建机器学习应用》《基于 Amazon SageMaker 构建细粒度情感分析应用》《基于Stable Diffusion模》

有幸参加亚马逊的【云上探索实验室】实验活动，活动围绕亚马逊 SageMaker开展。Amazon SageMaker 是一项完全托管的机器学习服务。借助 SageMaker，开发人员可以快速、轻松地构建和训练机器学习模型，然后直接将模型部署到生产就绪托管环...

人工智能 2023-11-20 人工智能

847阅读

【2023云栖】黄博远：阿里云人工智能平台PAI年度发布

本文根据2023云栖大会演讲实录整理而成，演讲信息如下：演讲人：黄博远 | 阿里云计算平台事业部资深产品专家、阿里云人工智能平台PAI产品负责人演讲主题：阿里云人工智能平台PAI年度发布 AIGC是我们这个时代的新机遇今年云栖大会，阿里云机器...

大数据 2023-11-16 人工智能

959阅读

详解超强ResNet变体NFNet：抛弃归一化后，性能却达到了最强！

本文经自动驾驶之心公众号授权转载，转载请联系出处。从上古时期一直到今天，Batch Norm (BN 一直都是视觉骨干架构里面很重要的一个环节。BN 使得研究人员可以训练更深的网络，并在训练集和测试集上实现更高的精度。Batch Norm 还可以平...

生成式AI 2023-11-13 人工智能

1146阅读

大语言模型之十五-预训练和监督微调中文LLama-2

这篇博客是继《大语言模型之十二 SentencePiece扩充LLama2中文词汇》、《大语言模型之十三 LLama2中文推理》和《大语言模型之十四-PEFT的LoRA》前面博客演示了中文词汇的扩充以及给予LoRA方法的预训练模型参数合并，并没有给出Lo...

大数据 2023-11-12 人工智能

1390阅读

全网最全ChatGPT/AIGC报告分析（365份）

本星球整理了365份ChatGPT/AIGC重磅专业报告（更新中…），部分目录如下，请读者搜索关键字，获取报告，学习参阅。 https://mp.weixin.qq.com/s/hvI2Hupjx_mnPh3YGyobww 1、计算机研究报告：Chat...

生成式AI 2023-11-08 人工智能

1028阅读

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微调+奖励模型训练+PPO 训练+DPO 训练】的简介、...

人工智能 2023-11-08 人工智能

1158阅读

马毅、沈向洋联手，首届CPAL开奖！16人获新星奖，华人学者占据半壁江山

就在昨天，首届CPAL简约学术会议，正式公布了新星奖获奖者名单！ CPAL专注于解决机器学习、信号处理、优化等领域中普遍存在的简约、低维结构问题，并探索低维结构在智能硬件与系统、交叉科学和工程等新兴方向的应用。创办这个会议的出发点，就是将其设计为一个...

人工智能 2023-11-07 人工智能

859阅读

大模型: 模型大了难在哪里？

大家好，我是Tim。自从GPT模型诞生以来，其参数规模就在不停的扩大。但模型并非简单的直接变大，需要在数据、调度、并行计算、算法和机器资源上做相应的改变。今天就来总结下，什么是大模型，模型变大的难在哪里以及对于CV/NLP或者搜推广场景上有什么应对策...

人工智能 2023-11-03 人工智能

1641阅读

全球最强长文本大模型，一次可读35万汉字：Baichuan2-192K上线

国内大模型创业公司，正在技术前沿创造新的记录。 10 月 30 日，百川智能正式发布 Baichuan2-192K 长窗口大模型，将大语言模型（LLM）上下文窗口的长度一举提升到了 192K token。这相当于让大模型一次处理约 35 万个汉字，长度...

AIGC 2023-11-01 人工智能

949阅读

OpenAI潜入黑客群聊！盗用ChatGPT被换成“喵喵GPT”，网友：绝对的传奇

当ChatGPT被黑客“入侵”时，OpenAI会如何应对? 掐断API，不让他们用?不不不。这帮极客们采取的做法可谓是剑走偏锋——反手一记《无间道》。图源备注：图片由AI生成，图片授权服务商Midjourney 故事是这样的。 OpenAI虽然在发布...

AIGC 2023-11-01 人工智能

880阅读

阿里云全面升级AI基础设施，中国大模型公司一半跑在阿里云上！

10月31日，在2023云栖大会上，阿里云CTO周靖人表示，面向智能时代，阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新，升级云计算体系，打造一朵AI时代最开放的云。在现场，周靖人公布了云计算基础能力的最新进展，升级了人工智能平台，并发布千亿...

人工智能 2023-10-31 人工智能

868阅读

通义千问APP下载官网入口通义千问手机版下载地址

在 2023 年的云栖大会上，阿里云CTO周靖人宣布，阿里云将升级其云计算体系，以适应智能时代的需要，从底层的算力到AI平台再到模型服务，阿里云将提供全栈技术创新。周靖人还宣布了阿里云通义千问2. 0 的发布，这是一款千亿级参数规模的大模型，以及阿里云百炼...

人工智能 2023-10-31 人工智能

935阅读

AI基础软件：如何自主构建大+小模型？

一、公司介绍九章云极DataCanvas以创造智能探索平台为使命，怀揣着助力全球企业智能升级的愿景，是中国人工智能基础软件领域的佼佼者。公司专注于自主研发的人工智能基础软件产品系列和解决方案，为用户提供全面的人工智能基础服务，旨在帮助用户在数智化转...

人工智能 2023-10-27 人工智能

1182阅读

腾讯混元大模型升级：新增“文生图”，代码能力大幅提升

10月26日，腾讯宣布，腾讯混元大模型迎来全新升级，并正式对外开放“文生图”功能，展示了其在图像自动生成领域的领先能力。升级后的腾讯混元中文能力整体超过GPT3.5，代码能力大幅提升20%，达到业界领先水平。作为实用级的通用大模型，腾讯混元大模型的应用...

AIGC 2023-10-26 人工智能

939阅读