打造自己的大模型｜01篇LLaMA-Factory微调Llama3和其占用资源分析

面对训练好的通用的大语言模型，例如Llama3-8B，虽然在认知理解，知识问答，逻辑推理，数学，代码方面都表现很好。但是其在特定领域的知识是比较缺乏的，而且对中文问答表现也不是很好，经常出现中英文混答的问题。

所以打造一个属于自己的大模型，非常有必要！

由于原生的Llama3模型训练的中文语料占比非常低，因此在中文的表现方面略微欠佳！本教程就以Llama3-8B-Instruct开源模型为模型基座，通过开源程序LLaMA-Factory来进行中文的微调，提高Llama3的中文能力！

认识LLaMA-Factory

LLaMA-Factory是一个易用且高效的LLM微调工具箱。

支持多种模型支持多种训练方法，例如增量预训练，指令跟随微调，PPO训练，DPO训练等支持多种高效微调方法，例如全参数微调，冻结微调，LoRA微调等

这里我们选择指令跟随微调。更多的微调训练范式可以参考之前的文章XTuner微调LLM实践。

指令跟随微调，一般是采用SFT**有监督的数据集进行微调，SFT数据集，表现形式一般是一问一答，一条数据一个标签的格式。

安装LLaMA-Factory

从Github上面下载最新的代码，并安装

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

官方提供了一键运行方式，可以分别实现对 Llama3-8B-Instruct 模型进行 LoRA 微调、推理和合并。

llamafactory-cli train examples/train_lora/llama3_lora_sft.yaml
llamafactory-cli chat examples/inference/llama3_lora_sft.yaml
llamafactory-cli export examples/merge_lora/llama3_lora_sft.yaml

但是我们选择，通过LLaMA Board实现可视化微调（由Gradio驱动），启动命令如下：

llamafactory-cli webui

访问链接地址 http://127.0.0.1:7860/

可以看到有Train（训练），Evaluate&Predict（评估和预测），Chat（对话），Export（导出）四个模块。

准备模型

我们可以选择从 OpenXLab** 上下载 Meta-Llama-3-8B-Instruct 的权重。

git lfs install
git clone https://code.openxlab.org.cn/MrCat/Llama-3-8B-Instruct.git Meta-Llama-3-8B-Instruct

点击Chat，选择好我们的模型名称LLaMA3-8B-Chat，模型位置path需要更改成，我们自己下载的离线模型位置。

可以看到，推理引擎可选：huggingface**，vllm。我们选择huggingface，然后点击加载模型。

加载占用的显存大小约16GB：

准备数据集

准备数据集，需要庞大且细致的工程。

数据工程概述：

数据收集（可以从网络收集，或者利用现有的大模型，例如GPT-4来生成）数据清洗数据格式转换，转换成特定的格式，一般是json 得到准备好的数据集Dataset**，一般我们准备好的数据集，还需要分成训练数据集和测试数据集

本教程我们选择LLaMA-Factory自带的数据集进行微调，位置在 /root/LLaMA-Factory/data/。

选择alpaca_gpt4_zh数据集，文件大小约为 34MB，选择预览数据集。

开始训练

包含微调方法有：full，freeze，lora。

训练方式包括：Supervised Fine-Tuning，Reword Modeling，PPO，DPO等。

为了节省算力和运行时间，我们选择LoRA微调方法，采用指令监督微调。在原有的大模型之前添加一个Adapter层。

让LLM套上LoRA之后，有了新的灵魂。关于LoRA的细节，可以参考文章XTuner微调LLM实践。

Web UI上面展示的训练指令：

展示的就是我们微调大模型常见的超参数配置，有关于超参数的分析，会在之后的文章给大家分享。

训练日志展示：

训练所需要的资源

我们的微调机器配置，是24GB显存的A100单卡机。

此时占用显存空间约为22GB。

完成LoRA微调，花费了9.5小时：

如何系统的去学习大模型LLM ？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

事实上，抢你饭碗的不是AI，而是会利用AI的人。

继科大讯飞、阿里、华为等巨头公司发布AI产品后，很多中小企业也陆续进场！超高年薪，挖掘AI大模型人才！如今大厂老板们，也更倾向于会AI的人，普通程序员，还有应对的机会吗？

与其焦虑……

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高。

针对所有自学遇到困难的同学们，我帮大家系统梳理大模型学习脉络，将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, ?有需要的小伙伴，可以扫描下方二维码领取?↓↓↓

?CSDN大礼包?：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）?

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

二、640套LLM大模型报告合集

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

三、LLM大模型系列视频教程

四、LLM大模型开源教程（LLaLA/Meta/chatglm/chatgpt）

LLM大模型学习路线 ↓

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。

内容：

L1.1 人工智能简述与大模型起源 L1.2 大模型与通用人工智能 L1.3 GPT模型的发展历程 L1.4 模型工程 L1.4.1 知识大模型 L1.4.2 生产大模型 L1.4.3 模型工程方法论 L1.4.4 模型工程实践 L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。

内容：

L2.1 API接口 L2.1.1 OpenAI API接口 L2.1.2 Python接口接入 L2.1.3 BOT工具类框架 L2.1.4 代码示例 L2.2 Prompt框架 L2.3 流水线工程 L2.4 总结与展望

阶段3：AI大模型应用架构实践

目标：深入理解AI大模型的应用架构，并能够进行私有化部署。

内容：

L3.1 Agent模型框架 L3.2 MetaGPT L3.3 ChatGLM L3.4 LLAMA L3.5 其他大模型介绍

阶段4：AI大模型私有化部署

目标：掌握多种AI大模型的私有化部署，包括多模态和特定领域模型。

内容：

L4.1 模型私有化部署概述 L4.2 模型私有化部署的关键技术 L4.3 模型私有化部署的实施步骤 L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, ?有需要的小伙伴，可以扫描下方二维码领取?↓↓↓

?CSDN大礼包?：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）?

总结

### 文章总结
#### 现有大语言模型的局限性
- 通用大语言模型如Llama3-8B在认知理解、知识问答、逻辑推理、数学和代码方面表现优异。
- 但缺乏特定领域知识，中文问答效果不佳，常出现中英文混答现象。
#### 打造专属大语言模型的必要性
- 鉴于Llama3原始模型的中文训练语料不足，提升中文能力是当务之急。
- 本教程通过LLaMA-Factory对Llama3-8B-Instruct进行中文微调，提高其中文处理能力。
#### LLaMA-Factory简介
- 一个高效易用的LLM微调工具箱，支持多种模型、训练方法和微调策略。
- 本教程选择指令跟随微调方法进行训练。
#### 安装与准备
- 下载并安装LLaMA-Factory及其所需库。
- 通过LLaMA Board实现可视化微调，便于操作。
- 准备模型和数据集：下载Meta-Llama-3-8B-Instruct模型，并使用自带或自定义数据进行中文微调。
#### 数据集准备与训练
- 数据收集、清洗、格式转换及分为训练与测试集。
- 选择LoRA微调和指令监督微调作为节省算力的解决方案。
- 微调过程中，通过Web UI设置超参数，并监控训练日志。
- 在24GB显存的A100单卡机上完成LoRA微调，耗时约9.5小时。
#### 学习建议与资料分享
- 强调AI时代，掌握AI工具而非担忧被取代的重要性。
- 提供LLM大模型学习资料，包括经典书籍、行业报告、视频教程、学习路线及开源教程。
- 学习路线涵盖基础理解、API应用开发工程、应用架构实践和私有化部署等四个阶段。
#### 资源领取
- 扫描二维码领取包含LLM大模型书籍、报告、视频、学习路线和教程的全面资源包。