当前位置:AIGC资讯 > AIGC > 正文

AI | LLaMA-Factory 一个好用的微调工具

‘’

LLama Factory,这个工具能够高效且低成本地支持对 100 多个模型进行微调。LLama Factory 简化了模型微调的过程,并且易于访问,使用体验友好。此外,它还提供了由 Hiyouga 提供的 Hugging Face 空间,可用于对模型进行微调。

下载LLaMA-Factory

​
#下载LLaMA-Factory
git clone https://github.com/hiyouga/LLaMA-Factory.git
#创建一个环境
conda create -n llama_factory python=3.10
#切换到llama_factory环境
conda activate llama_factory
#进入到LLaMA-Factory目录下
cd LLaMA-Factory
#下载LLaMA-Factory所需要的包
pip install -r requirements.txt

​

开始

启动页面:

python src\train_web.py

进入可视化页面:

支持 Lora 和 GaLore 配置,以减少 GPU 的使用。用户可以通过简单的滑块轻松更改参数,如 dropout、epochs、批次大小等。同时,也有多个数据集选项可供选择以微调你的模型。正如本文所述,LLama Factory支持许多模型,包括不同版本的 LLama、mistral 和 Falcon。它还支持像 galore、badm 和 Lora 这样的高级算法,提供诸如flash attention、位置编码和缩放等各种功能。

此外,你还可以集成像 TensorBoard、VanDB 和 MLflow 这样的监控工具。为了更快地进行推理,你还可以使用Gradio 和 CLI。本质上,LLama Factory 提供了一系列多样化的选项,以增强模型性能并简化微调过程。

LLaMA-Factory有自带的数据集也可以自己生成数据集然后导入:

自制微调数据集代码下载地址:

https://github.com/KevinFanng/makeChatGLM3FinetuneData/blob/main/finetunningData_for_qwen_piliang.py

自制微调数据集代码读取Excel示例:

https://github.com/KevinFanng/makeChatGLM3FinetuneData/blob/main/%E5%8E%9F%E5%A7%8B%E6%95%B0%E6%8D%AE%E6%A0%BC%E5%BC%8F.xlsx

 自制微调数据集代码关键注释:

预览命令:

开始微调,点击开始:

微调所需要的时间百分比:

报错:

我当时跑的期间也会有报错,但是只要跟着教程走,就不会错,当时我的报错是关于torch版本的问题,原因是没有下载对应cuda的torch, 我当时候的解决方案是去torch官网下载对应自己版本的cuda。

进入PyTorch官网:PyTorch(魔法)

Windows+R打开cmd小黑框:

查看你的cuda版本:nvidia-smi

找到对应的cuda版本下载即可!

可视化界面偶尔可能也出现报错,我们重新刷新页面即可继续

结语

有效的微调已成为大型语言模型(LLMs)适应特定任务的必要条件之一。然而,这需要一定的努力,有时也相当具有挑战性。随着 Llama-Factory 的引入,这一全面的框架让训练更加高效,用户无需编写代码即可轻松为超过 100 个 LLMs 定制微调。

现在,很多人对大型语言模型(LLMs)更加好奇,有这样想法的开发者可以试试 Llama-Factory 是否可以调整自己的模型。这有助于开源社区的成长和活跃。Llama-Factory 正变得广为人知,甚至已被列入 Awesome Transformers3 中,作为高效微调 LLMs 的工具。

我们希望本文能鼓励更多开发者使用这一框架来创建有价值的 LLMs。不过请记得,在使用Llama-Factory微调LLMs时,遵守模型的许可规则很重要。

至此,本文结束。我们看到了如今在几分钟内微调任何模型是多么容易。我们还可以使用 Hugging Face CLI 将这个模型推送到 Hugging Face Hub 上。

更新时间 2024-06-08