alpaca 第5页 - AIGC资讯

中文LLaMA模型和指令精调的Alpaca大模型：中文数据进行二次预训练，进一步提升了中文基础语义理解能力

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用 CSDN 平台，自主完成项目设计升级，提升自身...

AIGC 2023-11-29 人工智能

916阅读

Llama-Factory的baichuan2微调

Llama-Factory：https://github.com/hiyouga/LLaMA-Factory/tree/main 请使用 --quantization_bit 4/8 来启用 QLoRA 训练。默认模块应作...

人工智能 2023-11-28 人工智能

1085阅读

Llama 及中文Alpaca模型部署测试

环境： Xeon E5-2680v4 16C 40G RAM WinServer 2019 Standard Edition Python 3.10 依赖库: accelerate==0.18.0 anyio==3.5.0 argon2-c...

生成式AI 2023-11-27 人工智能

714阅读

中文版LLaMA：Chinese-LLaMA-Alpaca

GitHub：GitHub - ymcui/Chinese-LLaMA-Alpaca: 中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs 以ChatGPT、GP...

人工智能 2023-11-27 人工智能

724阅读

使用 LoRA 技术对 LLaMA 65B 大模型进行微调及推理

前几天，Meta 发布了 LIMA 大模型，在LLaMA-65B的基础上，无需使用 RLHF，只用了 1000 个精心准备的样本数据进行微调，就达到了和 GPT-4 相媲美的程度。这激发了我探索 LLaMA 65B 大模型的兴趣。之前的一系列大模型相...

生成式AI 2023-11-27 人工智能

792阅读

自驱力超强的羊驼？斯坦福微调LLaMa

大型“指令调优”语言模型在新任务上展现了Zero-shot的卓越能力，但严重依赖于人类编写的指令数据，而这些数据在数量、多样性和创造性方面都是有限的。斯坦福科研人员引入了self-instruction框架，提高指令遵循能力来自我迭代进化，与Instr...

大数据 2023-11-26 人工智能

801阅读

【类ChatGPT】中文LLaMA-2、Alpaca-2 二代羊驼大模型体验

前言 Meta发布的一代LLaMA已经掀起了一股开源大模型热潮，也有很多相关工作不断涌现。最近Meta全新发布了Llama-2，效果更上一层楼。而且最重要的是模型可以相对随意分发了，不像一代一样，meta不让开发者发布基于llama模型训...

大数据 2023-11-26 人工智能

892阅读

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_sft_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的che

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_sft_with_peft.py文件 —模型训练前置工作(参数解析+配置日志 →模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer →数...

大数据 2023-11-26 人工智能

811阅读

Llama2通过llama.cpp模型量化 Windows&Linux本地部署

Llama2通过llama.cpp模型量化 Windows&Linux本地部署什么是LLaMA 1 and 2 LLaMA，它是一组基础语言模型，参数范围从7B到65B。在数万亿的tokens上训练的模型，并表明可以专门使用公开可用的数据...

生成式AI 2023-11-25 人工智能

1237阅读

LLMs：Chinese-LLaMA-Alpaca-2(基于deepspeed框架)的简介、安装、案例实战应用之详细攻略

LLMs：Chinese-LLaMA-Alpaca-2(基于deepspeed框架的简介、安装、案例实战应用之详细攻略导读：2023年07月31日，哈工大讯飞联合实验室，发布Chinese-LLaMA-Alpaca-2，本项目基于Meta发布的...

大数据 2023-11-25 人工智能

1244阅读

在中文LLaMA模型上进行精调

最近在开源项目ymcui/Chinese-LLaMA-Alpaca的基础上完成了自己的中文模型精调工作，形成了两个工具共享给大家。ymcui/Chinese-LLaMA-Alpaca 构建指令形式的精调文件如果用于精调，首先要准备精调数据，目标用途如...

人工智能 2023-11-24 人工智能

769阅读

微调 Code Llama 完整指南

一、前言今天这篇文章将向大家详细介绍如何对 Code Llama 进行微调，让它变成适合 SQL 开发的有利工具。对于编程开发任务，经过适当微调后的 Code Llama 的性能通常都会比普通的 Llama 强很多，特别是当我们针对具体任务进行优化时:...

生成式AI 2023-11-23 人工智能

937阅读

LLMs之LLaMA：《LLaMA: Open and Efficient Foundation Language Models》翻译与解读

LLMs之LLaMA：《LLaMA: Open and Efficient Foundation Language Models》翻译与解读导读：该论文提出了一个开源的大规模语言模型LLaMA，2048个A100-80G训练21天。该...

大数据 2023-11-22 人工智能

948阅读

大模型微调踩坑记录 - 基于Alpaca-LLaMa+Lora

前言为了使用开放权重的LLM(大语言模型，基于自己的训练集，微调模型，会涉及到如下一些技术要点：配置运行环境下载、加载基础模型收集语料、微调训练检验训练效果在实施过程中，遇到不少困难，因此写下这篇文档，做为记录。环境配置...

生成式AI 2023-11-22 人工智能

834阅读

斯坦福用几百块钱训练的alpaca，体验一下基于llama的7b和13b模型，据说比gpt3.0还牛，结果怎样？？你能信？

好久没写代码了，上头了，强撸了！ 1、自己买个GPU服务器（如果不训练，可以随便买个高内存的即可），有些网站很便宜，小时起租！ 2、alpaca和模型下载地址：GitHub - antimatter15/alpaca.cpp: Locally run...

AIGC 2023-11-21 人工智能

767阅读

大模型入门（四）—— 基于peft 微调 LLaMa模型

llama-7b模型大小大约27G，本文在单张/两张 16G V100上基于hugging face的peft库实现了llama-7b的微调。 1、模型和数据准备使用的大模型：https://huggingface.co/decapoda-resea...

大数据 2023-11-21 人工智能

884阅读

基于llama模型进行增量预训练

目录 1、llama模型转换(pytorch格式转换为HuggingFace格式 1.1、拉取Chinese-LLaMA-Alpaca项目 1.2、准备文件夹 1.3、下载llama官方原始模型 1.4、移动文件到指定位置 1.5、执行转换脚...

生成式AI 2023-11-21 人工智能

1118阅读

深入理解LLaMA, Alpaca, ColossalChat 系列模型

知乎：紫气东来https://zhuanlan.zhihu.com/p/618695885 一、从 LLaMA 到 Alpaca：大模型的小训练 1.1 LLaMA 概要与实践 LLaMA(Large Language Mo...

AIGC 2023-11-21 人工智能

842阅读

大语言模型-中文chatGLM-LLAMA微调

微调大语言模型-ChatGLM-Tuning大语言模型-微调chatglm6b大语言模型-中文chatGLM-LLAMA微调大语言模型-alpaca-lora 本地知识库大语言模型2-document ai解读大语言模型-DocumentSearch解...

AIGC 2023-11-21 人工智能

705阅读

【AI热点技术】ChatGPT开源替代品——LLaMA系列之「羊驼家族」

ChatGPT开源替代品——LLaMA系列之「羊驼家族」 1. Alpaca 2. Vicuna 3. Koala 4. ChatLLaMA 5. FreedomGPT 6. ColossalChat 完整的 ChatGPT 克隆解决方案中...

AIGC 2023-11-20 人工智能

1678阅读

使用代码下载开源的大模型文件示例以及中文微调llama资源汇总：

一、下载示例 from huggingface_hub import snapshot_download repo_id = "THUDM/chatglm2-6b" local_dir = './chatglm2-6b/' cache_dir = l...

大数据 2023-11-17 人工智能

1073阅读

LLaMA-7B微调记录

Alpaca（https://github.com/tatsu-lab/stanford_alpaca）在70亿参数的LLaMA-7B上进行微调，通过52k指令数据（https://github.com/tatsu-lab/stanford_alpaca/...

大数据 2023-11-17 人工智能

930阅读

Vicuna Makers打造小型AI模型Llama-rephraser，130亿参数、性能媲美GPT-4

Vicuna Makers的研究团队在构建Vicuna语言模型的基础上，成功推出了一款新型的小型人工智能模型（LLM），该模型在性能上与OpenAI的GPT-4相媲美，仅包含130亿个参数。这一新模型被命名为Llama-rephraser，由LMSYS...

生成式AI 2023-11-17 人工智能

658阅读

【NLP】Llama & Alpaca大模型

?大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流? ?个人主页－Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】自然语言...

生成式AI 2023-11-17 人工智能

719阅读

部署lawyer-llama

Git - Downloading PackageGit - Downloading PackageGit - Downloading Package 下载git，wget需要下载一下（GNU Wget 1.21.4 for Windows）， Wi...

AIGC 2023-11-17 人工智能

806阅读

【大模型系列 06】LLaMA-7B/13B for PyTorch 昇腾迁移

源码链接 https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/PyTorch/built-in/foundation/LLaMA-13B LLaMA-7B/13B for PyTorch...

AIGC 2023-11-16 人工智能

861阅读

在低配Windows上部署原版llama.cpp

现在大语言模型的部署，通常都需要大的GPU才能实现，如果是仅仅想研究一下，大语言模型的算法，我们是很想能够直接在我们的工作电脑上就能直接运行的，llama.cpp就是很好的实现。 LLaMa.cpp使用int4这种数值格式，其显著降低了内存需求，并且在大...

人工智能 2023-11-16 人工智能

833阅读

LLMs之Vicuna：在Linux服务器系统上实Vicuna-7B本地化部署(基于facebookresearch的GitHub)进行模型权重合并(llama-7b模型与delta模型权重)、模型部

LLMs之Vicuna：在Linux服务器系统上实Vicuna-7B本地化部署(基于facebookresearch的GitHub 进行模型权重合并(llama-7b模型与delta模型权重、模型部署且实现模型推理全流程步骤的图文教程(非常详细 ...

人工智能 2023-11-16 人工智能

939阅读

足够惊艳，使用Alpaca-Lora基于LLaMA(7B)二十分钟完成微调，效果比肩斯坦福羊驼

之前尝试了从0到1复现斯坦福羊驼（Stanford Alpaca 7B），Stanford Alpaca 是在 LLaMA 整个模型上微调，即对预训练模型中的所有参数都进行微调（full fine-tuning）。但该方法对于硬件成本要求仍然偏高且训练低效...

生成式AI 2023-11-16 人工智能

651阅读

AIGC入门 - LLM 信息概览

在阅读本文之前，建议阅读文章：《GPT，GPT-2，GPT-3，InstructGPT的进化之路》本文将介绍以下 LLM OPT LLaMa Alpaca Vicuna Moss chatGLM Baichuan Openbuddy 一、OPT...

大数据 2023-11-16 人工智能

993阅读

【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca

昨天在github上看到一个在本地部署中文大模型的项目，和大家分享一下。先把地址po出来。项目名称：中文LLaMA&Alpaca大语言模型+本地部署 (Chinese LLaMA & Alpaca LLMs 项目地址：https://...

生成式AI 2023-11-15 人工智能

698阅读

LLaMA微调记录

本文基于开源代码https://github.com/Lightning-AI/lit-llama/tree/main执行微调其他参考链接： Accelerating LLaMA with Fabric: A Comprehensive Guide...

大数据 2023-11-14 人工智能

828阅读

[大模型] 搭建llama主流大模型训练环境

关键词：大模型，LLAMA，CUDA，模型训练 1. 基础环境 OS： Ubuntu 18.04GPU： 4*A100(40G (单机4卡A100 40G CUDA：11.7cuDNN： 8.4.1 (需要登录官网后下载 nccl： 2.12.12...

人工智能 2023-11-13 人工智能

1115阅读

[大模型] LLaMA系列大模型调研与整理-llama/alpaca/lora（部分）

文章目录 LLaMA大模型及其衍生模型 1. LLaMA 2. stanford_alpaca 3. ChatDoctor 4. alpaca-lora 5. Chinese-LLaMA-Alpaca 6. BELLE 大模型综述 A Su...

生成式AI 2023-11-12 人工智能

1132阅读

大语言模型之十五-预训练和监督微调中文LLama-2

这篇博客是继《大语言模型之十二 SentencePiece扩充LLama2中文词汇》、《大语言模型之十三 LLama2中文推理》和《大语言模型之十四-PEFT的LoRA》前面博客演示了中文词汇的扩充以及给予LoRA方法的预训练模型参数合并，并没有给出Lo...

大数据 2023-11-12 人工智能

1238阅读

【个人笔记本】本地化部署详细流程 LLaMA中文模型：Chinese-LLaMA-Alpaca-2

不推荐小白，环境配置比较复杂全部流程下载原始模型：Chinese-LLaMA-Alpaca-2 linux部署llamacpp环境使用llamacpp将Chinese-LLaMA-Alpaca-2模型转换为gguf模型 windows部署...

大数据 2023-11-12 人工智能

1086阅读

使用LoRA对大语言模型LLaMA做Fine-tune

使用LoRA对大语言模型LLaMA做Fine-tune 前言下载配置环境模型的训练 Fine-tune 模型的使用 Inference 参考问题汇总前言目前有大量对LLM（大语言模型）做Fine-tune的方式，不...

AIGC 2023-11-11 人工智能

1014阅读

NLP-分词器：SentencePiece【参考Chinese-LLaMA-Alpaca在通用中文语料上训练的20K中文词表并与原版LLaMA模型的32K词表进行合并的代码】

背景随着ChatGPT迅速出圈，最近几个月开源的大模型也是遍地开花。目前，开源的大语言模型主要有三大类：ChatGLM衍生的大模型（wenda、ChatSQL等）、LLaMA衍生的大模型（Alpaca、Vicuna、BELLE、Phoenix、Chim...

生成式AI 2023-11-11 人工智能

1387阅读

快速训练自己的大语言模型：基于LLAMA-7B的lora指令微调

目录 1. 选用工程：lit-llama 2. 下载工程 3. 安装环境 4. 下载LLAMA-7B模型 5. 做模型转换 6. 初步测试 7. 为什么要进行指令微调？ 8. 开始进行指令微调 8.1. 数据准备 8.2 开始模型训练 8.3...

大数据 2023-11-11 人工智能

851阅读

LLM：LLaMA模型和微调的Alpaca模型

LLaMA模型简单了解[LeCun狂赞：600刀GPT-3.5平替！斯坦福70亿参数「羊驼」爆火，LLaMA杀疯了] 论文原文：https://arxiv.org/abs/2302.13971v1 预训练数据模型架构模型就是用的tra...

生成式AI 2023-11-10 人工智能

759阅读

llama.cpp一种在本地CPU上部署的量化模型（超低配推理llama）

0x00 背景前不久，Meta前脚发布完开源大语言模型LLaMA，随后就被网友“泄漏”，直接放了一个磁力链接下载链接。然而那些手头没有顶级显卡的朋友们，就只能看看而已了但是 Georgi Gerganov 开源了一个项目llama.cpp...

大数据 2023-11-10 人工智能

1368阅读

Llama大模型运行的消费级硬件要求【CPU|GPU|RAM|SSD】

大型语言模型 (LLM 是强大的工具，可以为各种任务和领域生成自然语言文本。最先进的LLM之一是 LLaMA（大型语言模型 Meta AI），这是由 Facebook 的研究部门 Meta AI 开发的一个包含 650 亿个参数的模型要在家运行 L...

人工智能 2023-11-10 人工智能

3325阅读

建立自己的ChatGPT：LLama私有化部署及测试

大语言模型（LLM）现在非常流行，可惜ChatGPT等都不开源。大家没法搭建一个自己的环境来感受以下。幸好Meta开源了LLama，这是LLama的介绍： https://ai.facebook.com/blog/large-language-model...

大数据 2023-11-10 人工智能

764阅读

Windows10上使用llama-recipes(LoRA)来对llama-2-7b做fine-tune

刚刚在Windows10上搭建环境来对llama2做finetune，里面坑还是挺多的，这里把印象中的坑整理了一下以作备忘。 llama-recipes是meta的开源项目，Github地址为：GitHub - facebookresearch/llam...

大数据 2023-11-09 人工智能

746阅读

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用 TextGen: Implementation of Text Generation...

生成式AI 2023-11-09 人工智能

712阅读

大模型使用——超算上部署LLAMA-2-70B-Chat

大模型使用——超算上部署LLAMA-2-70B-Chat 前言1、本机为Inspiron 5005，为64位，所用操作系统为Windos 10。超算的操作系统为基于Centos的linux，GPU配置为A100，所使用开发环境为Anaconda。2、...

AIGC 2023-11-09 人工智能

792阅读

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微调+奖励模型训练+PPO 训练+DPO 训练】的简介、...

人工智能 2023-11-08 人工智能

992阅读

深度解析 Llama 2 的资源汇总：不容错过

“ 探索 Llama 2 背后的过程，包括了模型的全面解析，在线体验，微调，部署等，这份资源汇总将带您深入了解其内涵。” 01 — 周二发布了文章《中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用》后，不少朋...

人工智能 2023-11-08 人工智能

882阅读

【LLM】Windows本地CPU部署民间版中文羊驼模型（Chinese-LLaMA-Alpaca）踩坑记录

目录前言准备工作 Git Python3.9 Cmake 下载模型合并模型部署模型前言想必有小伙伴也想跟我一样体验下部署大语言模型, 但碍于经济实力, 不过民间上出现了大量的量化模型, 我们平民也能体验体验啦~...

生成式AI 2023-11-08 人工智能

837阅读

吃“有毒”数据，大模型反而更听话了！来自港科大&华为诺亚方舟实验室

现在，大模型也学会“吃一堑，长一智”了。来自香港科技大学和华为诺亚方舟实验室的最新研究发现：相比于一味规避“有毒”数据，以毒攻毒，干脆给大模型喂点错误文本，再让模型剖析、反思出错的原因，反而能够让模型真正理解“错在哪儿了”，进而避免胡说八道。具体...

人工智能 2023-10-27 人工智能

655阅读