alpaca 第4页 - AIGC资讯

大模型部署手记（11）LLaMa2+Chinese-LLaMA-Plus-2-7B+Windows+llama.cpp+中文对话

1.简介：组织机构：Meta（Facebook）代码仓：GitHub - facebookresearch/llama: Inference code for LLaMA models 模型：LIama-2-7b-hf、Chinese-LLaMA...

AIGC 2023-12-31 人工智能

844阅读

一文带你UI界面玩转ChatGLM以及Llama的微调

Lora微调的概念： lora是Low-Rank Adaptation的缩写，是微软的Hu等人于2021年挂在ArXiv上（后又发表在ICLR2022上）的一篇论文《LoRA: Low-Rank Adaptation of Large...

AIGC 2023-12-31 人工智能

861阅读

在自定义数据集上微调Alpaca和LLaMA

本文将介绍使用LoRa在本地机器上微调Alpaca和LLaMA，我们将介绍在特定数据集上对Alpaca LoRa进行微调的整个过程，本文将涵盖数据处理、模型训练和使用流行的自然语言处理库(如Transformers和hugs Face 进行评估。此外还将介...

生成式AI 2023-12-29 人工智能

775阅读

llama.cpp LLM模型 windows cpu安装部署；运行LLaMA2模型测试

参考： https://www.listera.top/ji-xu-zhe-teng-xia-chinese-llama-alpaca/ https://blog.csdn.net/qq_38238956/article/details/130113599...

AIGC 2023-12-28 人工智能

806阅读

Llama2推理RTX3090胜过4090，延迟吞吐量占优，但被A800远远甩开

大型语言模型 (LLM 在学界和业界都取得了巨大的进展。但训练和部署 LLM 非常昂贵，需要大量的计算资源和内存，因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的开源框架和方法。然而，不同硬件和软件堆栈的运行时性能可能存在很大差异，这使得选...

人工智能 2023-12-27 人工智能

847阅读

llama.cpp Mac版本llama

骆驼.cpp 路线图/宣言/ ggml 纯C/C++中LLaMA模型的推理热点话题：简单的网络聊天示例：#1998 k-quants 现在支持 64 的超级块大小 super-block size of 64:：#2001 新...

大数据 2023-12-27 人工智能

1100阅读

得物大模型平台，业务效果提升实践

一、背景得物大模型训练与推理平台上线几个月后，我们与公司内部超过 10 个业务领域展开了全面的合作。在一些关键业务指标方面，取得了显著的成效，例如：效率相关部门的合作，多维度打标总正确率取得 2 倍以上提升。利用大模型开辟了新的业务，提升了效...

大数据 2023-12-27 人工智能

697阅读

谷歌Bard更新中文支持；GPT-4：1.8万亿参数、混合专家模型揭秘； Meta推出商用版本AI模型

? AI新闻 ? 谷歌的AI聊天工具Bard更新，增加中文支持摘要：谷歌的AI聊天工具Bard新增中文环境，用户可以使用简体和繁体中文进行交流。然而，与竞品相比，Bard的回复略显生硬，语义理解还有待提升。此外，谷歌还更新了Bard的日志页面，新...

大数据 2023-12-26 人工智能

757阅读

LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention

Paper name LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention Paper Reading Note Paper URL: htt...

人工智能 2023-12-25 人工智能

742阅读

基于MindSpore的llama微调在OpenI平台上运行

基于MindSpore的llama微调在OpenI平台上运行克隆预训练模型克隆chatglm-6b代码仓，下载分布式的模型文件 git lfs install git clone https://huggingface.co/openlm-...

人工智能 2023-12-23 人工智能

770阅读

LLaMA系列模型

1.LLama 1.1 简介 Open and Efficient Foundation Language Models (Open但没完全Open的LLaMA 2023年2月，Meta（原Facebook）推出了LLaMA大模型，使用了1.4...

生成式AI 2023-12-22 人工智能

806阅读

Anthropic发布新方法通过提示降低生成式AI偏见

人工智能公司Anthropic最近发布了一项方法，旨在通过提示工程减少公司使用的大型语言模型（LLMs）输出中的歧视。该公司在一份文件中详细介绍了一种评估方法，指导公司如何通过优化提示降低模型输出的歧视性。该文件为开发人员和决策者提供了了解LLMs生成答案...

生成式AI 2023-12-22 人工智能

865阅读

开发者笑疯了！ LLaMa惊天泄露引爆ChatGPT平替狂潮，开源LLM领域变天

来源: 新智源微信号：AI-era Meta的LLaMA模型开源，让文本大模型迎来了Stable Diffustion时刻。谁都没想谁能想到，一次意外的LLaMA泄漏，竟点燃了开源LLM领域最大的创新火花。一系列表现出色的Chat...

大数据 2023-12-21 人工智能

818阅读

LLM-项目详解-Chinese-LLaMA-AIpaca（一）：LLM+LoRa微调加速技术原理及基于PEFT的动手实践：一些思考和mt0-large+lora完整案例

如何花费较少的算力成本来进行微调训练，十分重要，当前关于LLaMA、Alpaca、Instruct微调、LoRa微调等多个概念大家讲的很多，最近也在学习，也看到几个有趣的话题（主要参考于（https://github.com/ymcui/Chinese-L...

大数据 2023-12-21 人工智能

819阅读

安装单机版大语言模型AI，基于LLaMA的斯坦福大学开源Alpaca

个人电脑即可，不需要GPU，但内存最好大于8G。我是在VM虚拟机中安装成功，且流程运行。 1. 首先使用如下命令下载 alpaca.cpp 项目 git clone https://github.com/antimatter15/alpaca.c...

大数据 2023-12-20 人工智能

941阅读

ggerganov/llama.cpp 编译

ggerganov/llama.cpp - 编译出main可执行程序依赖以下的源代码文件如果想在 Windows 系统编译出 llama.cpp 项目（这个是github上的仓库， ggerganov/llama.cpp ），需要在Visual St...

大数据 2023-12-20 人工智能

964阅读

大语言模型之四-LlaMA-2从模型到应用

最近开源大语言模型LlaMA-2火出圈，从huggingface的Open LLM Leaderboard开源大语言模型排行榜可以看到LlaMA-2还是非常有潜力的开源商用大语言模型之一，相比InstructGPT，LlaMA-2在数据质量、培训技术、能力...

大数据 2023-12-19 人工智能

1422阅读

Llama-2大模型本地部署研究与应用测试

最近在研究自然语言处理过程中，正好接触到大模型，特别是在年初chatgpt引来的一大波AIGC热潮以来，一直都想着如何利用大模型帮助企业的各项业务工作，比如智能检索、方案设计、智能推荐、智能客服、代码设计等等，总得感觉相比传统的搜索和智能化...

大数据 2023-12-18 人工智能

863阅读

源代码is all you need！7B代码小模型同尺寸无敌，性能媲美ChatGPT和谷歌Gemini

Hugging Face 技术负责人 Philipp Schmid 表示：“代码自动补全工具，如 GitHub Copilot，已被超过一百万开发者使用，帮助他们的编码速度提高了 55%。看到像 Magicoder 和 OSS-INSTRUCT 这样的开...

AIGC 2023-12-17 人工智能

845阅读

windows10搭建llama大模型

背景随着人工时代的到来及日渐成熟，大模型已慢慢普及，可以为开发与生活提供一定的帮助及提升工作及生产效率。所以在新的时代对于开发者来说需要主动拥抱变化，主动成长。 LLAMA介绍 llama全称：Large...

AIGC 2023-12-17 人工智能

743阅读

本地推理,单机运行,MacM1芯片系统基于大语言模型C++版本LLaMA部署“本地版”的ChatGPT

OpenAI公司基于GPT模型的ChatGPT风光无两，眼看它起朱楼，眼看它宴宾客，FaceBook终于坐不住了，发布了同样基于LLM的人工智能大语言模型LLaMA，号称包含70亿、130亿、330亿和650亿这4种参数规模的模型，参数是指神经网络中的权重...

大数据 2023-12-16 人工智能

618阅读

LLM - Chinese-Llama-2-7b 初体验

目录一.引言二.模型下载三.快速测试四.训练数据五.总结一.引言自打 LLama-2 发布后就一直在等大佬们发布 LLama-2 的适配中文版，也是这几天蹲到了一版由 LinkSoul 发布的 Chinese-Llam...

生成式AI 2023-12-16 人工智能

808阅读

Chinese-LLaMA-AIpaca 指令精调

文章目录一、继续训练 Chinese-AIpaca 模型的 LoRA权重二、基于中文Chinese-LLaMA训练全新的指令精调LoRA权重 1、合并 2、基于中文 Chinese-LLa...

大数据 2023-12-14 人工智能

704阅读

LLaMA-Factory使用V100微调ChatGLM2报错 RuntimeError: “addmm_impl_cpu_“ not implemented for ‘Half‘

微调命令 CUDA_VISIBLE_DEVICES=0 python /aaa/LLaMA-Factory/src/train_bash.py \ --stage sft \ --model_name_or_path /aaa/LLaMA...

人工智能 2023-12-13 人工智能

1041阅读

LLaMA及其子孙模型概述

文章目录 LLaMA Alpaca Vicuna Koala Baize (白泽骆驼(Luotuo BELLE Guanaco LLaMA 与原始transformer的区别: 预归一化[GPT3]。为了提高训练稳定性，对...

大数据 2023-12-13 人工智能

868阅读

LLM-LLaMA中文衍生模型：Chinese-LLaMA-Alpaca【扩充词表、Lora部分参数预训练、微调】

GitHub：GitHub - ymcui/Chinese-LLaMA-Alpaca: 中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs 中文LLaMA模型...

人工智能 2023-12-13 人工智能

817阅读

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_pt_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的chec

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_pt_with_peft.py文件 —模型训练前置工作(参数解析+配置日志 →模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer →数据...

人工智能 2023-12-13 人工智能

647阅读

技术报告：Efficient and Effective Text Encoding for Chinese LLaMA AND Alpaca

技术报告：Efficient and Effective Text Encoding for Chinese LLaMA AND Alpaca Introduction Chinese LLaMA Chinese Alpaca Lora-Fin...

大数据 2023-12-12 人工智能

680阅读

零一万物Yi-34B-Chat微调模型上线，登陆多个权威榜单

最近，业内众多大模型基准又迎来了一轮 “实力值” 更新。继 11 月初零一万物发布 Yi-34B 基座模型后，Yi-34B-Chat 微调模型在 11 月 24 日开源上线，短时间登陆了全球多个英文、中文大模型权威榜单，再度获得了全球开发者的关注。...

AIGC 2023-12-11 人工智能

784阅读

直追GPT-4！李开复Yi-34B新成绩公布：94.08%的胜率超越LLaMA2等主流大模型

仅次于GPT-4，李开复零一万物Yi-34B-Chat最新成绩公布—— 在Alpaca经认证的模型类别中，以94.08%的胜率，超越LLaMA2 Chat 70B、Claude 2、ChatGPT！图片不仅如此，在加州大学伯克利分校主导的LMSYS...

人工智能 2023-12-11 人工智能

785阅读

LLM-SFT，新微调数据集-MWP-Instruct(多步计算 + 一、二元方程)，微调Bloom, ChatGLM, LlaMA(支持QLoRA, TensorBoardX)

LLM-SFT 中文大模型微调(LLM-SFT , 支持模型(ChatGLM, LlaMA, Bloom , 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX , 支持(微调, 推理, 测评, 接口等. 项目...

大数据 2023-12-11 人工智能

760阅读

触手可及的 GPT —— LLaMA

出品人：Towhee 技术团队最近几个月 ChatGPT 的出现引起广泛的关注和讨论，它在许多领域中的表现都超越了人类的水平。它可以生成人类级别的语言，并且能够在不同的任务中学习和适应，让人们对人工智能的未来充满了希望和憧憬。 ChatGPT 之...

人工智能 2023-12-10 人工智能

710阅读

LLaMA Adapter和LLaMA Adapter V2

LLaMA Adapter论文地址： https://arxiv.org/pdf/2303.16199.pdf LLaMA Adapter V2论文地址： https://arxiv.org/pdf/2304.15010.pdf LLaMA Ada...

人工智能 2023-12-10 人工智能

853阅读

Koala：加州大学BAIR团队使用ChatGPT蒸馏数据和公开数据集微调LLaMA模型得到

自从Meta发布LLaMA以来，围绕它开发的模型与日俱增，比如Alpaca、llama.cpp、ChatLLaMA以及Vicuna等等，相关的博客可以参考如下：【Alpaca】斯坦福发布了一个由LLaMA 7B微调的模型Alpaca（羊驼），训练3小时...

大数据 2023-12-09 人工智能

910阅读

首个开源MoE大模型发布！7Bx8个专家，离GPT-4最近的一集

“取消今晚所有计划！”，许多AI开发者决定不睡了。只因首个开源MoE大模型刚刚由Mistral AI发布。 MoE架构全称专家混合（Mixture-of-Experts），也就是传闻中GPT-4采用的方案，可以说这是开源大模型离GPT-4最近的一集...

人工智能 2023-12-09 人工智能

751阅读

大语言模型之十六-基于LongLoRA的长文本上下文微调Llama-2

增加LLM上下文长度可以提升大语言模型在一些任务上的表现，这包括多轮长对话、长文本摘要、视觉-语言Transformer模型的高分辨4k模型的理解力以及代码生成、图像以及音频生成等。对长上下文场景，在解码阶段，缓存先前token的Key和Value（K...

AIGC 2023-12-09 人工智能

1056阅读

专用于手机、笔记本，Stability.ai开源ChatGPT基因的大模型

12月8日，著名开源生成式AI平台stability.ai在官网开源了，30亿参数的大语言模型StableLM Zephyr3B。 Zephyr3B专用于手机、笔记本等移动设备，主打参数小、性能强、算力消耗低的特点，可自动生成文本、总结摘要等，可与70亿、...

生成式AI 2023-12-09 人工智能

765阅读

一种平价的chatgpt实现方案，基于清华的 ChatGLM-6B + LoRA 进行finetune.（aigc大模型风口，校招找工作必备）

** 清华大学的chatglm-6b开源模型对话能力虽然能基本满足对话需求，但是针对专业领域和垂直领域回答显得智商捉急，这个时候就需要进行微调来提升效果，但是但是同学们显卡的显存更捉急，这时候一种新的微调方式诞生了，现在大火的ai作画里面的lora训练方式...

AIGC 2023-12-07 人工智能

783阅读

大模型LLaMA和微调LLaMA

1.LLaMA LLaMA的模型架构:RMSNorm/SwiGLU/RoPE/Transformer/1-1.4T tokens，和GPT一样都是基于Transformer这个架构。 1.1对transformer子层的输入归一化与Transf...

大数据 2023-12-06 人工智能

1268阅读

中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用

“ Meta 开源 LLAMA2 后，国内出现了不少以此为基座模型训练的中文模型，这次我们来看看其中一个不错的中文模型：Chinese-LLaMA-Alpaca-2 。” 01 — 目前在开源大模型中，比较有名的是Meta的LLAM...

AIGC 2023-12-05 人工智能

1135阅读

开源语言大模型演进史：向LLaMA 2看齐

本文是开源 LLM 发展史系列文章的第三部分。此前，第一部分《开源语言大模型演进史：早期革新》回顾了创建开源 LLM 的最初尝试。第二部分《开源语言大模型演进史：高质量基础模型竞赛》研究了目前可用的最受欢迎的开源基础模型（即已进行预训练但尚未微...

大数据 2023-12-05 人工智能

766阅读

不是大模型全局微调不起，只是LoRA更有性价比，教程已经准备好了

增加数据量和模型的参数量是公认的提升神经网络性能最直接的方法。目前主流的大模型的参数量已扩展至千亿级别，「大模型」越来越大的趋势还将愈演愈烈。这种趋势带来了多方面的算力挑战。想要微调参数量达千亿级别的大语言模型，不仅训练时间长，还需占用大量高性能的内存资...

AIGC 2023-12-04 人工智能

867阅读

本地部署中文LLaMA模型实战教程，民间羊驼模型

羊驼实战系列索引博文1：本地部署中文LLaMA模型实战教程，民间羊驼模型（本博客）博文2：本地训练中文LLaMA模型实战教程，民间羊驼模型博文3：精调训练中文LLaMA模型实战教程，民间羊驼模型简介 LLaMA大部分是英文语料训练的，讲中文能...

大数据 2023-12-04 人工智能

711阅读

LLaMA模型微调版本：斯坦福 Alpaca 详解

项目代码：https://github.com/tatsu-lab/stanford_alpaca 博客介绍：https://crfm.stanford.edu/2023/03/13/alpaca.html Alpaca 总览 Alpaca 是 L...

AIGC 2023-12-03 人工智能

700阅读

大模型入门（一）—— LLaMa/Alpaca/Vicuna

LLaMa模型是Meta开源的大模型，模型参数从7B到65B不等，LLaMa-7B在大多数基准测试上超过了GPT3-173B，而LLaMa-65B和Chinchilla-70B、PaLM-540B相比也极具竞争力。相比于ChatGPT或者GPT4来说，LL...

大数据 2023-12-02 人工智能

695阅读

本地部署LLaMA-中文LoRA部署详细说明

在Ubuntu18.04 部署中文LLaMA模型环境准备硬件环境 AMD 5950X 128GB RAM RTX 3090(24G VRAM 操作系统 Ubuntu 18.04 编译环境(可选 llama...

大数据 2023-12-02 人工智能

954阅读

大模型部署手记（12）LLaMa2+Chinese-LLaMA-Plus-2-7B+Windows+text-gen+中文对话

1.简介：组织机构：Meta（Facebook）代码仓：https://github.com/facebookresearch/llama 模型：chinese-alpaca-2-7b-hf 下载：使用百度网盘下载硬件环境：暗影精灵7Plu...

大数据 2023-12-01 人工智能

826阅读

使用LLM插件从命令行访问Llama 2

大家好，最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2，这是一项非常重要的进展。Facebook最初的LLaMA模型于今年2月发布，掀起了开源LLM领域的创新浪潮——从微调变体到从零开始的再创造。如果在Llama 2版本...

人工智能 2023-11-30 人工智能

769阅读

研究人员发布Starling-7B：基于AI反馈的大语言模型媲美GPT-3.5

UC伯克利的研究人员最近发布了Starling-7B，这是一款基于AI反馈强化学习（RLAIF）的开放式大语言模型(LLM 。该模型基于精调的Openchat3.5，并继承了Mistral-7B的特性。在RLAIF中，研究人员借助其他AI模型的反馈来训练...

AIGC 2023-11-29 人工智能

740阅读

伯克利分校推开放大模型Starling-7B 接受人工智能反馈训练

加州大学伯克利分校的研究人员推出了一款名为Starling-7B的开放式大型语言模型（LLM），采用了一种称为Reinforcement Learning from AI Feedback(RLAIF 的创新训练方法。 RLAIF的独特之处在于利用其他人...

大数据 2023-11-29 人工智能

718阅读