llama 第19页 - AIGC资讯

【AIGC调研系列】XTuner、Unsloth方案对比

XTuner和Unsloth都是用于大型语言模型（LLM）训练和微调的工具，但它们在设计理念、技术实现和性能表现上存在一些差异。技术架构与支持的模型规模： XTuner支持千亿级参数的模型，并能够处理超过百万个tokens的序列。它通过序列...

人工智能 2024-06-03 人工智能

1907阅读

llama_factory微调QWen1.5

GitHub - hiyouga/LLaMA-Factory: Unify Efficient Fine-Tuning of 100+ LLMsUnify Efficient Fine-Tuning of 100+ LLMs. Contribute to...

生成式AI 2024-06-03 人工智能

1363阅读

使用LLaMA Factory来训练智谱ChatGLM3-6B模型

使用LLaMA Factory来训练智谱ChatGLM3-6B模型时，以下是一个训练过程： 1. 环境搭建 a. 安装Python和Anaconda 下载并安装适合你操作系统的Python版本（推荐Python 3.10或更高版本）。安装Anac...

AIGC 2024-06-03 人工智能

1266阅读

【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3

Datawhale干货作者：张帆，陈安东，Datawhale成员引言在AI领域，大模型的发展正以前所未有的速度推进技术的边界。北京时间4月19日凌晨，Meta在官网上官宣了Llama-3，作为继Llama-1、Llama-...

AIGC 2024-06-02 人工智能

1047阅读

在autodl平台使用llama-factory微调Qwen1.5-7B

1 部署环境 step 1. 使用24GB显存以上的显卡创建环境 step 2. 创建好环境之后，关闭环境，使用无卡模式开机（有钱可忽略） step 3. 安装LLaMA-Factory git clone https://github.com/...

生成式AI 2024-06-02 人工智能

1370阅读

时间序列模型：lag-Llama

项目地址：GitHub - time-series-foundation-models/lag-llama: Lag-Llama: Towards Foundation Models for Probabilistic Time Series Foreca...

大数据 2024-06-02 人工智能

1238阅读

快速评测已有的中文llama-3开源模型（4月25日更新）

Llama-3刚出来不到一周，就有一些中文微调模型了。我快速的对这些模型进行了基准测试，时间仓促，没有办法面面俱到，仅供参考。中文评测数据集选择的是C-Eval（valid），英文选择的是MMLU（valid），评测指标是准确率，越高越好。中...

生成式AI 2024-06-02 人工智能

1014阅读

Llama 3 Web Demo 部署 && XTuner 小助手认知微调 && LMDeploy 部署 Llama 3 模型 && 五一作业 && 机智流

Llama 3 Web Demo 部署 && XTuner 小助手认知微调 && LMDeploy 部署 Llama 3 模型 && 五一作业 && 机智流 1、 Llama 3...

生成式AI 2024-06-02 人工智能

935阅读

llama-factory学习个人记录

框架、模型、数据集准备 1.llama-factory部署 # 克隆仓库 git clone https://github.com/hiyouga/LLaMA-Factory.git # 创建虚拟环境 conda create --name llama...

人工智能 2024-06-02 人工智能

2325阅读

欢迎 Llama 3：Meta 的新一代开源大语言模型

介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本，现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋，我们也非常高兴地全力支持此次发布，并实现了与 Hugging Fac...

生成式AI 2024-06-02 人工智能

1063阅读

10 分钟，教你如何用 LLama-Factory 训练和微调 LLama3 模型

本文将探讨于2024年3月21日发布的LLama-Factory，并学习如何使用 DigitalOcean 旗下的 Paperspace平台对 LLama 3 进行微调。为了完成我们的任务，我们将使用 NVIDIA A4000 GPU，它被认为是功能最强大...

大数据 2024-06-02 人工智能

1468阅读

ControlNet作者搞起大模型：让天下没有难写的生图提示词，一句话变构图小作文

ControlNet作者新项目，居然也搞起大模型和Agent了。当然还是和AI绘画相关:解决大伙不会写提示词的痛点。现在只需一句超简单的提示词说明意图，Agent就会自己开始“构图”: 这就是ControlNet作者Lvmin Zhang的新玩具...

大数据 2024-06-02 人工智能

843阅读

一键 input 苹果 OpenELM，零门槛 Llama 3 教程，40+ 优质模型/数据集/教程，建议收藏！...

现在 AI 行业什么最火？「大模型」一定仍然排在前三甲的位置。自从 2022 年底 ChatGPT 面世以来，大模型在各行各业已经带来了太多的惊喜，应用场景愈发丰富，同时也带动了相关底层技术的普及与普适化。尤其是在开源模型繁荣发展之下，无...

人工智能 2024-06-02 人工智能

1036阅读

基于 Llama-Index、Llama 3 和 Qdrant，构建一个 RAG 问答系统！

构建一个使用Llama-Index、Llama 3和Qdrant的高级重排-RAG系统尽管大型语言模型（LLMs）有能力生成有意义且语法正确的文本，但它们面临的一个挑战是幻觉。在LLMs中，幻觉指的是它们倾向于自信地生成错误答案，制造出看似令人信...

生成式AI 2024-06-02 人工智能

1377阅读

“全网最全”LLM推理框架集结营 | 看似微不足道，却决定着AIGC项目的成本、效率与性能!

00-前序随着ChatGPT、GPT-4等大语言模型的出现，彻底点燃了国内外的学者们与企业家们研发LLM的热情。国内外的大语言模型如雨后春笋一般的出现，这些大语言模型有一部分是开源的，有一部分是闭源的。伴随着大语言模型的出现，国...

人工智能 2024-06-02 人工智能

2481阅读

007-Wsl-Ubuntu上LLaMA-Factory如何下载、部署、运行【AI超车B计划】

一、目标了解什么是LLaMA-Factory；成功在Wsl-Ubuntu环境下安装并运行LLaMA-Factory；二、路径学习笔记中关于LLaMA-Factory的简介，了解什么是LLaMA-Factory；在Ubun...

生成式AI 2024-06-01 人工智能

1768阅读

玩转AI，笔记本电脑安装属于自己的Llama 3 8B大模型和对话客户端

2024 年 4 月 18 日，Meta开源了 Llama 3 大模型，把 AI 的门槛降低到了最低，这是人工智能领域的一个重要飞跃。我们个人也可以部署大模型了，这简直就是给个人开发者发了个大红包！Llama 3 模型有不同的参数版本，本文主要分享我在个人...

大数据 2024-06-01 人工智能

1141阅读

AI智能体研发之路-模型篇（一）：大模型训练框架LLaMA-Factory在国内网络环境下的安装、部署及使用

博客导读：《AI—工程篇》 AI智能体研发之路-工程篇（一）：Docker助力AI智能体开发提效 AI智能体研发之路-工程篇（二）：Dify智能体开发平台一键部署 AI智能体研发之路-工程篇（三）：大模型推理服务框架Ollama...

大数据 2024-06-01 人工智能

1479阅读

LLaMA-Factory 微调训练

LLaMA-Factory 微调训练该框架功能，标注-微调-导出-合并-部署，一整条流程都有，而且训练时消耗的gpu算力也会小一些一，安装（推荐在linux中训练，win可以用wsl+docker） git clone https:...

大数据 2024-06-01 人工智能

1743阅读

Llama 3 模型家族构建安全可信赖企业级AI应用之 CyberSecEval 2：量化 LLM 安全和能力的基准（一）

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

AIGC 2024-06-01 人工智能

1082阅读

LLMs之FineTuning：Alpaca格式/Vicuna的sharegpt 格式数据集简介、利用多种方式构造或转换指令微调格式数据集实战——利用LLaMA-Factory框架的dataset_i

LLMs之FineTuning：常用指令微调格式数据集的简介(Alpaca格式/Vicuna的sharegpt 格式、利用多种方式构造或转换指令微调格式数据集实战——利用LLaMA-Factory框架的dataset_info.json 中通过指定 --...

人工智能 2024-06-01 人工智能

1170阅读

基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）

基于LlaMA 3 + LangGraph 在windows本地部署大模型（一） RAG 是未来人工智能应用的基石。大家并不是在寻求仅仅产生无意义反应的人工智能。而目标是人工智能能够从特定文档集中检索答案，理解查询的上下文，指导自己搜索其嵌入内容...

大数据 2024-06-01 人工智能

1435阅读

Datawhale |【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3

本文来源公众号“Datawhale”，仅用于学术分享，侵权删，干货满满。原文链接：【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3 0. 引言在AI领域，大模型的发展正以前所未有的速度推进技术的边界。北京时间4月1...

人工智能 2024-06-01 人工智能

1025阅读

AI、AGI、AIGC、AI Agent、Prompt、LLM 名词解释

啊！ChatGPT 最近很火呀，你们说的 AGI、AIGC、AI Agent、Prompt、LLM … 到底是什么意思啊？还有 Midjourney、Lensa、Sora、DALL-E、Llama … 又是什么鬼？ AI（Artificial Int...

人工智能 2024-06-01 人工智能

1177阅读

笔记1--Llama 3 超级课堂 | Llama3概述与演进历程

1、Llama 3概述 https://github.com/SmartFlowAI/Llama3-Tutorial.git【Llama 3 五一超级课堂 | Llama3概述与演进历程】 2、Llama 3 改进点【最新【大模型微调】大模...

生成式AI 2024-06-01 人工智能

1000阅读

GpuMall智算云：meta-llama/llama3/Llama3-8B-Instruct-WebUI

LLaMA 模型的第三代，是 LLaMA 2 的一个更大和更强的版本。LLaMA 3 拥有 35 亿个参数，训练在更大的文本数据集上GpuMall智算云 | 省钱、好用、弹性。租GPU就上GpuMall,面向AI开发者的GPU云平台 Llama 3 的推...

人工智能 2024-05-31 人工智能

1079阅读

Llama 3 微调项目实践与教程（XTuner 版）

Llama 3 微调项目实践与教程（XTuner 版） OpenMMLab 2024-04-20 11:37 上海以下文章来源于InternLM ，作者XTuner InternLM. 以原始创新引领AI大模型技术进步。 Lla...

大数据 2024-05-31 人工智能

930阅读

国产大模型全阵容，中文大模型竞技场推出！

LMSYS Org推出的大模型竞技场Chatbot Arena，已成为海外最具公信力的大模型榜单之一，但该榜单中文化程度相对不足。近日，上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena，首度集齐国内主流大模型全阵容，阿...

生成式AI 2024-05-31 人工智能

990阅读

使用llama.cpp量化部署LLM

以llama.cpp工具为例，介绍模型量化并在本地部署的详细步骤。这里使用 Meta最新开源的 Llama3-8B 模型。 1 环境系统应有make（MacOS/Linux自带）或cmake（Windows需自行安装）编译工具 Python 3....

大数据 2024-05-31 人工智能

2086阅读

You.com推自定义助手功能，允许用户自行创建个性化AI助手

总部位于帕洛阿尔托的初创公司You.com今天宣布推出“自定义助手”，这是一项突破性的功能，允许用户使用GPT-4o、Llama3和Claude3等顶级语言模型（LLM）创建个性化的 AI 助手，所有功能都在一个界面内完成。对话式 AI 的这一重大飞跃...

AIGC 2024-05-31 人工智能

1042阅读

【AIGC调研系列】llama 3与GPT4相比的优劣点

Llama 3与GPT-4相比，各有其优劣点。以下是基于我搜索到的资料的详细分析： Llama 3的优点：更大的数据集和参数规模：Llama 3基于超过15T token的训练，这相当于Llama 2数据集的7倍还多[1][3]。此外，它拥有40...

AIGC 2024-05-31 人工智能

1209阅读

LLMs之RAG：只需四步骤—基于Ollama后端框架(配置phi3/LLaMA-3模型)结合Dify前端框架(设置知识库文件+向量化存储+应用发布)创建包括实现本地知识库问答/翻译助手等多个应用

LLMs之RAG：基于Ollama后端框架(配置phi3/LLaMA-3模型结合Dify前端框架(设置知识库文件+向量化存储+应用发布创建包括实现本地知识库问答/翻译助手等多个应用目录基于Ollama后端框架(配置phi3/LLaMA-...

大数据 2024-05-31 人工智能

1210阅读

【LLAMA3超级课堂-第四节】Llama 3 高效部署实践（LMDeploy 版）

开发机地址：https://studio.intern-ai.org.cn/console/instance 本文内容环境，模型准备 LMDeploy chat LMDeploy模型量化(lite LMDeploy服务(serve 环...

大数据 2024-05-31 人工智能

1263阅读

LLaMa系列模型详解（原理介绍、代码解读）：LLaMA 3

LLaMA 3 2024年4月18日，Meta 重磅推出了Meta Llama 3，Llama 3是Meta最先进开源大型语言模型的下一代，包括具有80亿和700亿参数的预训练和指令微调的语言模型，能够支持广泛的应用场景。这一代Llama在一系列行业标...

AIGC 2024-05-31 人工智能

1599阅读

北航发布LlamaFactory，零代码大模型微调平台，一键快速实现大模型训练/微调/评估

“LLAMAFACTORY: Unified Efficient Fine-Tuning of 100+ Language Models” 在大模型发展如火如荼的今天，训练和微调一个大模型对于绝大部分普通工程师来说仍然是一个难题。为了降低大模型训练、...

生成式AI 2024-05-31 人工智能

1798阅读

Llama3-Tutorial（Llama 3 超级课堂）-- 笔记

第1节—Llama 3 本地 Web Demo 部署端口转发 vscode里面设置端口转发 https://a-aide-20240416-b4c2755-160476.intern-ai.org.cn/proxy/8501/...

AIGC 2024-05-31 人工智能

926阅读

用自然语言来编程GitHub Copilot；提高代码质量开源工具GPTLint；LLMs开源医学Meditron

✨ 1: GitHub Copilot Workspace 以Copilot 为中心的创新开发者环境，让开发者能用自然语言从构思到编码再到软件开发。 GitHub Copilot Workspace是一个以Copilot为中心的开发者环境，...

AIGC 2024-05-30 人工智能

942阅读

【记录】LangChain｜Ollama结合LangChain使用的速通版（包含代码以及切换各种模型的方式）

官方教程非常长，我看了很认可，但是看完了之后呢就需要一些整理得当的笔记让我自己能更快地找到需求。所以有了这篇文章。【写给自己看的，里面半句废话的解释都没有，如果看不懂的话直接看官方教程再看我的】 ollama是个平台，里面一大堆开源模型，llama...

生成式AI 2024-05-30 人工智能

1291阅读

阅读llama源码笔记_1

文章目录总体逻辑 1 构造模型 2 定义数据 3 处理下游任务 1.构造模型 1.1构造分词器tokenizer 1.2构造Transformer 2.定义数据 3.处理下游任务 3.1分词（编码） 3.2 generate...

大数据 2024-05-30 人工智能

806阅读

速度秒掉GPT-4o、22B击败Llama 3 70B，Mistral AI开放首个代码模型

对标 OpenAI 的法国 AI 独角兽 Mistral AI 有了新动作：首个代码大模型 Codestral 诞生了。作为一个专为代码生成任务设计的开放式生成 AI 模型，Codestral 通过共享指令和补全 API 端点帮助开发人员编写并与代码...

大数据 2024-05-30 人工智能

797阅读

AI大牛karpathy点赞SEAL榜单，LLM评估的状况过去是非常糟糕的！

lmsys.org的一个严肃的竞争对手已经加入了对LLMs（大型语言模型）评估的讨论中：SEAL Leaderboards——对领先前沿模型进行的私密、专家评估。 SEAL Leaderboards的设计原则： ?私密 + 无法被利用。在评估上不会过度拟...

人工智能 2024-05-30 人工智能

918阅读

LLMs之LLaMA-3：Llama-3-70B-Gradient-1048k-adapter的简介、源代码解读merge_adapters.py(仅需58行代码)合并多个PEFT模型(LoRA技术)

LLMs之LLaMA-3：Llama-3-70B-Gradient-1048k-adapter的简介、源代码解读merge_adapters.py(仅需58行代码合并多个PEFT模型(LoRA技术将LLaMA-3扩展到100万/1048k上下文——解析...

AIGC 2024-05-30 人工智能

1235阅读

32专家MoE大模型免费商用！性能全面对标Llama3，单token推理消耗仅5.28%

每个token只需要5.28%的算力，精度就能全面对标Llama 3。开源大模型，再添一位重量级选手—— 来自浪潮信息的32专家MoE模型，源2.0-M32。不仅拥有极高的回报投入比，而且全面开放，训练代码和模型权重都可任意下载，商业使用也免费、无需...

生成式AI 2024-05-30 人工智能

909阅读

Mistral 开源代码模型夺得王座！Codestral疯狂训练超80种语言，国内通义开发者请求出战！

出品 | 51CTO技术栈（微信号：blog51cto） Mistral 发布了首个代码模型 Codestral-22B！该模型的疯狂之处不仅在于训练了80多种编程语言，包括许多代码模型忽略的Swift等。还在于他非同一般的速度。要求用Go语言编...

大数据 2024-05-30 人工智能

899阅读

27岁华裔天才少年对打UC伯克利，首发SEAL大模型排行榜！Claude 3 Opus数学封神

前段时间，由27岁的华裔创始人Alexandr Wang领导的Scale AI刚刚因为融资圈了一波关注。今天，他又在推特上官宣推出全新LLM排行榜——SEAL，对前沿模型开展专业评估。 SEAL排行榜主打三个特色： - 私有数据 Scale AI的专...

大数据 2024-05-30 人工智能

992阅读

五一假期Llama 3之魔改不完全攻略（Part 2)

2024年4月18日，Meta AI 正式宣布推出 Llama 3，这标志着开源大型语言模型（LLM）领域的又一重大进步。如同一颗重磅炸弹， Llama 3 以其卓越的性能和广泛的应用前景，预示着 AI 技术的新时代。目前开源的是Llama3 8B 和...

生成式AI 2024-05-30 人工智能

885阅读

通用大模型研究重点之五：llama family

LLAMA Family decoder-only类型 LLaMA（Large Language Model AI）在4月18日公布旗下最大模型LLAMA3，参数高达4000亿。目前meta已经开源了80亿和700亿版本模型，主要升级是多模态、长文本方...

AIGC 2024-05-30 人工智能

1160阅读

Llama3-Tutorial（Llama 3 超级课堂）作业

1.Llama 3 Web Demo 部署 cd ~ git clone https://github.com/SmartFlowAI/Llama3-Tutorial 安装 XTuner 时会自动安装其他依赖 cd ~ git clone -b...

大数据 2024-05-30 人工智能

3242阅读

保姆级零基础微调大模型（LLaMa-Factory，多卡版）

此处非常感谢https://github.com/hiyouga/LLaMA-Factory这个项目。看到网上的教程很多都是教如何用webui来微调的，这里出一期命令行多卡微调教程~ 1. 模型准备模型下载比较方便的方法： 1. modelsc...

大数据 2024-05-30 人工智能

1796阅读

Windows11(非WSL)安装Installing llama-cpp-python with GPU Support

直接安装，只支持CPU。想支持GPU，麻烦一些。 1. 安装CUDA Toolkit (NVIDIA CUDA Toolkit (available at https://developer.nvidia.com/cuda-downloads 2...

生成式AI 2024-05-30 人工智能

1286阅读