模型微调第2页 - AIGC资讯

Datawhale X 魔搭 AI夏令营第四期AIGC task1

本期夏令营AIGC方向是通过参加可图Kolors-LoRA风格故事挑战赛https://tianchi.aliyun.com/competition/entrance/532254，学习并实践文生图AIGC、工作流搭建、LoRA微调等技术。赛题内容...

AIGC 2024-08-14 人工智能

890阅读

“Datawhale X 魔搭 AI夏令营”-AIGC文生图方向Task1笔记

前言就自己学习过程对于Datawhale AI的夏令营第四期魔搭-AIGC文生图方向，做了个初级版教程，供小白参考，后期有机会也会通过自己的学习总结相关知识教程，期待和大家一起相互学习，共同进步！正文第一步：报名参加赛事！点击赛事链接：：天池平...

大数据 2024-08-13 人工智能

1106阅读

使用Llama-factory微调Llama3教程

一、登录OpenBayes进行注册登录通过以下链接，新用户注册登录 OpenBayes ，即可获得四个小时 RTX 4090免费使用时长！！注册链接:https://openbayes.com/console/signup?r=zzl99_W...

大数据 2024-08-13 人工智能

1598阅读

Datawhale AI夏令营第四期魔搭- AIGC文生图方向 task01笔记

目录分任务1：跑通baseline 第一步——搭建代码环境第二步——报名赛事第三步——在魔搭社区创建PAI实例分任务2：相关知识学习以及赛题理解赛题理解：文生图基本认识： 1. Diffusion Model(扩散模型 2...

AIGC 2024-08-12 人工智能

814阅读

微调 Whisper 语音大模型

1.准备环境 #创建环境 conda create -n whisper python=3.10 -y source activate whisper #安装环境 conda install pytorch==2.1.0...

AIGC 2024-08-11 人工智能

1223阅读

【AIGC】文心一言大模型使用教程：从入门到精通

引言文心一言，作为百度强大的自然语言处理大模型，凭借其深厚的语言理解和生成能力，在文本创作、问答系统、智能客服等多个领域展现出巨大的潜力。本教程旨在帮助初学者及进阶用户全面了解文心一言大模型，掌握其调用方法、使用技巧，并通过实际案例提升使用效率。一...

AIGC 2024-08-10 人工智能

1723阅读

记一次：Datawhale AI夏令营-第四期-魔塔-AIGC-Task01

前言：随着AI时代的来临，本人也想深入的了解一下不被时代淘汰（紧追）正好看见有夏令营这方面的，顺便来参加一下学习一下。学习任务目录一、赛事环境准备二、跑通 “可图Kolors-LoRA风格故事挑战赛” 一、赛事环境准备 0、夏令营介绍...

AIGC 2024-08-10 人工智能

1153阅读

【项目记录】LLaMA-Factory + ModelScope 指令监督微调

LLaMA-Factory是大模型微调框架，内部集成了多种微调方法，可以直接调用。具体做法可以从官方github上找到：https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md...

大数据 2024-08-10 人工智能

3661阅读

AI绘画；（Stable Diffusion进阶篇：模型训练）

前言在上一篇笔记中学习了解了一部分关于Stable Diffusion的运行原理，今天就来接着学习下Stable Diffusion关于微调训练方面的知识点。今天没多少废话，因为我下午要去玩PTCG！让我们冲冲冲整理和输出教程属实不易，觉得这...

大数据 2024-08-06 人工智能

1021阅读

LLaMA-Factory：手把手教你从零微调大模型！

引言随着人工智能技术的飞速发展，大型语言模型（LLM）在自然语言处理（NLP）领域扮演着越来越重要的角色。然而，预训练的模型往往需要针对特定任务进行微调，以提高其在特定领域的性能。LLaMA-Factory作为一个高效、易用的微调工具，为广大开发者提...

生成式AI 2024-08-02 人工智能

1168阅读

LLaMA 3.1：开源大模型的新里程碑

7月23日，Meta公布了它的人工智能模型Llama的最新版本——Llama 3.1。这次更新推出了三种不同的版本，其中包括了Meta迄今为止最高级的人工智能模型。重要的是，Llama 3.1依旧是开源的，这意味着谁都可以免费使用这款模型。这次发布展示了M...

人工智能 2024-08-01 人工智能

945阅读

LLM大模型实战项目--基于Stable Diffusion的电商平台虚拟试衣

本文详细讲解LLM大模型实战项目，基于Stable Diffusion的电商平台虚拟试衣一、项目介绍二、阿里PAI平台介绍三、阿里云注册及开通PAI 四、PAI_DSW环境搭建五、SD+LORA模型微调一、项目介绍 ...

大数据 2024-07-31 人工智能

1248阅读

【07】LLaMA-Factory微调大模型——微调模型导出与微调参数分析

上文介绍了如何对微调后的模型进行使用与简单评估。本文将介绍对微调后的模型进行导出的过程。一、llama-3微调后的模型导出首先进入虚拟环境，打开LLaMA-Factory的webui页面 conda activate GLM cd LLaMA-F...

生成式AI 2024-07-31 人工智能

1980阅读

AI绘画软件Stable Diffusion的Lora模型详解与使用教程

一、引言在AI绘画领域，Stable Diffusion作为一种强大的文本到图像的生成模型，已经吸引了众多艺术家和爱好者的关注。而Lora（Low-Rank Adaptation）模型作为Stable Diffusion的一个重要扩展，进一步提升了模...

大数据 2024-07-27 人工智能

1869阅读

每日AIGC最新进展(36)：以色列Lightricks提出视频中眼镜擦除技术V-LASIK、史蒂文斯理工学院提出实时交互式数字头像框架RITA、清华大学提出神经残差扩散模型Neural-RDM

Diffusion Models专栏文章汇总：入门与实战 V-LASIK: Consistent Glasses-Removal from Videos Using Synthetic Data 本文介绍了一种名为V-LASIK的视频编辑技术，...

大数据 2024-07-27 人工智能

883阅读

【05】LLaMA-Factory微调大模型——初尝微调模型

上文【04】LLaMA-Factory微调大模型——数据准备介绍了如何准备指令监督微调数据，为后续的微调模型提供高质量、格式规范的数据支撑。本文将正式进入模型微调阶段，构建法律垂直应用大模型。一、硬件依赖 LLaMA-Factory框架对硬件和软件的...

AIGC 2024-07-23 人工智能

1611阅读

快速微调 Whisper 模型：LoRA 加速版

快速微调 Whisper 模型：LoRA 加速版简述在当今的AI世界中，模型的大小和复杂性已成为性能的关键驱动力。然而，这也带来了新的挑战：如何在有限的资源下对大型模型进行有效且高效的微调？现在，借助开源项目——Faster Whisper Fine...

AIGC 2024-07-23 人工智能

1346阅读

llama-factory学习使用笔记

想要对开源的llama大模型，针对自己的数据进行微调，这里推荐llama-factory项目，LLama Factory，这个工具能够高效且低成本地支持对 100 多个模型进行微调。LLama Factory 简化了模型微调的过程，并且易于访问...

生成式AI 2024-07-13 人工智能

2070阅读

探索大模型：袋鼠云在 Text To SQL 上的实践与优化

Text To SQL 指的是将自然语言转化为能够在关系型数据库中执行的结构化查询语言（简称 SQL）。近年来，伴随人工智能大模型技术的不断进步，Text To SQL 任务的成功率显著提升，这得益于大模型的推理、理解以及指令遵循等能力。对于大数据平台...

AIGC 2024-07-12 人工智能

940阅读

LLAma-Factory框架详细使用方法-0.8.3版本

一、安装 LLaMA Factory git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git #拉取代码到本地 cd LLaMA-Factory #进入...

人工智能 2024-07-11 人工智能

3306阅读

使用LlamaFactory进行模型微调：参数详解

在深度学习和自然语言处理领域，模型微调是提升预训练模型性能的重要手段。本文将介绍如何使用LlamaFactory进行模型微调，并详细解析一些关键参数，包括 --cutoff_len 1024、--flash_attn auto、--lora_rank 8、...

AIGC 2024-07-11 人工智能

4041阅读

大模型AIGC转行记录（一）

自从22年11月chat gpt上线以来，这一轮的技术浪潮便变得不可收拾。我记得那年9月份先是在技术圈内讨论，然后迅速地，全社会在讨论，各个科技巨头、金融机构、政府部门快速跟进。软件开发行业过去与现状我19年决定转码的时候，互联网的情况可比现在好...

AIGC 2024-07-09 人工智能

931阅读

AIGC最新资讯收集

阿里免费的 AI 创意海报生成工具—— ModelScope 魔搭社区 PosterGenius 魔搭（ModelScope）是阿里达摩院重磅推出的一个 AI 模型社区。里面有众多开源模型，还有很多开箱即用的在线 Demo。比如前段春节期间的用的比较...

生成式AI 2024-07-06 人工智能

1116阅读

大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例

大家好，我是微学AI，今天给大家介绍一下大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例, LLaMA-Factory是一个专门用于大语言模型微调的框架，它支持多种微调方法，如LoRA、QLoRA等，并提供了丰...

大数据 2024-07-05 人工智能

1502阅读

#10 解决Stable Diffusion常见问题和错误

文章目录前言 1. 环境配置错误问题描述解决方案 2. 模型加载失败问题描述解决方案 3. 图像生成质量差问题描述解决方案 4. 生成速度慢问题描述解决方案 5. 内存不足错误问题描述解决方案结论...

人工智能 2024-07-01 人工智能

1725阅读

大模型应用实战4——开源大模型微调（基于LLaMA-Factory）

所谓微调，通俗理解就是围绕大模型进行参数修改，从而永久性的改变模型的某些性能。而大模型微调又分为全量微调和高效微调两种，所谓全量微调，指的是调整大模型的全部参数，而高效微调，则指的是调整大模型的部分参数，目前常用的高效微调方法包括LoRA、QLoRA、p-...

AIGC 2024-06-28 人工智能

1221阅读

AI 绘画Stable Diffusion 研究（十六）SD Hypernetwork详解

大家好，我是风雨无阻。本期内容：什么是 Hypernetwork？ Hypernetwork 与其他模型的区别？ Hypernetwork 原理 Hypernetwork 如何下载安装？ Hypernetwork 如何使用？在上一篇文章中，我...

AIGC 2024-06-27 人工智能

998阅读

stable diffusion 1.x 模型训练概述

本文主要介绍sd发展的第一阶段版本的模型架构和一些微调训练方法，后续版本SDXL，LCM 版本再写文章继续介绍 SD 1.x 版本模型结构 autoencoder(VAE ：encoder将图像压缩到latent空间，而decoder将latent解码...

生成式AI 2024-06-25 人工智能

1137阅读

用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！

用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！文章目录用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！什么是模型微调？为什么使用 LLama-Fact...

人工智能 2024-06-20 人工智能

1335阅读

新手教程之使用LLaMa-Factory微调LLaMa3

文章目录为什么要用LLaMa-Factory 什么是LLaMa-Factory LLaMa-Factory环境搭建微调LLaMA3 参考博文为什么要用LLaMa-Factory 如果你尝试过微调大模型，你就会知道，大模型的环...

AIGC 2024-06-17 人工智能

1836阅读

使用 Amazon SageMaker 微调 Llama 2 模型

本篇文章主要介绍如何使用 Amazon SageMaker 进行 Llama 2 模型微调的示例。这个示例主要包括: Llama 2 总体介绍 Llama 2 微调介绍 Llama 2 环境设置 Llama 2 微调训练前言...

AIGC 2024-06-12 人工智能

869阅读

02：从文生图初窥Stable Diffusion，一键玩转AI绘画

前言 Stable Diffusion是一个什么架构呢，或者说是由哪些部分构成，各自发挥着怎么样的作用。我们就先从文生图开始探索文生图我们打开Stable Diffusion的webui，然后选择Stable Diffusion模型，然后选择...

生成式AI 2024-06-12 人工智能

1024阅读

LLaMA 2语言大模型的微调策略：LoRA与全参数选择

随着自然语言处理（NLP）技术的飞速发展，大型语言模型（LLMs）在各个领域都展现出了强大的能力。LLaMA 2作为其中的佼佼者，具有巨大的潜力。然而，如何有效地对LLaMA 2进行微调，以适应特定的任务或数据集，成为了一个关键问题。本文将对LoRA技术与...

人工智能 2024-06-10 人工智能

936阅读

【AIGC调研系列】llama3微调具体案例

Llama3的微调可以通过多种方式进行，具体案例包括：使用XTuner进行微调，尝试让Llama3具有"它是SmartFlowAI打造的人工智能助手"的自我认知。这涉及到准备自我认知训练数据集，并通过脚本生成数据[2][8]。利用Unsloth和G...

人工智能 2024-06-09 人工智能

1175阅读

llama_index微调BGE模型

微调模型是为了让模型在特殊领域表现良好，帮助其学习到专业术语等。本文采用llama_index框架微调BGE模型，跑通整个流程，并学习模型微调的方法。已开源：https://github.com/stay-leave/enhance_llm 一、...

大数据 2024-06-08 人工智能

1163阅读

基于阿里云PAI部署LLaMA Factory 完成Llama3低代码微调和部署

一、引言阿里云人工智能平台 PAI 提供了面向开发者与企业的深度学习工程平台，其中交互式建模 PAI-DSW 集成了 Jupyter 等多种云端开发环境，提供丰富的计算资源与镜像环境，实现开箱即用的高效开发模式。LLaMA Factory 则是一款...

大数据 2024-06-07 人工智能

1596阅读

LlamaFactory源码解析 PPO

class CustomPPOTrainer(PPOTrainer, Trainer : r""" Inherits PPOTrainer. """ def __init__( self,...

生成式AI 2024-06-04 人工智能

1799阅读

麦肯锡调查显示：生成式AI应用大中华区增长最快

据全球顶级咨询公司麦肯锡（McKinsey & Company）发布的最新调查报告《he state of AI in early2024:Gen AI adoption spikes and starts to generate value》，显...

生成式AI 2024-06-03 人工智能

851阅读

AI智能体研发之路-模型篇（一）：大模型训练框架LLaMA-Factory在国内网络环境下的安装、部署及使用

博客导读：《AI—工程篇》 AI智能体研发之路-工程篇（一）：Docker助力AI智能体开发提效 AI智能体研发之路-工程篇（二）：Dify智能体开发平台一键部署 AI智能体研发之路-工程篇（三）：大模型推理服务框架Ollama...

大数据 2024-06-01 人工智能

1468阅读

笔记1--Llama 3 超级课堂 | Llama3概述与演进历程

1、Llama 3概述 https://github.com/SmartFlowAI/Llama3-Tutorial.git【Llama 3 五一超级课堂 | Llama3概述与演进历程】 2、Llama 3 改进点【最新【大模型微调】大模...

生成式AI 2024-06-01 人工智能

996阅读

筑基砥柱：EcomXL-万相实验室AIGC电商基础模型

✍? 本文作者：顾知、岁星、天扉、佳玏、允行一、背景随着生成式技术浪潮的兴起，Stable Diffusion结合Controlnet等控制能力在电商场景得到了广泛的应用，其中制作一张优秀的商品主图（亦或是广告的创意图，以下简称商品...

大数据 2024-05-30 人工智能

950阅读

RWKV 模型本地部署工具 Ai00 Server 保姆级教程

了解Ai00 简介 Ai00 Server 是基于 web-rwkv 推理引擎的 RWKV 语言模型推理 API 服务器。它本身也是一个基于 MIT 协议的开源软件，由 RWKV 开源社区成员 @cryscan 和@顾真牛牵头成立的 Ai00-x 开发...

人工智能 2024-05-30 人工智能

1097阅读

超详细！AIGC面试系列大模型进阶(2)

本期问题快览 1. 如何让大模型处理更长的文本？ 2. 如果想要在某个模型基础上做全参数微调，究竟需要多少显存？ 3. 什么是有监督微调SFT 4. SFT 指令微调数据如何构建? 5. 领域数据训练后，通用能力往往会有所下降，如何缓解模型遗忘...

人工智能 2024-05-30 人工智能

1763阅读

大模型时代下如何数据治理？|

随着ChatGPT和其他大语言模型(LLM 的快速发展，AI已成为我们工作和生活中不可或缺的一部分，并从简单的文本生成逐渐演变成为能够处理复杂语义理解和生成的高级AI系统。这些模型的能力和应用范围的扩展，不仅标志着技术的进步，也标志着它们在实际业务中...

AIGC 2024-05-29 人工智能

947阅读

LLaMA-Factory+qwen多轮对话微调测评

目录训练的时间和效果数据准备数据样例数据配置环境搭建模型微调训练模型预测运行成功的web UI LLaMA-Factory地址：https://github.com/hiyouga/LLaMA-Factory/blo...

大数据 2024-05-27 人工智能

1581阅读

llama-factory SFT系列教程 (一)，大模型 API 部署与使用

文章目录背景简介难点前置条件 1. 大模型 api 部署下一步阅读背景本来今天没有计划学 llama-factory，逐步跟着github的文档走，发现这框架确实挺方便，逐渐掌握了一些。最近想使用 SFT 微调大模...

AIGC 2024-05-26 人工智能

1976阅读

CVPR 2024 | 风格迁移和人像生成汇总！扩散模型diffusion用于经典AIGC方向

风格迁移 1、DEADiff: An Efficient Stylization Diffusion Model with Disentangled Representations 基于文本到图像扩散模型在迁移参考风格方面具有巨大潜力。然而，...

生成式AI 2024-05-25 人工智能

1278阅读

LLamaFactory：当下最容易上手的大模型微调工具

近日，国内的一款微调框架发布了自己的论文《LLAMAFACTORY: Unified Efficient Fine-Tuning of 100+ Language Models》，对他们的框架做了系统性的总结。该框架自推出后迅速出圈，现已斩获15.6k的s...

人工智能 2024-05-24 人工智能

1350阅读

LlamaFactory 进行大模型 llama3 微调，轻松上手体验学习

节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学，针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。汇总合集：《大模型面试宝典...

AIGC 2024-05-24 人工智能

1158阅读

LLaMA Factory单机微调的实战教程

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...

AIGC 2024-05-24 人工智能

861阅读