预训练第5页 - AIGC资讯

开源模型应用落地-qwen2-7b-instruct-LoRA微调&模型合并-LLaMA-Factory-单机多卡-RTX 4090双卡（六）

一、前言本篇文章将使用LLaMA-Factory去合并微调后的模型权重，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。二、术语介绍 2.1. LoRA微调 LoRA (Low-Ra...

AIGC 2024-08-22 人工智能

892阅读

如何高效微调多模态Transformers模型：从入门到实践指南

多模态大模型（Multimodal Large Models）是能够处理多种类型数据（如文本、图像、音频等）的机器学习模型。transformers 是当前多模态大模型中的一种重要架构。目录 Transformers简介多模态Transforme...

AIGC 2024-08-22 人工智能

1236阅读

Datawhale X 魔塔 AI夏令营 AIGC方向Task1

小白学习笔记，如有错误请各位大佬指正一、跑通baseline教程 Datawhale 教程链接Datawhale 二、baseline代码分析 1.安装库 !pip install simple-aesthetics-predictor !p...

AIGC 2024-08-22 人工智能

597阅读

Datawhale X 魔搭 AI夏令营第四期魔搭-AIGC方向 Task03笔记

从零入门AI生图原理&实践是 Datawhale 2024 年 AI 夏令营第四期的学习活动（“AIGC”方向），基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。 Datawhale官方的速通教程链接： Task 1...

大数据 2024-08-22 人工智能

662阅读

一文看懂llama2（原理&模型&训练）

Llama2（大型语言模型2） Llama2（大型语言模型2）主要基于近年来火爆的Transformer架构。下面是Llama2的几个核心原理： Transformer 架构: Llama2采用了Transformer网络，它通过自注意力机制来处理...

人工智能 2024-08-22 人工智能

659阅读

探索音乐的智慧：MU-LLaMA 模型引领文本到音乐生成新纪元

探索音乐的智慧：MU-LLaMA 模型引领文本到音乐生成新纪元 MU-LLaMAMU-LLaMA: Music Understanding Large Language Model项目地址:https://gitcode.com/gh_mirrors/...

生成式AI 2024-08-22 人工智能

659阅读

Datawhale Al夏令营 AIGC方向 task2

1、代码解读 1.1、安装 Data-Juicer 和 DiffSynth-Studio # 安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor # 安...

AIGC 2024-08-21 人工智能

585阅读

ComfyUI中的sam模型国内下载方法

was-node-suite-comfyui这个节点安装的时候，有它内部的config配置文件，里面其实给了一些下载地址，配置文件里是这么写的： "sam_model_vith_url": "https://dl.fbaipublicfiles.com/...

人工智能 2024-08-21 人工智能

2907阅读

Llama中文大模型-模型微调

同时提供了LoRA微调和全量参数微调代码，关于LoRA的详细介绍可以参考论文“[LoRA: Low-Rank Adaptation of Large Language Models](https://arxiv.org/abs/2106.09685 ”以及...

人工智能 2024-08-21 人工智能

665阅读

即刻体验 Llama3.1就在Amazon Bedrock!

引言在人工智能的浪潮中，大型语言模型（LLMs）不断推动着技术边界的扩展。Meta 最新推出的 Llama 3.1 模型系列，以其卓越的性能和广泛的应用前景，引起了业界的广泛关注。现在，激动人心的消息来了——Llama3.1 已经在 Amazon Be...

AIGC 2024-08-21 人工智能

599阅读

每天免费100万token，GPT-4o新增微调功能

OpenAI向所有开发者推出GPT-4o数据微调功能，可以使用自己的数据打造准确率、输出模式更好的个性化ChatGPT助手。例如，韩国最大电信运营商SK Telecom通过OpenAI的数据微调功能，打造了特定的AI助手，使对话总结准确率提高了35%，意...

AIGC 2024-08-21 人工智能

665阅读

【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人

系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...

生成式AI 2024-08-21 人工智能

1389阅读

江大白 | 视觉Transformer与Mamba的创新改进，完美融合（附论文及源码）

本文来源公众号“江大白”，仅用于学术分享，侵权删，干货满满。原文链接：视觉Transformer与Mamba的创新改进，完美融合（附论文及源码）以下文章来源于微信公众号：AI视界引擎作者：AI引擎链接：https://mp.weixin.q...

大数据 2024-08-21 人工智能

1083阅读

Datawhale AI夏令营第四期魔搭- AIGC方向 task02笔记

大纲一、前言二、代码块解读 2.1 依赖包安装 2.2 数据集下载 2.3 metadata.jsonl文件生成（图片及对应标签） 2.4 设置data-juicer 配置文件并执行，处理metadata.jsonl文件生成result....

生成式AI 2024-08-21 人工智能

605阅读

论文阅读-Transformer Layers as Painters

1. 摘要尽管大语言模型现在已经被广泛的应用于各种任务，但是目前对其并没有一个很好的认知。为了弄清楚删除和重组预训练模型不同层的影响，本文设计了一系列的实验。通过实验表明，预训练语言模型中的lower和final layers与中间层分布不一致，并且...

大数据 2024-08-20 人工智能

711阅读

Post-Training有多重要？AI2研究员长文详解前沿模型的后训练秘籍

越来越多研究发现，后训练对模型性能同样重要。Allen AI的机器学习研究员Nathan Lambert最近发表了一篇技术博文，总结了科技巨头们所使用的模型后训练配方。随着LLM学界和工业界日新月异的发展，不仅预训练所用的算力和数据正在疯狂内卷，后训练（...

人工智能 2024-08-20 人工智能

769阅读

最强模型Llama 3.1 405B正式发布，扎克伯格：开源引领新时代

刚刚，大家期待已久的 Llama 3.1 官方正式发布了！ Meta 官方发出了「开源引领新时代」的声音。在官方博客中，Meta 表示：「直到今天，开源大语言模型在功能和性能方面大多落后于封闭模型。现在，我们正在迎来一个开源引领的新时代。我们公开...

人工智能 2024-08-20 人工智能

588阅读

【最新最热】开源引领未来：Llama 3.1震撼发布，405B参数超越闭源GPT-4，扎克伯格宣告AI分水岭到来

刚刚，备受瞩目的LIama 3.1震撼问世，荣耀加冕为大模型领域的最新王者！在横跨150余项基准测试的挑战中，LIama 3.1的405B版本以其卓越性能，不仅与当前顶尖的SOTA模型——GPT-4o及Claude 3.5 Sonnet并驾齐驱，更在多...

生成式AI 2024-08-20 人工智能

532阅读

Datawhale X 魔塔AI夏令营 ——从零入门AI生图原理&实践_task 1

一. 基础知识 1.1 文生图发展历史 1.2 文生图基础知识文生图主要以SD系列基础模型为主，以及在其基础上微调的lora模型和人物基础模型等。 1.2.1 文生图流程图 1. 输入提示词 ...

大数据 2024-08-20 人工智能

657阅读

微调（一）

微调有两种办法，一是模型全部参数的微调，二是少量参数高效的微调。前者由于参数多，需要的GPU多，并且全参数微调可能把模型带偏，后者只需要微调少量参数，需要的GPU少，还可能达到不错的效果，成为大家研究的重点，取了个专有名词Parameter-Effic...

AIGC 2024-08-20 人工智能

791阅读

尝试问AI：什么是AIGC？

本文内容为AI生成介绍一下什么是AIGC Q：介绍一下什么是AIGC A： AIGC，全称为Artificial Intelligence Generated Content（人工智能生成内容），是一种利用人工智能技术自动创造各种形式内...

大数据 2024-08-19 人工智能

694阅读

【已解决】报错“copying a param with shape torch.Size([1280, 1280]) from checkpoint”

在使用SDXL时，报错“copying a param with shape torch.Size([1280, 1280] from checkpoint, the shape in current model is torch.Size([1280,...

AIGC 2024-08-19 人工智能

692阅读

运行Llama 2于本地CPU上的开源LLM推理指南

运行Llama 2于本地CPU上的开源LLM推理指南 Llama-2-Open-Source-LLM-CPU-InferenceRunning Llama 2 and other Open-Source LLMs on CPU Inference Lo...

大数据 2024-08-19 人工智能

774阅读

Datawhale X 魔搭 AI夏令营第四期 AIGC方向学习笔记（一）

本期主要任务是了解AI文生图的原理并进行相关实践下面是对baseline部分代码的功能介绍：安装Data-juicere和DiffSynth-Studio !pip install simple-aesthetics-predictor !pip...

大数据 2024-08-19 人工智能

612阅读

Datawhale X 魔搭 AI夏令营-AIGC方向-task2知识总结

文生图背景早期探索（1960-1990）最早出现于计算机视觉和图像处理。早期图像生成技术主要依赖与规则和模板匹配，通过预定义的规则将文本转换为简单的图形。受限于计算能力和算法，此阶段生成的图像质量较低，应用场景受限。基于统计...

AIGC 2024-08-18 人工智能

793阅读

Datawhale AI夏令营第四期 AIGC方向 task02 初学者笔记

一、Prompt工程介绍:1、概念： Prompt工程，也称为提示工程或指令工程，是在自然语言处理（NLP）领域中一种重要的技术和方法。它主要用于指导预训练的大规模语言模型（Large Language Models, LLMs）生成高质量、准确且有针对...

AIGC 2024-08-18 人工智能

578阅读

Datawhale X 魔搭 AI夏令营–AIGC Task1

Datawhale X 魔搭 AI夏令营–AIGC Task1 文章目录 Datawhale X 魔搭 AI夏令营--AIGC Task1 赛事介绍文生图基础知识介绍实践操作 step0：开通阿里云PAI-DSW试用 step1...

人工智能 2024-08-18 人工智能

574阅读

Datawhale X 魔搭 AI夏令营 “AIGC”方向 task1

一、任务要求 task1 的任务和上一期的类似，都是跑通给出的代码即可，没有太大难度。具体要求是训练 Lora 模型，实现文生图，额外的要求是8张图片必须组成一个连贯的故事，需要一定的“写小作文”能力。二、代码解析下载数据集这一步不用分析...

大数据 2024-08-17 人工智能

595阅读

LLAMA Factory: 简洁高效的大语言模型训练平台

LLAMA Factory: 简洁高效的大语言模型训练平台 LLaMA-Factory易于使用的LLM微调框架（LLaMA, BLOOM, Mistral, 百川， Qwen, ChatGLM）。项目地址:https://gitcode.com/gh_...

大数据 2024-08-17 人工智能

1413阅读

大模型落地：GPU向上，NPU向下

自从ChatGPT问世以来，大模型取得了迅猛的发展。不仅是在ChatGPT本身这一自然语言处理领域取得了重要进展，而且在视频领域也有令人瞩目的大模型，比如DINOv2，它可以对视频图像进行语义理解。此外，SAM是一种能够对场景进行细粒度分割的模型。这些进展...

人工智能 2024-08-17 人工智能

581阅读

Datawhale X 魔搭 AI夏令营-AIGC文生图-task1-笔记

目录 1 赛题解读 2 文生图的历史 3 文生图基础知识介绍 3.1 提示词 3.2 Lora 3.3 ComfyUI 3.4 参考图控制 4 实践-通过代码完成模型微调&AI生图-Test 4.1 体验base...

人工智能 2024-08-17 人工智能

585阅读

LLaMA-Factory全面指南：从训练到部署

项目背景与概述 LLaMA-Factory项目目标 LLaMA-Factory项目是一个专注于大模型训练、微调、推理和部署的开源平台。其主要目标是提供一个全面且高效的解决方案，帮助研究人员和开发者快速实现大模型的定制化需求。具体来说，LLaMA-F...

大数据 2024-08-16 人工智能

4978阅读

探索中文智能的未来：Chinese-LLaMA-Alpaca-3 项目深度解析

探索中文智能的未来：Chinese-LLaMA-Alpaca-3 项目深度解析 Chinese-LLaMA-Alpacaymcui/Chinese-LLaMA-Alpaca 是一个基于 LLaMA 的中文自然语言处理模型。适合在自然语言处理、机器学习和...

人工智能 2024-08-16 人工智能

590阅读

普通程序员必看！AIGC工程师岗位兴起，掌握AI技术成就高薪未来

随着人工智能技术的迅猛发展，AIGC（AI Generated Content）已成为行业的新热点。作为普通程序员，面对这一变革，我们需要不断学习和掌握新的AI技术，以适应时代的需要。AIGC工程师这一新兴岗位也应运而生。什么是AIGC工程师？...

AIGC 2024-08-16 人工智能

756阅读

【Qwen2微调实战】Lora微调Qwen2-7B-Instruct实践指南

系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...

生成式AI 2024-08-16 人工智能

1451阅读

Datawhale X 魔塔 AI夏令营第四期-AIGC文生图方向 Task1笔记

一、文生图背景文生图（Text-to-Image Generation）是一种通过文本生成图像的技术，其发展历程可以追溯到早期的计算机视觉和自然语言处理研究。文生图的概念最早出现于计算机视觉和图像处理的早期研究中。早期的图像生成技术主要...

AIGC 2024-08-16 人工智能

766阅读

Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记--切记我是一个温柔的刀客

Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记作者: 福州大学切记我是一个温柔的刀客 2024/8/10 从零入门AI生图原理&实践是 Datawhale 2024 年 AI 夏令营第四期的学习活...

大数据 2024-08-15 人工智能

486阅读

Llama 3.1横空出世！开源巨无霸首次击溃闭源，全民GPT-4时代来临

新智元2024-07-24 12:30北京编辑：编辑部【新智元导读】大模型格局，再次一夜变天。Llama 3.1 405B重磅登场，在多项测试中一举超越GPT-4o和Claude 3.5 Sonnet。史上首次，开源模型击败当今最强闭源模型。小扎大...

人工智能 2024-08-15 人工智能

538阅读

Datawhale X 魔搭 AI夏令营第四期AIGC文生图方向Task1笔记

目录前置知识生成对抗网络（GAN）大规模预训练模型 LoRA baseline一站式实现过程下载baseline文件安装环境，然后重启kernel 调整prompt 总结前置知识指导手册里写得很详细，这里写一...

人工智能 2024-08-15 人工智能

593阅读

LLaMA-Factory 大模型微调超简单，从零开始玩转大模型微调

目录 LLaMA-Factory 大模型微调超简单，从零开始开始玩转大模型微调为什么要使用LLaMA-Factory进行微调？如何使用LLaMA-Factory进行微调？安装启动数据准备 Alpaca 格式指令监督微调数据集...

生成式AI 2024-08-15 人工智能

1592阅读

Llama 3.1用了1.6万个英伟达H100 GPU，耗费......

目录 Llama 3.1发布简介 Llama 3.1模型规模与训练大模型企业发展面临的问题与困境算力和能耗算力方面数据和资金方面技术和人才方面 Llama 3.1发布简介当地时间 2024年 7月 23号，Meta 公司发布...

人工智能 2024-08-14 人工智能

634阅读

Datawhale X 魔搭 AI夏令营第四期 | AIGC文生图——可图Kolors-LoRA风格故事 Task1笔记

Hi，大家好，我是半亩花海。最近在尝试学习AIGC的内容，并报名参加了Datawhale举办的2024年AI第四期夏令营，主要学习内容是从零入门AI生图原理和实践。本次活动基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”进而开展的项目实践学习，很适...

人工智能 2024-08-14 人工智能

572阅读

Character.AI组团投身谷歌 AI小厂为何难逃「卖身」宿命？

又一家AI独角兽公司被大厂“收编”。8月2日，AI创业公司Character.AI的联合创始人、CEO Noam Shazeer 加入DeepMind团队，双方还签了个非独家协议:Character.AI授权谷歌使用其模型，谷歌则为Character.AI...

大数据 2024-08-14 人工智能

616阅读

Datawhale X 魔搭 AI夏令营第四期AIGC task1

本期夏令营AIGC方向是通过参加可图Kolors-LoRA风格故事挑战赛https://tianchi.aliyun.com/competition/entrance/532254，学习并实践文生图AIGC、工作流搭建、LoRA微调等技术。赛题内容...

AIGC 2024-08-14 人工智能

553阅读

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory（五）

一、前言本篇文章将使用LLaMA-Factory去高效微调QWen2系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。二、术语介绍 2.1. LoRA微调 LoRA (Low...

生成式AI 2024-08-14 人工智能

758阅读

AIGC大模型面经汇总，太全了！

字节暑期实习多模态算法 (二面凉经一面 2024/3/28 下午17:00-18:00 1.上来没有自我介绍 2.直接介绍NeurIPS论文，中间穿插着一些提问 3.说一下Transformer的整体结构 4.了解有哪些位置编码方式吗 5.说一...

大数据 2024-08-13 人工智能

1169阅读

The Llama 3 Herd of Models 第8部分语音实验部分全文

第1,2,3部分，介绍、概览、预训练第4部分，后训练第5部分，结果第6部分，推理第7部分，视觉实验 8 Speech Experiments 我们进行了实验来研究将语音功能集成到Llama 3中的组合方法，类似于我们用于...

生成式AI 2024-08-13 人工智能

540阅读

隆重推出 Llama 3.1：迄今为止最强大的开源模型

The gates of heaven open: Llama 3.1 405B, the most capable models to date from Meta, is competitive with leading foundation mode...

AIGC 2024-08-12 人工智能

690阅读

Huatuo Llama Med Chinese 教程

Huatuo Llama Med Chinese 教程 Huatuo-Llama-Med-ChineseRepo for BenTsao [original name: HuaTuo (华驼 ], Instruction-tuning Large La...

大数据 2024-08-12 人工智能

639阅读

探索中文大模型的新高度：Chinese-LLaMA-Alpaca-3

探索中文大模型的新高度：Chinese-LLaMA-Alpaca-3 Chinese-LLaMA-Alpaca-3中文羊驼大模型三期项目 (Chinese Llama-3 LLMs developed from Meta Llama 3项目地址:ht...

大数据 2024-08-12 人工智能

675阅读