预训练第8页 - AIGC资讯

NLP主流大模型如GPT3/chatGPT/T5/PaLM/LLaMA/GLM的原理和差异有哪些-详细解读

自然语言处理（NLP）领域的多个大型语言模型（如GPT-3、ChatGPT、T5、PaLM、LLaMA和GLM）在结构和功能上有显著差异。以下是对这些模型的原理和差异的深入分析： GPT-3 (Generative Pre-trained Transf...

AIGC 2024-07-12 人工智能

1472阅读

在stable diffusion中如何分辨lora、大模型、controlnet

LoRA (LowRank Adaptation Stable Diffusion LoRA 是微软的研究人员为了解决大语言模型微调而开发的一项技术,它是一个多模态语言-图像模型，LORA 可以学习将其语言表征迁移到图像 modal 中从而获得跨模态...

人工智能 2024-07-11 人工智能

983阅读

使用LlamaFactory进行模型微调：参数详解

在深度学习和自然语言处理领域，模型微调是提升预训练模型性能的重要手段。本文将介绍如何使用LlamaFactory进行模型微调，并详细解析一些关键参数，包括 --cutoff_len 1024、--flash_attn auto、--lora_rank 8、...

AIGC 2024-07-11 人工智能

4063阅读

Llama 3 模型微调的步骤

环境准备操作系统：Ubuntu 22.04.5 LTS Anaconda3：Miniconda3-latest-Linux-x86_64 GPU： NVIDIA GeForce RTX 4090 24G Step 1. 准备conda环境创...

人工智能 2024-07-11 人工智能

1032阅读

一文看懂LLaMA 2：原理、模型与训练

引言人工智能领域的快速发展，带来了许多强大的语言模型。LLaMA 2 是其中之一，以其出色的性能和灵活的应用能力，吸引了广泛关注。这篇文章将带你深入了解 LLaMA 2 的原理、模型架构和训练过程，帮助你全面掌握这一前沿技术。什么是LLaMA...

AIGC 2024-07-10 人工智能

1255阅读

LLaMA-Adapter：零初始注意机制的语言模型高效微调

23年6月来自上海AI实验室，香港中文大学和UCLA的论文“LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention“。 LLaMA-Adapter是...

生成式AI 2024-07-10 人工智能

1216阅读

AIGC内容分享(一)：一次性搞懂什么是AIGC

目录前言一、基本概念/理论 1、AI 2、AI大模型 3、开源 4、自然语言处理（NLP） 5、AIGC 6、AIGC和Chat GPT的关系 7、AIGC可以生成的内容二、常见的AIGC应用（一）常用AIGC软件（二）A...

AIGC 2024-07-10 人工智能

1206阅读

【Qwen2部署实战】llama.cpp：一键部署高效运行Qwen2-7B模型

系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...

大数据 2024-07-10 人工智能

1500阅读

第一批正在被AIGC重置的行业有话说

AIGC颠覆一切的时代，设计行业绝对是被影响最大的那一波。阿里一位从业近20年的老·设计师站出来说，AI2.0时代来临后，很多不了解设计行业的人，上来就问他带的设计团队要减多少人。他说说实话，自己心里面有点不舒服。 “大家为什么会这么理解?”老·设计师...

AIGC 2024-07-10 人工智能

812阅读

Meta Llama 3 来啦！性能算力究竟如何？

新一代大语言模型 Meta Llama 3 横空出世！前言就在4月19日，Meta公司推出了他们最新开源的大型语言模型(LLM Llama 3！这次的Llama 3包含了8B和70B两种不同参数规模的模型。那么作为Llama的第三代模型它...

大数据 2024-07-09 人工智能

906阅读

【AIGC 概念理解】Zero-Shot，One-Shot，Few-Shot，In-Context Learning，Tuning-Free/Training-Free/Inference-Only

在人工智能领域，特别是自然语言处理（NLP）和机器学习中，几个重要的概念正在推动研究和应用的前沿发展。以下是few-shot learning, zero-shot learning, in-context learning, tuning-free, t...

大数据 2024-07-09 人工智能

1254阅读

AIGC专栏12——EasyAnimateV3发布详解支持图&文生视频最大支持960x960x144帧视频生成

AIGC专栏12——EasyAnimateV3发布详解支持图&文生视频最大支持960x960x144帧视频生成学习前言项目特点生成效果相关地址汇总项目主页 Huggingface体验地址 Modelscope体验地址源...

AIGC 2024-07-09 人工智能

1080阅读

【大语言模型LLM】- Meta开源推出的新一代大语言模型 Llama 3

?博客主页：西瓜WiFi ?系列专栏：《大语言模型》很多非常有趣的模型，值得收藏，满足大家的收集癖！如果觉得有用，请三连?⭐❤️，谢谢！长期不定时更新，欢迎watch和fork！❤️❤️❤️ ❤️感谢大家点赞? 收藏⭐ 评论⭐ ?大语言模...

大数据 2024-07-08 人工智能

866阅读

在本地部署 Stable Diffusion：详细教程

第一步：环境准备 1、安装 Python 和 Conda 确保您的计算机上已安装 Python 3.x 版本。如果您使用 Conda 进行环境管理，请安装 Miniconda 或 Anaconda。 2、创建和激活虚拟环境打开命令行终端，并执...

AIGC 2024-07-08 人工智能

2092阅读

推荐开源项目：Purple Llama - 开放式生成AI的负责任构建工具集合

推荐开源项目：Purple Llama - 开放式生成AI的负责任构建工具集合 Purple Llama 是一个综合性的项目，旨在通过提供工具和评估方法，帮助社区在开放的生成人工智能模型上进行负责任的开发。这个项目不仅关注技术的可能性，更重视安全性和...

生成式AI 2024-07-08 人工智能

1161阅读

大语言模型的底层原理，ChatGPT，文心一言等人工智能体是如何产生的？本文将详细讲解

文章目录基础介绍一、预训练 1.数据准备质量过滤敏感内容过滤数据去重数据预处理实践质量过滤去重隐私过滤 2.词元化 BPE 分词 WordPiece 分词 Unigram 分词 3.数据调度总结参考文献...

AIGC 2024-07-08 人工智能

1334阅读

AIGC生成论文汇总

1.1 无特定身份人物生成（Non-identity Generation） (1 变分自动编码器（Variational Auto-Encoder） 2022, CVPR,Shunyu Yao, RuiZhe Zhong, Yichao Ya...

大数据 2024-07-08 人工智能

962阅读

[arxiv论文解读]LlamaFactory：100+语言模型统一高效微调

该文档是一篇关于LLAMAFACTORY的学术论文，这是一个用于高效微调大型语言模型（LLMs）的统一框架。这篇论文详细介绍了LLAMAFACTORY的设计、实现和评估，以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释：摘要（Abst...

AIGC 2024-07-08 人工智能

1801阅读

深入浅出理解 AI 生图模型 Stable Diffusion

Stable Diffusion 概述为了降低理解成本，我会尽量减少有关数学的知识点，并尽量用类比的方式，帮助你理解一些概念。所以有可能出现不够严谨的情况，如果你有更好的解释，欢迎留言。 Stable Diffusion（稳定扩散）严格说来...

大数据 2024-07-07 人工智能

1268阅读

第一章: AIGC概述

1. AIGC的定义与历史 1.1 什么是AIGC？ AIGC，全称为人工智能生成内容（Artificial Intelligence Generated Content），是一种利用人工智能技术来自动生成各种类型内容的方式。这些内容包括文字、...

生成式AI 2024-07-07 人工智能

1029阅读

llama factory 增量预训练代码解析 & .yaml文件传参和sh的不同 examples/train_lora/llama3_lora_pretrain.yaml

新版本(2024年后的llama factory，改用了.yaml文件传参的方式，请问和原始的.sh传参方式有什么不同？新版本的 llama factory 框架使用 .yaml 文件来传递参数，相较于原始的 .sh 脚本传参方式，有一些显著的不...

生成式AI 2024-07-07 人工智能

1479阅读

破解ChatGPT惊人耗电！DeepMind新算法训练提效13倍，能耗暴降10倍

【新智元导读】ChatGPT能耗惊人，该怎么解?谷歌DeepMind新算法JEST问世，让LLM训练的迭代次数降低13倍，计算量减少10倍，或将重塑AI未来。 ChatGPT早已成为世界耗能大户:一天用掉超50万度电，相当于1.7万个美国家庭的用电量! 然...

AIGC 2024-07-07 人工智能

961阅读

LLaMA-Cult-and-More：深度学习的新里程碑

LLaMA-Cult-and-More：深度学习的新里程碑在人工智能领域，尤其是自然语言处理（NLP）中，模型的规模和能力不断提升，推动了行业的飞速进步。今天我们要介绍的是一个名为LLaMA的开源项目，它由shm007g开发并维护，旨在提供高效的、大规...

人工智能 2024-07-07 人工智能

880阅读

在昇腾服务器上使用llama-factory对baichuan2-13b模型进行lora微调

什么是lora微调 LoRA 提出在预训练模型的参数矩阵上添加低秩分解矩阵来近似每层的参数更新，从而减少适配下游任务所需要训练的参数。环境准备这次使用到的微调框架是llama-factory。这个框架集成了对多种模型进行各种训练的代码，少...

人工智能 2024-07-07 人工智能

993阅读

传知代码-Llama 2：开放基础和微调聊天模型以及法律判决数据集分类实战(论文复现)

代码以及视频讲解本文所涉及所有资源均在传知代码平台可获取本文概述本文首先会介绍一下Llama2大模型，然后会使用一个公开的中文法律判决数据集（部分）进行Llama2提示学习的分类实战。论文主要内容这篇文章介绍了Llama 2，这是...

生成式AI 2024-07-07 人工智能

820阅读

全方位了解 Meta Llama 3

本文将为您提供 Llama 3 的全面概览，从其架构、性能到未来的发展方向，让您一文了解这一革命性大语言模型的所有要点。 Meta Llama 发展历程 Llama 1 Llama 是由 Meta(FaceBook AI 发布的一个开源项目...

AIGC 2024-07-06 人工智能

1227阅读

Stable Diffusion 实操教程：轻松掌握图像生成技术

一、引言 Stable Diffusion 是一种强大的图像生成技术，通过利用扩散模型，能够生成高质量的图像。在当前的人工智能领域，Stable Diffusion 已被广泛应用于艺术创作、图像增强和生成等多个领域。本篇文章将详细介绍 Stable Di...

生成式AI 2024-07-06 人工智能

1152阅读

AIGC 007-E4T基于编码器的域调优用于文本到图像模型的快速个性化！

AIGC 007-E4T基于编码器的域调优用于文本到图像模型的快速个性化！文章目录 0 论文工作 1 论文方法 2 效果 0 论文工作这篇论文提出了一种使用领域特定编码器来快速将文本到图像模型适配到新领域的方案...

大数据 2024-07-06 人工智能

950阅读

Stable Diffusion 3 开源发布可下载体验

本文来自huggingface翻译 Stable Diffusion 3 Medium是一种多模态扩散变换器 (MMDiT 文本到图像模型，其在图像质量、排版、复杂提示理解和资源效率方面的性能有极大提升。有关更多技术细节，请参阅研究论文。请注意：此...

人工智能 2024-07-06 人工智能

989阅读

LLaMA 2-原理&模型&训练-你懂了吗?

LLaMA 2的原理 LLaMA 2是Meta AI开发的大型语言模型，它基于Transformer架构，采用了自注意力机制来处理输入序列中的长期依赖关系。LLaMA 2的核心原理包括自注意力机制、多头注意力、层归一化和残差连接等，这些技术共同使得模型...

大数据 2024-07-06 人工智能

1095阅读

推荐大模型书籍|《从ChatGPT到AIGC：智能创作与应用赋能》

自2023年以来，AI聊天机器人ChatGPT火爆互联网，其颠覆性的使用体验重塑了人们对于AI的认知。而ChatGPT背后的技术―AIGC也引起了互联网圈的关注，打开了人们对AI应用的想象空间。本书从ChatGPT入手，以AIGC为中心，对AIGC的理论知...

人工智能 2024-07-06 人工智能

1047阅读

使用LLaMA-Factory微调Llama3大模型

一、基础模型下载本文的背景是微调一个基于Llama3的中文版模型Llama3-8B-Chinese-Chat，用于中文指定领域的问答下游任务 1、HuggingFace官网直接下载官网地址：https://huggingface.co/mo...

人工智能 2024-07-05 人工智能

1405阅读

大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例

大家好，我是微学AI，今天给大家介绍一下大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例, LLaMA-Factory是一个专门用于大语言模型微调的框架，它支持多种微调方法，如LoRA、QLoRA等，并提供了丰...

大数据 2024-07-05 人工智能

1514阅读

AIGC工具全面解析: 优缺点一目了然

目录 AIGC工具全面解析: 优缺点一目了然优点 1. 准确性高 2. 多领域支持 3. 自动学习和迭代缺点 1. 可能存在较高的错误率 2. 受限于训练数据 3. 缺乏主动性和创造力结论 AIGC工具全面解析: 优缺点一...

AIGC 2024-07-05 人工智能

1070阅读

「创意无界，智领未来」：解锁AIGC技术的无限潜能与行业重塑力

文章目录 1. 探讨AIGC技术的发展现状和未来趋势 1.1 引言 1.1.1 定义AIGC 1.1.2 重要性与应用领域 1.1.3 文章目的 2. AIGC技术的发展历程 2.1 起源与早期阶段 2.2 技术突破 2.2.1 深度...

大数据 2024-07-05 人工智能

933阅读

AI绘画-Stable Diffusion 原理介绍及使用

引言好像很多朋友对AI绘图有兴趣，AI绘画背后，依旧是大模型的训练。但绘图类AI对计算机显卡有较高要求。建议先了解基本原理及如何使用，在看看如何实现自己垂直行业的绘图AI逻辑。或者作为使用者，调用已有的server接口。首先需要说明的是，AI绘图和...

生成式AI 2024-07-05 人工智能

1015阅读

AIGC从入门到实战：只缘身在此山中：GPT 模型靠什么取胜和出圈？

AIGC从入门到实战：只缘身在此山中：GPT 模型靠什么取胜和“出圈”？作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming / TextGenWebUILLM AIGC from Begi...

AIGC 2024-07-04 人工智能

904阅读

AI版沪上“繁花”上演，腾讯构建离产业最近的人工智能

作为新一轮科技革命和产业变革的重要驱动力量，人工智能被认为是发展新质生产力的主要阵地。7月4日，以“以共商促共享，以善治促善智”为主题的2024世界人工智能大会在上海开幕。连续七届参加大会的腾讯，今年聚焦“用AI助力美好生活，构建离产业最近的AI”这一...

AIGC 2024-07-04 人工智能

825阅读

文献研读｜AIGC溯源场景及研究进展

前言：本文介绍关于AIGC生成阶段针对不同溯源场景的几篇相关工作。相关文章：针对文生图模型的AIGC检测论文研读，参见此篇文章。如下图所示，在AIGC生成阶段，有4种溯源场景： 1）生成模型溯源训练数据 2）微调模型溯源预训练模型 3）AI...

生成式AI 2024-07-04 人工智能

1401阅读

8人半年肝出开源版GPT-4o，0延迟演示全网沸腾！背后技术揭秘，人人免费用

【新智元导读】GPT-4o或许还得等到今年秋季才对外开放。不过，由法国8人团队打造的原生多模态Moshi，已经实现了接近GPT-4o的水平，现场演示几乎0延迟，AI大佬纷纷转发。没想到，「开源版」GPT-4o这么快就来了! 昨夜，来自法国AI实验室kyu...

生成式AI 2024-07-04 人工智能

967阅读

开源大模型 Llama 3

开源大模型Llama 3是一个在多个领域都展现出卓越性能的大模型。下面将为您介绍Llama 3的特性和一些简单的使用案例。一、Llama 3介绍 Llama 3在Meta自制的两个24K GPU集群上进行预训练，使用了超...

大数据 2024-07-04 人工智能

1146阅读

【LLM教程-llama】如何Fine Tuning大语言模型？

今天给大家带来了一篇超级详细的教程,手把手教你如何对大语言模型进行微调(Fine Tuning ！（代码和详细解释放在后文）目录大语言模型进行微调(Fine Tuning 需要哪些步骤？大语言模型进行微调(Fine Tuning 训练过程及代码...

AIGC 2024-07-04 人工智能

1100阅读

【AI原理解析】— 文心一言模型

目录模型架构 Transformer模型编码器-解码器结构训练过程预训练微调关键技术知识增强上下文感知个性化生成推理与生成应用场景问答系统文本生成对话系统模型架构 Trans...

人工智能 2024-07-04 人工智能

1272阅读

开源之光 Stable Diffusion 3 技术论文全解：公式占一半，实验很充分！

文章链接：https://arxiv.org/pdf/2403.03206 扩散模型通过反转数据到噪声的正向路径来从噪声中创建数据，并已成为处理高维感知数据（如图像和视频）的强大生成建模技术。Rectified flow是一种最近提出的生成模型形式，它将...

大数据 2024-07-04 人工智能

1649阅读

如何使用共享GPU平台搭建LLAMA3环境（LLaMA-Factory）

0. 简介最近受到优刻得的使用邀请，正好解决了我在大模型和自动驾驶行业对GPU的使用需求。UCloud云计算旗下的[Compshare](https://www.compshare.cn/? ytag=GPU_lovelyyoshino_Lcsdn_...

AIGC 2024-07-03 人工智能

959阅读

论文研读｜针对文生图模型的AIGC检测

前言：人工智能生成内容的鉴别（AIGC检测）算是当前的研究热点之一，本篇文章介绍几篇针对文生图模型的 AIGC 检测相关工作。相关文章：AIGC溯源相关研究详见此篇文章目录 1. Towards Universal Fake...

AIGC 2024-07-03 人工智能

1460阅读

AIGC 生成对抗网络、大型预训练模型 LLM ChatGPT Transformer LLaMA LangChain Prompt Engineering 提示工程

AIGC AIGC（Artificial Intelligence Generated Content）是指基于生成对抗网络、大型预训练模型等人工智能的技术方法，通过已有数据的学习和识别，以适当的泛化能力生成相关内容的技术。AIGC的爆发得益于GAN、...

人工智能 2024-07-03 人工智能

977阅读

探索多模态智能边界：Visual-Chinese-LLaMA-Alpaca 开源项目解析与应用指南

探索多模态智能边界：Visual-Chinese-LLaMA-Alpaca 开源项目解析与应用指南在人工智能领域，多模态学习正逐渐成为研究热点，它旨在融合视觉和语言信息，构建能够理解和生成跨模态内容的智能体。Visual-Chinese-LLaMA...

生成式AI 2024-07-02 人工智能

983阅读

本地离线模型搭建指南-LLaMA-Factory训练框架及工具

搭建一个本地中文大语言模型（LLM）涉及多个关键步骤，从选择模型底座，到运行机器和框架，再到具体的架构实现和训练方式。以下是一个详细的指南，帮助你从零开始构建和运行一个中文大语言模型。本地离线模型搭建指南将按照以下四个部分展开中文大语言模型底座选...

大数据 2024-07-02 人工智能

1642阅读

基于Python和TensorFlow实现BERT模型应用

本文分享自华为云社区《使用Python实现深度学习模型：BERT模型教程》，作者： Echo_Wish。 BERT（Bidirectional Encoder Representations from Transformers）是Google提出的一种用...

AIGC 2024-07-02 人工智能

1017阅读