预训练第3页 - AIGC资讯

LLaMA-Factory仓基础功能架构及NPU/GPU环境实战演练

LLaMA-Factory 基础篇 LLaMA-Factory简介 LLaMA-Factory是一个开源的大规模语言模型微调框架，设计用于简化大模型的训练过程。它提供了一个统一的平台，支持多种大模型的微调，包括LLaMA、BLOOM、Mist...

大数据 2024-09-11 人工智能

1165阅读

如何部署Meta开源大模型Llama2，转换为Huggingface模型的权重文件

如何部署Meta开源大模型Llama2 一、申请下载权限通过Meta AI官网(https://llama.meta.com/llama-downloads/ 申请下载权限，注意Country/Region选择这里，可能会影响审查速度吧，...

大数据 2024-09-11 人工智能

2260阅读

OpenAI神秘模型「草莓」两周内上线？数学推理暴涨，月收费200刀已有人付费

就在刚刚，The Information曝出:OpenAI的草莓将于两周内上线!收费疑似200刀一个月，最大的特色就是比其他模型多思考10到20秒。然而因为「狼来了」太多回，网友们忍不住吐槽:OpenAI现在就是个炒作公司。最新消息，「草莓」将在两周内发...

大数据 2024-09-11 人工智能

779阅读

【大模型】llama系列模型基础

前言：llama基于transformer架构，与GPT相似，只用了transformer的解码器部分。本文主要是关于llama，llama2和llama3的结构解读。目录 1. llama 1.1 整体结构 1.2 RoPE 1...

生成式AI 2024-09-10 人工智能

1438阅读

新一代模型微调方案LLama-Pro ，快来围观！！！

❝ 大家好，我是 Bob! ? 一个想和大家慢慢变富的 AI 程序员? 分享 AI 前沿技术、项目经验、面试技巧! 欢迎关注我，一起探索，一起破圈！? Y LLAMA PRO论文笔记直达链接：摘要这篇论文介绍了一种名为L...

AIGC 2024-09-10 人工智能

848阅读

书单 | 大模型的书那么多，如何快速选到适合自己的那一本？来，教你！

大模型的书这么多，该怎么选呢？本期书单就来教大家怎么快速地从众多大模型书中选到你想要的那一本！大模型基础大模型入门不可错过的一本书，就是这本大模型界的经典畅销书**《大规模语言模型》**！系统性强，内容适合初学者，如果你想知道如何构建一个大模型...

AIGC 2024-09-10 人工智能

1673阅读

Datawhale X 魔搭 AI夏令营第四期魔搭-AIGC方向 task01笔记

赛题内容参赛者需在可图Kolors 模型的基础上训练LoRA 模型，生成无限风格，如水墨画风格、水彩风格、赛博朋克风格、日漫风格...... 基于LoRA模型生成 8 张图片组成连贯故事，故事内容可自定义；基于8图故事，评估LoRA风格的美感度...

AIGC 2024-09-09 人工智能

832阅读

开源大模型再迎“历史性时刻”，Meta发布Llama 3.1

7月23日晚，Meta正式推出了最新的开源大模型系列Llama 3.1，进一步缩小了开源模型与闭源模型之间的差距。Llama 3.1系列包括8B、70B和405B三个参数规模，其中Llama 3.1-405B参数的模型在多个基准测试中超越了OpenAI的G...

大数据 2024-09-08 人工智能

883阅读

【Datawhale X 魔搭 AI夏令营】第四期 AIGC方向学习笔记

零基础30分钟速通文生图一、开通阿里云PAI-DSW试用 1、开通阿里云免费试用链接：https://free.aliyun.com/?productCode=learn 2、在魔搭社区进行授权链接：https://www.models...

大数据 2024-09-08 人工智能

887阅读

Datawhale X 魔搭第四期 AIGC文生图方向-Task03笔记

Hello，各位小伙伴们，继上一次我们精读并跑通了baseline2后，我们对AIGC文生图方向又有了更进一步的了解。今天呢我们实现AIGC方向的进阶上分，还在犹豫什么，还不快快行动起来~ 好，话不多说，今天我们就来聊聊ComfyUI和Lora微调吧~...

人工智能 2024-09-08 人工智能

1043阅读

“探索Flux NF4：Stable Diffusion模型的综合指南“

前言您是否想直接在Stable Diffusion中使用Flux NF4，而不是ComfyUI界面？这是对这些调整的指南。Stable Diffusion已经成为了一个热门工具，用于创建具有非凡精度的AI生成图像。在本指南中，我们将探讨Stabl...

大数据 2024-09-07 人工智能

1259阅读

AIGC笔记--基于PEFT库使用LoRA

1--相关讲解 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS LoRA 在 Stable Diffusion 中的三种应用：原理讲解与代码示例 PEFT-LoRA 2--基本原理...

人工智能 2024-09-07 人工智能

1149阅读

Datawhale X魔搭 AI夏令营

Datawhale X魔搭AI夏令营 AIGC方向Task01学习笔记（本人水平有限，文章中引用了一些大佬写的内容，引用的图片上已注明出处） 1.活动简介从零入门AI生图原理&实践是 Datawhale 2024 年 AI 夏令营第四期...

生成式AI 2024-09-07 人工智能

702阅读

本地搭建和运行Whisper语音识别模型小记

搭建本地的Whisper语音识别模型可以是一个非常有用的项目，尤其是在需要离线处理语音数据的情况下。Whisper是OpenAI开发的一个开源语音识别模型，支持多语言和高效的转录能力。以下是详细的步骤来本地搭建和运行Whisper语音识别模型： 1....

人工智能 2024-09-07 人工智能

1395阅读

Llama 3.1 92页技术报告详细解读

引言半个月前，Meta发布了他们的开源大模型Llama3.1，在社区中引起广泛关注和讨论。现在几周的时间过去了，热度逐渐退潮，舆论逐渐降温，整个Llama3家族的技术报告也公开出来。报告数据更新到了Llama 3.1，正是理性地来审视一下这款大模型...

人工智能 2024-09-07 人工智能

1358阅读

Datawhale AI 夏令营【AIGC文生图】

Datawhale AI 夏令营----AIGC文生图一、赛事介绍 1、背景知识 2、比赛任务 3、文生图简介 4、数据集介绍二、Task1 baseline解析 1、导入相关库 2、数据集处理 3、保存数据 4、训练模型，查看训练脚...

AIGC 2024-09-07 人工智能

876阅读

【LLM模型微调】LLMs-微调经验-LLaMA微调指南v7.0

【导读】：本文是LLM模型微调第七篇，分享Meta于20240807的开源三篇文章：Methods for adapting large language models，To fine-tune or not to fine-tune，How to fin...

生成式AI 2024-09-06 人工智能

1467阅读

OpenAI GPT-3 Davinci：引领AI写作新纪元

本文还有配套的精品资源，点击获取简介：OpenAI研发的GPT-3模型，尤其是其Davinci版本，代表了自然语言处理领域的重大突破，具有1750亿参数，提升了AI在理解和生成语言的能力。GPT-3的Davinci版本以顶级性能著称，在多种语...

大数据 2024-09-06 人工智能

824阅读

浅谈AIGC的底层技术

人工智能生成内容（Artificial Intelligence Generated Content, 简称AIGC）是近年来AI技术发展的一个重要领域，它利用机器学习和自然语言处理等技术，让计算机能够自主创作文章、音乐、图像等多种类型的内容。本文将深入浅...

人工智能 2024-09-06 人工智能

1191阅读

Datawhale AI夏令营第四期 AIGC文生图方向 Task3学习笔记

经过前两个task的学习，对于文生图的基本原理，技术支持，模型微调，工作流程等有了一定的了解，尤其是在prompt工程上面，提示词的质量决定着生成图像的流畅性和观赏性，AI大模型在这一方面为学习者们提供了非常大的帮助，通过大模型生成和优化提示词，能实现学习...

AIGC 2024-09-06 人工智能

935阅读

Datawhale X 魔搭 AI夏令营AIGC方向task2

第一步：安装安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip unins...

生成式AI 2024-09-05 人工智能

733阅读

ootdiffusion_pytorch AIGC虚拟衣物试穿算法模型

OOTDiffusion 论文 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on https://arxiv.org/pdf/...

大数据 2024-09-05 人工智能

975阅读

本地搭建Stable Diffusion，文生图再也不用求别人了！

前言本地搭建Stable Diffusion，文生图再也不用求别人了 1. 简介 Stable Diffusion 是一种深度学习模型，用于生成高质量的图像。它基于一种名为扩散过程的生成方法，能够在给定条件的情况下生成具有丰富细节的图像。...

人工智能 2024-09-05 人工智能

951阅读

真把自己「当个人」的AI，扫去了我的社交贫困

现代打工人，时常会因为「社交贫困」而四处碰壁，无心工作时不知找谁聊天，讨论气氛热烈时语出惊人，开口就能终结话题，周末出去玩发了朋友圈，后来发现也没有人点赞。总之一进入社会，就感受到了世界的参差。最近这些尴尬无助的场景，全都有了解决方案。我们刷到一段聊天...

AIGC 2024-09-05 人工智能

769阅读

小白的DatawhaleAI夏令营AIGC文生图探索日记·可图Kolors-LoRA风格故事挑战赛应用

比赛?：可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制报名赛事(点击即可跳转（一定要进行报名，后面环境中的数据和授权等会用到）赛事链接：https://tianchi.aliyun.com/competit...

AIGC 2024-09-05 人工智能

862阅读

如何在复杂对话中准确识别每位说话人的声音？OpenAI Whisper系统带来新突破，尽管在面对重叠声音时仍需进一步优化。

在复杂对话中准确识别每位说话人的声音是一个挑战，尤其是在面对重叠声音的情况下。OpenAI的Whisper系统虽然在自动语音识别（ASR）方面取得了显著进展，但在处理重叠声音时仍需进一步优化。 Whisper系统通过利用大规模预训练模型和弱监督学习来提取...

生成式AI 2024-09-05 人工智能

840阅读

大模型之二十七-语音识别Whisper实例浅析

Whisper简介 Whisper是OpenAI于2022年9月开源的一个多语种识别模型，目前支持99种语言，是目前性能最好的开源多语种识别ASR大模型，第一版版使用了68万小时标注好的语料预训练模型，而large-v3的标注数据超过了500万小时，其...

AIGC 2024-09-05 人工智能

2335阅读

AIGC初体验 Datawhale X 魔搭夏令营

跟DataWhale的步骤跑通baseline 环境安装 !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip uninstall pytorch...

生成式AI 2024-09-05 人工智能

702阅读

AIGC 与 ChatGPT 的区别与联系

前言在人工智能技术飞速发展的今天，生成式人工智能内容（AIGC）和对话式 AI（如 ChatGPT）成为了备受瞩目的话题。虽然这两者在技术基础和应用领域上有很多重叠之处，但它们也各自有独特的特点和用途。本文将深入探讨 AIGC 与 ChatGPT 的...

AIGC 2024-09-04 人工智能

940阅读

Stable-Diffusion-WebUI-Collab 在 Google Colab 上的使用教程

Stable-Diffusion-WebUI-Collab 在 Google Colab 上的使用教程 stable-diffusion-webui-colabstable diffusion webui colab项目地址:https://gitco...

生成式AI 2024-09-04 人工智能

1122阅读

Llama中的曼巴：通过推测解码加速推理

大型语言模型（LLMs）已经彻底改变了自然语言处理领域，但在处理非常长的序列时面临重大挑战。主要问题来自于Transformer架构的计算复杂度随序列长度呈二次方增长以及其巨大的键值（KV）缓存需求。这些限制严重影响了模型的效率，特别是在推理过程中，使生成...

大数据 2024-09-04 人工智能

1061阅读

DIFFUSION 系列笔记| Latent Diffusion Model、Stable Diffusion基础概念、数学原理、代码分析、案例展示

目录 Latent Diffusion Model LDM 主要思想 LDM使用示例 LDM Pipeline LDM 中的 UNET 准备时间步 time steps 预处理阶段 pre-process 下采样过程 down sampl...

AIGC 2024-09-04 人工智能

1244阅读

《Llama 3大模型》技术报告中英文版，95页pdf

现代人工智能（AI）系统由基础模型驱动。本文介绍了一套新的基础模型，称为Llama 3。它是一群本地支持多语言、编码、推理和工具使用的语言模型。我们最大的模型是一个具有4050亿参数和高达128K令牌上下文窗口的密集Transformer。本文对Llama...

AIGC 2024-09-04 人工智能

781阅读

基于大模型的原神对话系统尝试

一.简介该项目为一次大模型+游戏的尝试，成功实现了一个与原神内角色的对话系统。演示视频：https://www.bilibili.com/video/BV1b48CeuELL github地址：https://github.com/goodlu...

生成式AI 2024-09-04 人工智能

1473阅读

Datawhale X 魔搭 AI夏令营第四期AIGC_task03笔记

工具初探一ComfyUI 认识ComfyUI ComfyUI 是"Graphical User Interface"（图形用户界面）的缩写，简单来说，GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。ComfyUI 是GUI的一种，是...

生成式AI 2024-09-03 人工智能

1379阅读

专用于理解游戏场景的开源大模型-VideoGameBunny

大模型在游戏开发领域扮演了重要角色，从AI机器人生成到场景搭建覆盖各个领域。但在游戏场景理解、图像识别、内容描述方面很差。为了解决这些难题，加拿大阿尔伯塔的研究人员专门开源了一款针对游戏领域的大模型VideoGameBunny（以下简称“VGB”）。 V...

AIGC 2024-09-03 人工智能

821阅读

RAG 入门指南：从零开始构建一个 RAG 系统

本文正文字数约 3300 字，阅读时间 10 分钟。从零开始构建一个应用可以让我们快速理解应用的各个部分。这个方法其实非常适用于 RAG。我在以前的文章中有介绍过 RAG 的概念、原理以及应用等，但其实，亲自动手来构建一个 RAG 系统或许能够...

大数据 2024-09-03 人工智能

1101阅读

5 分钟 Stable Diffusion 本地安装指南

一、Stable Diffusion 简介 Stable Diffusion 是一款非常强大的基于深度学习的 AI 图像生成技术。它由众多研究团队和开发者共同努力而成，其中包括德国慕尼黑大学和总部位于纽约的 RunwayML 公司的国际研究团队。...

AIGC 2024-09-02 人工智能

1020阅读

记录Linux上安装LLaMA Factory v0.8.3 增量预训练/监督微调

序：SFT 和 PT 的区分 sft（Supervised Fine-Tuning，监督微调）定义：sft是一种基于监督学习的微调方法，它使用标记好的数据（即带有输入、指令和期望输出的数据集）来进一步训练已经预训练好的模型。这种方法允许模型...

生成式AI 2024-09-02 人工智能

895阅读

基于AIACC加速器快速实现Stable Diffusion生成特定物体图片

本文介绍如何使用GPU云服务器搭建Stable Diffusion模型，并基于ControlNet框架，快速生成特定物体图片。背景信息 Stable Diffusion（简称SD）是一种AI模型，它经过训练可以逐步对随机高斯噪声进行去噪以生成所需要的...

人工智能 2024-09-01 人工智能

875阅读

Llama-X 开源项目指南

Llama-X 开源项目指南 Llama-XOpen Academic Research on Improving LLaMA to SOTA LLM项目地址:https://gitcode.com/gh_mirrors/ll/Llama-X 项目...

AIGC 2024-09-01 人工智能

848阅读

Datawhale X 魔搭 AI夏令营第四期AIGC方向笔记task3

part1：工具初探一ComfyUI应用场景探索初识ComfyUI 什么是ComfyUI GUI 是 "Graphical User Interface"（图形用户界面）的缩写。简单来说，GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的...

生成式AI 2024-09-01 人工智能

1768阅读

一文看懂llama2(原理&模型&训练）

一文看懂Llama2（原理&模型&训练）一、引言 Llama2是Meta（原Facebook AI）最新开源的大型语言模型，它基于Transformer架构进行了多项优化和改进，旨在提供更高效、更准确的自然语言处理能力。Llama2...

生成式AI 2024-09-01 人工智能

832阅读

【AI】准备放弃“文心一言”，不再续费

百度真是把一手好牌打的稀烂，最近感觉文心一言起步很猛，但是能力越来越差。不要说毫无技术极客精神，几乎没有斗志和追求了。有2个案例，让我非常的失望。第一个案例体现了它的不诚实，过度的商业“考量”。第二个案例体现了它的不专业。第一个提示词对比：...

大数据 2024-08-31 人工智能

720阅读

6小时完成Llama 3.1-8B适配并开源！MindSpore Transformers大模型套件使能开发者创新

北京时间7月24号, Meta 正式发布 Llama 3.1开源大语言模型, 包含8B、70B 及 405B 参数版本。其中的Llama 3.1 405B模型，在多项基准测试中可以媲美GPT4、Claude3.5等目前最强的闭源大模型。此外，8B 与 70...

生成式AI 2024-08-31 人工智能

1194阅读

Chinese-Llama-2-7b 开源项目教程

Chinese-Llama-2-7b 开源项目教程 Chinese-Llama-2-7b开源社区第一个能下载、能运行的中文 LLaMA2 模型！项目地址:https://gitcode.com/gh_mirrors/ch/Chinese-Llama-2...

AIGC 2024-08-31 人工智能

1106阅读

【大模型理论篇】关于LLaMA 3.1 405B以及小模型的崛起

前不久，Meta开源了LLaMA 3.1 405B【1】，模型扩展了上下文长度至 128K，支持八种语言，效果非常惊艳，是首个在通用知识、可操控性、数学、工具使用和多语言翻译方面能够与最先进闭源 AI 模型媲美的公开可用模型，已经赶上截至目...

生成式AI 2024-08-31 人工智能

972阅读

AIGC大模型产品经理高频面试大揭秘‼️

近期有十几个学生在面试大模型产品经理（薪资还可以，详情见下图），根据他们面试（包括1-4面）中出现高频大于3次的问题汇总如下，一共32道题目（有答案）。 29.讲讲T5和Bart的区别，讲讲Bart的DAE任务 T5（Text-to-Text Tr...

人工智能 2024-08-31 人工智能

928阅读

DataWhale多模态赛事Task1

赛事链接：https://tianchi.aliyun.com/competition/entrance/532251/introduction?spm=a2c22.12281925.0.0.2f307137p8qZmp 赛事描述：在当下大数据、大模型时...

生成式AI 2024-08-31 人工智能

733阅读

精通 Stable Diffusion 调优秘籍

一、Stable Diffusion 调优概览 Stable Diffusion 作为一款强大的 AI 绘画工具，其调优具有至关重要的意义。通过合理的调优，可以显著提升图像生成的质量、速度和准确性，满足用户更加多样化和精细化的需求。调优主要涵盖了...

AIGC 2024-08-31 人工智能

887阅读