适配器 - AIGC资讯

可信空间中的跨平台数据交互技术

标题：可信空间中的跨平台数据交互技术：构建无缝连接的数字未来随着信息技术的飞速发展，不同操作系统、应用程序和设备之间的数据交互已成为现代社会数字化转型的关键。在这一背景下，可信空间中的跨平台数据交互技术应运而生，旨在打破信息孤岛，实现数据在不同平台间的安全...

生成式AI 2025-06-13 大数据

566阅读

Stable Diffusion条件控制生成---相关论文集合

Stable Diffusion条件控制生成 1. IP-Adapter 2. ControlNet 3. InstantID 4. T2I-Adapter 5. Uni-ControlNet 6. Composer 7. MGPF 8. Sa...

人工智能 2024-10-04 人工智能

1858阅读

开源语音实时交互新突破：LLaMA-Omni实现大语言模型无缝语音交互

像 GPT-4o 这样的模型通过语音实现了与大型语言模型（LLMs）的实时交互，与基于文本的传统交互相比，显著提升了用户体验。然而，目前在如何构建基于开源 LLMs 的语音交互模型方面仍缺乏探索。为了解决这个问题，我们提出了 LLaMA-Omni，这是一个...

生成式AI 2024-10-04 人工智能

1772阅读

深度技术分析：Meta Llama 3模型训练故障剖析

## 摘要 Meta公司在一项涉及16,384个Nvidia H100 80GB GPU的Llama 3 405B模型训练中，遭遇了频繁的硬件故障。在54天的训练期间，平均每三小时就发生一次组件故障，其中半数故障与GPU或其HBM3内存有关。尽管面临如此挑...

AIGC 2024-10-02 人工智能

1441阅读

中科院提出GPT-4o实时语音交互的开源对手：Llama-Omni

论文：LLaMA-Omni: Seamless Speech Interaction with Large Language Models地址：https://arxiv.org/pdf/2409.06666 研究背景研...

生成式AI 2024-10-01 人工智能

1417阅读

LLaMA-Factory使用指南：快速训练专属大模型，打造定制化AI解决方案！

本文聊聊 LLama-Factory，它是一个开源框架，这里头可以找到一系列预制的组件和模板，让你不用从零开始，就能训练出自己的语言模型（微调）。不管是聊天机器人，还是文章生成器，甚至是问答系统，都能搞定。而且，LLama-Factory 还支持多种框架和...

AIGC 2024-09-26 人工智能

1917阅读

Llama Factory ：百种以上语言模型的统一高效微调框架

人工智能咨询培训老师叶梓转载标明出处大模型适应到特定下游任务时，传统的全参数微调方法成本高昂，因此，研究者们一直在探索更高效的微调技术。由北京航空航天大学和北京大学的研究团队提出了一个名为Llama Factory的统一框架，旨在解决大模型高效微调的...

AIGC 2024-09-21 人工智能

1095阅读

LLAMA-FACTORY：100+语言模型的统一高效微调框架

24年3月来自北航和北大的论文“LLAMA-FACTORY: Unified Efficient Fine-Tuning of 100+ Language Models”。高效的微调对于将大语言模型 (LLM 适应下游任务至关重要。然而，在不同模型上...

人工智能 2024-09-21 人工智能

1999阅读

llamafactory-llama3微调中文数据集

一、定义 https://github.com/SmartFlowAI/Llama3-Tutorial/tree/main 基准模型测试 opencompass 离线测评数据准备微调训练合并测试人工审核对比二、实现基准模型测试...

人工智能 2024-09-14 人工智能

941阅读

从腾讯大模型的「实用」路线，我们看到了企业应用AI的新方向

「现在每家公司都是 AI 公司，但引入 AI 之后，利润真的能提高吗?」在针对 Transformer 作者、Cohere CEO Aidan Gomez 的一次采访中，播客主持人 Harry Stebbings 问出了这样一个问题。 Stebbings...

大数据 2024-09-09 人工智能

999阅读

使用PAI × LLaMA Factory 微调 Llama3 模型

活动地址：使用 PAI × LLaMA Factory 微调 Llama3 模型实现角色扮演活动时间：7月25日- 9月1日活动任务：使用 PAI 平台及 LLaMA Factory 训练框架完成模型的中文化与角色扮演微调和评估，搭建专属“ AI...

AIGC 2024-09-07 人工智能

954阅读

Llama-factory的yaml配置参数--学习记录

最近llama-factory的配置参数有很多不懂的地方，整理了一些但也有可能有错，仅供大家参考。 # 可选参数 # 模型和适配器相关 --adapter_name_or_path # 描述: 适配器的名称或路径。 --adapter_folder...

人工智能 2024-09-06 人工智能

3787阅读

大模型外挂知识库rag综述

一、LLMs 不足点在 LLM 已经具备了较强能力的基础上，仍然存在以下问题：幻觉问题：LLM 文本生成的底层原理是基于概率的 token by token 的形式，因此会不可避免地产生“一本正经的胡说八道”的情况；时效性问题：LLM 的规模越大...

生成式AI 2024-09-06 人工智能

1398阅读

Comfyui生成一致角色，轻松制作你的系列漫画！

工作流获取方式放在文末了 Comfyui工作流作为一个强大的Ai绘画工具，为艺术家们提供了前所未有的便利和创新能力。今天给大家分享的工作流它不仅能生成独特、一致的角色，还能帮助创作者制作自己的系列漫画。想象一下，无需强大的绘画功底和漫长的创作时间...

大数据 2024-08-30 人工智能

2095阅读

AIGC-视频生成-AnimateDiff-基于T2I模型的动态生成论文详细解读

AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning 代码:https://github.com/guoyww/a...

大数据 2024-08-30 人工智能

1355阅读

LLaMA3技术报告解读

前言 LLaMA系列算法是Meta公司发布的开源大模型。近期Meta公司又发布了LLaMA 3.1系列的模型，在这一系列模型中参数量最大的高达405B，上下文窗口多达128K个token。同时对模型进行了广泛的实证评估，发现在很多任务中，LLaMA 3...

生成式AI 2024-08-28 人工智能

1617阅读

Stable Diffusion学习指南【ControlNet下篇】- 超全面控图类型&模型拆解

（注：文末扫码获取AI工具安装包和AI学习资料）以下是正文部分在上一篇里我已经为大家介绍了关于ControlNet的基本功能、安装和使用技巧，相信大家对这款神级插件已经有了基本认识，今天我会为大家更详细的介绍14种官方控图模型的差异和使用技巧，以及...

AIGC 2024-08-24 人工智能

2758阅读

Datawhale AI夏令营第四期魔搭- AIGC方向 task02笔记

大纲一、前言二、代码块解读 2.1 依赖包安装 2.2 数据集下载 2.3 metadata.jsonl文件生成（图片及对应标签） 2.4 设置data-juicer 配置文件并执行，处理metadata.jsonl文件生成result....

生成式AI 2024-08-21 人工智能

1146阅读

【已解决】报错“copying a param with shape torch.Size([1280, 1280]) from checkpoint”

在使用SDXL时，报错“copying a param with shape torch.Size([1280, 1280] from checkpoint, the shape in current model is torch.Size([1280,...

AIGC 2024-08-19 人工智能

1019阅读

Datawhale X 魔搭 AI夏令营第四期 AIGC方向学习笔记（一）

本期主要任务是了解AI文生图的原理并进行相关实践下面是对baseline部分代码的功能介绍：安装Data-juicere和DiffSynth-Studio !pip install simple-aesthetics-predictor !pip...

大数据 2024-08-19 人工智能

1082阅读

The Llama 3 Herd of Models 第8部分语音实验部分全文

第1,2,3部分，介绍、概览、预训练第4部分，后训练第5部分，结果第6部分，推理第7部分，视觉实验 8 Speech Experiments 我们进行了实验来研究将语音功能集成到Llama 3中的组合方法，类似于我们用于...

生成式AI 2024-08-13 人工智能

928阅读

The Llama 3 Herd of Models.Llama 3 模型第1,2,3部分全文

现代人工智能(AI 系统是由基础模型驱动的。本文提出了一套新的基础模型，称为Llama 3。它是一组语言模型，支持多语言、编码、推理和工具使用。我们最大的模型是一个密集的Transformer，具有405B个参数和多达128K个tokens...

大数据 2024-08-04 人工智能

1040阅读

AIGC Kolors可图IP-Adapter-Plus风格参考模型使用案例

参考： https://huggingface.co/Kwai-Kolors/Kolors-IP-Adapter-Plus 代码环境安装： git clone https://github.com/Kwai-Kolors/Kolors cd Kolor...

人工智能 2024-08-04 人工智能

1115阅读

WD1.4标签器：Stable Diffusion的提示词反推神器

引言在AI绘画领域，Stable Diffusion（SD）因其强大的生成能力而备受关注。然而，如何精准地控制和优化生成效果，常常是许多用户面临的问题。今天，我们将详细介绍一款实用的插件——WD1.4标签器，它可以帮助我们反推出图片背后的提示词，从而...

人工智能 2024-08-03 人工智能

2150阅读

苹果AI震撼上线iPhone，进化版Siri却没有ChatGPT！47页技术报告揭秘自研模型

【新智元导读】今早，所有开发者们被突如其来iOS18.1测试版砸晕了!没想到，苹果AI这就可以上手尝鲜了，一大波测评刷屏全网。更惊喜的是，苹果AI背后的基础模型47页技术报告，也一并上线了。一大早，人们期待已久的「苹果AI」首个预览版，正式向开发者们推送...

人工智能 2024-07-30 人工智能

981阅读

Unsloth 微调 Llama 3

本文参考：https://colab.research.google.com/drive/135ced7oHytdxu3N2DNe1Z0kqjyYIkDXp 改编自：https://blog.csdn.net/qq_38628046/article/det...

AIGC 2024-07-30 人工智能

1239阅读

一文速览Llama 3.1——对其92页paper的全面细致解读：涵盖语言、视觉、语音的架构、原理

前言按我原本的计划，我是依次写这些文章：解读mamba2、解读open-television、我司7方面review微调gemma2，再接下来是TTT、nature审稿微调、序列并行、Flash Attention3.. 然TTT还没写完，7.23日...

人工智能 2024-07-29 人工智能

1238阅读

【AIGC】Llama-3 官方技术报告

Llama-3 技术报告（中文翻译）欢迎关注【youcans的AGI学习笔记】原创作品 0. 简介现代人工智能（AI）系统的核心驱动力来自于基础模型。本文介绍了一组新的基础模型，称为 Llama 3。它是一个语言模型系列，原生支持多语言...

大数据 2024-07-29 人工智能

1499阅读

函数调用：在 xLAM 上微调 Llama 3得益于 QLoRA，速度快且内存高效

欢迎来到雲闪世界.最近的大型语言模型 (LLM 在大多数语言生成任务中都表现出色。然而，由于它们基于下一个标记预测进行操作，因此它们通常难以准确执行数学运算。此外...

生成式AI 2024-07-27 人工智能

1027阅读

LLama 405B 技术报告解读

LLama 405B 技术报告解读果然传的消息都是真的，meta在24号凌晨发布了llama 3的405B版本，这次还是做一个技术报告解读。值得一提的是，在技术报告的开头，meta特意强调了一个 Managing complexity，大意是管控...

生成式AI 2024-07-27 人工智能

1022阅读

LLaMA-Adapter：零初始注意机制的语言模型高效微调

23年6月来自上海AI实验室，香港中文大学和UCLA的论文“LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention“。 LLaMA-Adapter是...

生成式AI 2024-07-10 人工智能

1220阅读

[arxiv论文解读]LlamaFactory：100+语言模型统一高效微调

该文档是一篇关于LLAMAFACTORY的学术论文，这是一个用于高效微调大型语言模型（LLMs）的统一框架。这篇论文详细介绍了LLAMAFACTORY的设计、实现和评估，以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释：摘要（Abst...

AIGC 2024-07-08 人工智能

1811阅读

国产动漫视频AI火了！二次元老婆随意捏，哥特、梦幻、机甲一键get

【新智元导读】视频生成赛道又起新秀，而且还是二次元定制版!稳定产出电影级画面，一键文/图生成视频，即使是「手残党」也能复刻自己喜欢的动漫作品了。现在，各位二次元萌新们，不用再等「太太」出图啦! 我们不仅可以自己产粮，而且还是会动的那种。如今，AI视频生...

人工智能 2024-07-05 人工智能

1067阅读

如何使用共享GPU平台搭建LLAMA3环境（LLaMA-Factory）

0. 简介最近受到优刻得的使用邀请，正好解决了我在大模型和自动驾驶行业对GPU的使用需求。UCloud云计算旗下的[Compshare](https://www.compshare.cn/? ytag=GPU_lovelyyoshino_Lcsdn_...

AIGC 2024-07-03 人工智能

965阅读

增强大型语言模型（LLM）可访问性：深入探究在单块AMD GPU上通过QLoRA微调Llama 2的过程

Enhancing LLM Accessibility: A Deep Dive into QLoRA Through Fine-tuning Llama 2 on a single AMD GPU — ROCm Blogs 基于之前的博客《使用Lo...

人工智能 2024-06-26 人工智能

1443阅读

每日AIGC最新进展(25)：复旦大学提出参数高效微调框架Adapter-X、上海交通大学提出大型多模态模型新测试标准A-Bench、腾讯提出统一多模态布局生成框架PosterLLaVa

Diffusion Models专栏文章汇总：入门与实战 Adapter-X: A Novel General Parameter-Efficient Fine-Tuning Framework for Vision 本文提出了一种新的参数高效...

人工智能 2024-06-22 人工智能

941阅读

用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！

用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！文章目录用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！什么是模型微调？为什么使用 LLama-Fact...

人工智能 2024-06-20 人工智能

1356阅读

大模型之路3：趟到了Llama-Factory，大神们请指点

各种AI工具和框架层出不穷，为开发者和研究者提供了前所未有的便利。当然了，也有困扰。尤其是对于动手能力越来越弱的中年油腻老程序员来说，更是难上加难。据说，嗯，据师弟说，说LlamaFactory凭借其独特的功能和优势，在AI领域（他所下载的代码和工具里），...

生成式AI 2024-06-19 人工智能

1061阅读

从论文中看AI绘画

个人博客:Sekyoro的博客小屋个人网站:Proanimer的个人网站主要看是看Diffusion Models,CLIP,ControlNet,IP-Adapter这种经典论文,尝试总结论文写作的一些方式以及图像生成模型的一些内在思想. 对于其中的数...

AIGC 2024-06-18 人工智能

1025阅读

从零开始搭建LLaMA-Factory

准备写一个完整教程：手动卸载原先驱动和cuda（英伟达自带的驱动升级程序闪退崩溃）官网下载驱动、cuda、cudnn 逐一安装（系统装驱动，cuda与cudnn。然后anaconda虚拟环境装pytorch）安装llama factory 微调...

人工智能 2024-06-15 人工智能

1588阅读

使用LLaMA-Factory来实现微调ChatGLM-3B

前提：本文是使用阿里云的人工智能PAI平台的交互式建模（DSW）来进行的如下操作安装LLaMA-Factory # 克隆项目 git clone https://github.com/hiyouga/LLaMA-Factory.git # 安装项目...

人工智能 2024-06-15 人工智能

1448阅读

手把手教你在本机安装Stable Diffusion秋叶整合包（附安装包和大模型）

整合包对非技术出身的同学比较友好，因为秋叶大佬把相关的东西已经都整合好了，只需要点点点就行了。当然懂编程的同学就更没有问题了。文末领取SD安装包和大模型！准备为了保证AI绘画的效率，建议在本机安装Nvidia独立显卡，也就是俗称的N卡，并且显存要...

大数据 2024-06-15 人工智能

1471阅读

手把手教你在本机安装Stable Diffusion秋叶整合包

因为网上讲部署的文章挺多的，所以本来不打算写这个，但是有些网友提出了要求，另外我也准备总结下在AI绘画方面的一些经验，从经验完整性上考虑，还是得有这部分的内容。整合包对非技术出身的同学比较友好，因为秋叶大佬把相关的东西已经都整合好了，只需要点点点就行...

AIGC 2024-06-14 人工智能

1413阅读

LLMs之Llama3：基于Colab平台(免费T4-GPU)利用LLaMA-Factory的GUI界面(底层采用unsloth优化框架【加速训练5~30倍+减少50%的内存占用】)对llama-3-

LLMs之Llama3：基于Colab平台(免费T4-GPU 利用LLaMA-Factory的GUI界面(底层采用unsloth优化框架【加速训练5~30倍+减少50%的内存占用】对llama-3-8b-Instruct-bnb-4bit模型采用alpa...

AIGC 2024-06-11 人工智能

1152阅读

Stable Diffusion基本教程：ControlNet控图功能

ControlNet 官方模型，最早时候开源的模型只有 depth、hed、normal、scribble、seg、openpose、mlsd、canny 这 8 种，随着这半年的迭代已经更新到 14 种之多。每种模型都有各自的特点，对新手来说想每个都完全...

人工智能 2024-06-08 人工智能

1665阅读

Stable Diffusion使用ControlNet:IP-Adapter实现图片风格迁移

IP-Adapter 全称是 Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models（文本到图像扩散模型的文本兼容图像提示适配器），是腾讯研究院出品的一个新的Contr...

大数据 2024-06-08 人工智能

1315阅读

基于阿里云PAI部署LLaMA Factory 完成Llama3低代码微调和部署

一、引言阿里云人工智能平台 PAI 提供了面向开发者与企业的深度学习工程平台，其中交互式建模 PAI-DSW 集成了 Jupyter 等多种云端开发环境，提供丰富的计算资源与镜像环境，实现开箱即用的高效开发模式。LLaMA Factory 则是一款...

大数据 2024-06-07 人工智能

1612阅读

面向AIGC的InfiniBand网络技术特性分析

    在AIGC的训练场景，基本上不差钱的客户都会首选InfiniBand，作为跨AI服务器节点的网络组网方案，今天我们就来讲一讲InfiniBand到底有那些针对AIGC场景的技术优化： &nbs...

大数据 2024-06-05 人工智能

1152阅读

多语言模型微调统一框架 LlAMAFACTORY: 统一高效微调100多种语言模型

文章目录摘要 1 引言 2 高效微调技术 2.1 高效优化 2.2 高效计算 3 LlAMAFACtORY框架 3.1 模型加载器 3.2 数据处理工作者 3.3 训练器 3.4 实用工具 3.5 LLAMABOARD：LLAMAFAC...

人工智能 2024-06-05 人工智能

1092阅读

llama-factory学习个人记录

框架、模型、数据集准备 1.llama-factory部署 # 克隆仓库 git clone https://github.com/hiyouga/LLaMA-Factory.git # 创建虚拟环境 conda create --name llama...

人工智能 2024-06-02 人工智能

2336阅读