-
Datawhale 魔搭 AI夏令营 第四期 AIGC方向 Tesk2 可图Kolors-LoRA模型进阶学习
AI生图的能力与局限 AI生图的原理 AI利用 深度学习技术来训练神经网络,训练过程中,神经网络会学习到真实图像中的纹理、结构、颜色等特征,并将这些特征应用于生成新的图像。从而生成具有高保真度的图像。训练后,通过输入关键提示词来让模型...
-
Stable Diffusion WebUI 1.10.0来了
大家好,我是每天分享AI应用的萤火君! 前几天 AUTOMATIC1111 发布了Stable Diffusion WebUI 1.10,我也在第一时间将云环境的镜像升级到了最新版本,有兴趣的同学可以去体验下,目前已经发布到了AutoDL,镜像地址:...
-
使用llama factory对语言模型微调,重塑自我认知,并部署于ollama上
本文记录了从环境部署到微调模型、效果测试并部署的全过程。 一 环境 如果使用autodl租赁服务器则不需要如下步骤,但是请注意llama_factory需要python、cuda等版本满足: 首先请确报你已经安装好了conda工具...
-
Datawhale AI夏令营第四期魔搭- AIGC方向 task02笔记
大纲 一、前言 二、代码块解读 2.1 依赖包安装 2.2 数据集下载 2.3 metadata.jsonl文件生成(图片及对应标签) 2.4 设置data-juicer 配置文件并执行,处理metadata.jsonl文件生成result....
-
小白教程:Unsloth 打造属于自己的中文版Llama3
在定制化业务场景中,如果利用专属数据集,经过微调的大模型能够在多种任务上与GPT-4媲美,并支持本地部署,保护隐私,同时还能降低运算成本。最新推出的Llama3,作为当前性能最强的开源基础大模型,非常适用于自然语言处理、机器翻译、文本生成、问答系统、聊天机...
-
Positional Encoding | 位置编码【详解】
文章目录 1、位置编码的2种方案 2、位置编码 3、公式详解 : 绝对位置 、 相对位置 4、代码 4.1 代码1 4.2 代码2 1、位置编码的2种方案 transformer的作者刚开始说固定的位置编码和可学习的位置...
-
Datawhale X 魔搭 AI夏令营---AIGC Task2
目录 Datawhale X 魔搭 AI夏令营第四期-AIGC文生图方向 Task2:精读代码,实战进阶 0.0 一些link 0.1 任务内容 0.2 AI生图 0.3 **Kolors(可图)模型** 1.1 精读baseline——从...
-
微调大语言模型——LLaMa-Factory平台搭建(非常详细)零基础入门到精通,收藏这一篇就够了
我们采用 LLaMA-Factory平台进行微调语言模型,详细信息可以访问github主页(https://github.com/hiyouga/LLaMA-Factory)浏览。 租赁显卡 采用AutoDL作为云平台进行微调训练。Win系统采用终端...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task02笔记
一、探探前沿:了解一下 AI生图技术 的能力&局限 1. 为什么要了解AI生图前沿? AIGC(AI-Generated Content 是通过人工智能技术自动生成内容的生产方式,很早就有专家指出,AIGC将是未来人工智能的重点方向,也将改造相...
-
Datawhale X 魔搭 AI夏令营第四期 AIGC方向 学习笔记(一)
本期主要任务是了解AI文生图的原理并进行相关实践 下面是对baseline部分代码的功能介绍: 安装Data-juicere和DiffSynth-Studio !pip install simple-aesthetics-predictor !pip...
-
magic-animate_pytorch AIGC使图像中人物按照给定动作动起来
magic-animate 论文 MagicAnimate: Temporally Consistent Human Image Animation using Diffusion Model https://arxiv.org/pdf/2311.1...
-
Datawhale X 魔搭 AI夏令营-AIGC方向-task2知识总结
文生图背景 早期探索 (1960-1990) 最早出现于计算机视觉和图像处理。 早期图像生成技术主要依赖与规则和模板匹配,通过预定义的规则将文本转换为简单的图形。 受限于计算能力和算法,此阶段生成的图像质量较低,应用场景受限。 基于统计...
-
国产可图大模型:厚积薄发,GLM3加持质的飞跃,ComfyUI最全指南与SD3综合评比孰更强?
🌹大家好!我是安琪!!! Kolors大模型简 就在上周末,国内大厂快手开源了可图大模型文生图模型,这是由快手可图团队开发的基于潜在扩散的大规模文本到图像生成模型。 • Kolors 是在数10亿图文对下进行训练, • 在 视觉质量、复杂语...
-
Datawhale X 魔搭 AI夏令营 “AIGC”方向 task1
一、任务要求 task1 的任务和上一期的类似,都是跑通给出的代码即可,没有太大难度。 具体要求是训练 Lora 模型,实现文生图,额外的要求是8张图片必须组成一个连贯的故事,需要一定的“写小作文”能力。 二、代码解析 下载数据集 这一步不用分析...
-
ComfyUI安装完整攻略
ComfyUI简介 ComfyUI是一种新型的Stable Diffusion用户界面,因其独树一帜的“节点式”界面,逐渐成为了AI绘画领域进阶玩家的得力武器。搭配各式各样的自定义节点与功能强大的工作流,它得以用更低的配置实现许多在WebUI等常规界面里...
-
ComfyUI零基础入门搭建教程
一、介绍 ComfyUI 是一个强大的、模块化的 Stable Diffusion 界面与后端项目。该用户界面允许用户使用基于图形/节点/流程图的界面设计和执行高级稳定的扩散管道。该项目部分其它特点如下: 目前全面支持 SD1.x,SD2.x,SDX...
-
LLaMA-Factory全面指南:从训练到部署
项目背景与概述 LLaMA-Factory项目目标 LLaMA-Factory项目是一个专注于大模型训练、微调、推理和部署的开源平台。其主要目标是提供一个全面且高效的解决方案,帮助研究人员和开发者快速实现大模型的定制化需求。具体来说,LLaMA-F...
-
【LLaMA-Factory】常见报错信息及解决方法整理
1.‘llamafactory-cli’ 不是内部或外部命令,也不是可运行的程序 或批处理文件。 bash: llamafactory-cli: command not found #3568 解决方法: cd 你路径下的\LLaMA-Factor...
-
SenseVoice多语言语音理解模型之最新部署落地经验
SenseVoice是阿里云通义实验室开发的一款多语言音频基础模型,专注于高精度多语言语音识别、情感辨识和音频事件检测。 SenseVoice支持超过50种语言的识别,并且在中文和粤语上的识别效果优于Whisper模型,提升了50%以上。 SenseV...
-
Datawhale X 魔塔 AI夏令营第四期-AIGC文生图方向 Task1笔记
一、文生图背景 文生图(Text-to-Image Generation)是一种通过文本生成图像的技术,其发展历程可以追溯到早期的计算机视觉和自然语言处理研究。文生图的概念最早出现于计算机视觉和图像处理的早期研究中。早期的图像生成技术主要...
-
LLM - 使用 HuggingFace + Ollama 部署最新大模型 (GGUF 格式 与 Llama 3.1)
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/141028040 免责声明:本文来源于个人知识与公开资料,仅用于学术交...
-
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记--切记我是一个温柔的刀客
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记 作者: 福州大学 切记我是一个温柔的刀客 2024/8/10 从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活...
-
Datawhale X魔搭AI夏令营 魔搭-AIGC方向 Task2笔记
Datawhale X魔搭AI夏令营 魔搭-AIGC方向 Task2笔记 经过TASK1的学习,我们都或多或少地了解了AI作图的相关知识,那么接下来我们需要学习的便是深入Prompt工程与微调,精准理解AI作图个中原理,深刻探究文生图背...
-
Whisper JAX 深度使用指南
Whisper JAX 深度使用指南 whisper-jaxJAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.项目地址:https://gitcode....
-
Datawhale X 魔搭 AI夏令营第四期 | AIGC文生图——可图Kolors-LoRA风格故事 Task1笔记
Hi,大家好,我是半亩花海。最近在尝试学习AIGC的内容,并报名参加了Datawhale举办的2024年AI第四期夏令营,主要学习内容是从零入门AI生图原理和实践。本次活动基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”进而开展的项目实践学习,很适...
-
【AIGC】ComfyUI入门-安装ComfyUI
栏目: 栏目目录里面会收录我关于AIGC相关的笔记博文,大家如果有什么不懂的可以通过阅读我的笔记进行学习。【AIGC目录】 最近自己在抽时间研究ComfyUI相关的内容,抽时间整理一下自己了解到的内容,希望可以帮到其他想要学习的小伙伴。 安装Co...
-
隆重推出 Llama 3.1: 迄今为止最强大的开源模型
The gates of heaven open: Llama 3.1 405B, the most capable models to date from Meta, is competitive with leading foundation mode...
-
「AIGC」大语言模型系列-Transformer详解
Transformer模型相对复杂,下面我将提供一个简化版的Transformer模型的Python代码示例,使用PyTorch库实现。这个示例将包括模型的基本结构,如编码器和解码器,自注意力机制,位置编码,以及前馈网络。 请注意,这个示例主要用于教...
-
Datawhale X 魔搭 AI夏令营 第四期魔搭-AIGC文生图方向Task1笔记
(赛题链接:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛) (学习链接:从零入门AI生图原理&实践) 速通指南 ...
-
Stable Diffusion之最全详细图解
Stable Diffusion是一种生成模型,用于生成高质量的图像。这种模型基于扩散过程,能够逐步将噪声转换为清晰的图像。以下是关于Stable Diffusion的详细图解,涵盖其原理、模型结构、训练过程及应用示例。 一、Stable Diffusi...
-
微调 Whisper 语音大模型
1.准备环境 #创建环境 conda create -n whisper python=3.10 -y source activate whisper #安装环境 conda install pytorch==2.1.0...
-
AI写作革命:PyTorch如何助力人工智能走向深度创新
身为专注于人工智能研究的学者,我十分热衷于分析"AI写稿"与"PyTorch"这两项领先技术。面对日益精进的人工智能科技,"AI写作"已不再是天方夜谭;而"PyTorch"如璀璨明珠般耀眼,作为深度学习领域的尖端工具,正有力地推进着人工智能化进程。于此篇文...
-
快速体验LLaMA-Factory 私有化部署和高效微调Llama3模型(曙光超算互联网平台异构加速卡DCU)
序言 本文以 LLaMA-Factory 为例,在超算互联网平台SCNet上使用异构加速卡AI 显存64GB PCIE,私有化部署Llama3模型,并对 Llama3-8B-Instruct 模型进行 LoRA 微调、推理和合并。 快速体验基础版本,...
-
智能语音问答机器人本地部署win10--2024最新版(faster-whisper + Qwen1.5 + ChatTTS)
目录 一、整体介绍 1.主要模块介绍 2.部署步骤概述 二、语音识别-faster-whisper 1.安装faster-whisper 2.下载模型 3.准备一段语音文件 4.调用faster-whisper完成语音识别 5.接口分析(...
-
AI绘画 | 只要10步让你在英特尔A770显卡下安装ComfyUI运行StableDiffusion3最新开源模型
安装所需文件和模型已经打包好了,提前下载。SD3模型有点大,10G左右 本教程安装所需文件:https://pan.quark.cn/s/d6b9c8d4ca27 SD3模型:https://pan.quark.cn/s/037ae37f1884 ...
-
Stable Diffusion 深入浅出,一看就会
Stable Diffusion 是一个基于深度学习的图像生成模型,旨在生成高质量的图像。下面是一个 Stable Diffusion 入门案例教程,旨在帮助您快速入门 Stable Diffusion。 安装 Stable Diffusion 首先,...
-
部署LLaMA-Factory及微调大模型测试
安装过程 安装依赖 按照GitHub上介绍的过程安装即可GitHub - hiyouga/LLaMA-Factory: Unify Efficient Fine-Tuning of 100+ LLMshttps://github.com/hiyouga...
-
Ubuntu部署Stable Diffusion WebUI应用
本文主要讲述Ubuntu部署Stable Diffusion WebUI应用的部署教程,及在部署过程中可能遇到的问题及解决方法。 1. 部署教程 本次安装教程使用的系统配置是: CPU :10核,内存:220GB GPU :L20,...
-
Llama 3 图片理解能力微调(XTuner+LLaVA 版)实践笔记
基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。 环境、模型、数据准备 conda create -n llama3 python=3....
-
深度学习论文: LLaMA: Open and Efficient Foundation Language Models
深度学习论文: LLaMA: Open and Efficient Foundation Language Models LLaMA: Open and Efficient Foundation Language Models PDF:https://ar...
-
使用go-llama.cpp 运行 yi-01-6b大模型,使用本地CPU运行,速度挺快的
1,视频地址 2,关于llama.cpp 项目 https://github.com/ggerganov/llama.cpp LaMA.cpp 项目是开发者 Georgi Gerganov 基于 Meta 释出的 LLaMA 模型(简易 Pyth...
-
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok3的训练中。 与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。 在这场AI争霸赛中,各大科技公司们卯足劲加大对GPU的投资,似乎在暗示着拥...
-
用Conda配置 Stable Diffusion WebUI 1.9.4
用Conda配置 Stable Diffusion WebUI 1.9.4 本文主要讲解: 如何用Conda搭建Stable Diffusion WebUI 1.9.4环境,用Conda的方式安装,不需要单独去安装Cuda了。 1. 安装minic...
-
政安晨【零基础玩转各类开源AI项目】基于Ubuntu系统部署ComfyUI:功能最强大、模块化程度最高的Stable Diffusion图形用户界面和后台
目录 ComfyUI的特性介绍 开始安装 做点准备工作 在Conda虚拟环境中进行 依赖项的安装 运行 政安晨的个人主页:政安晨 欢迎 👍点赞✍评论⭐收藏 收录专栏: 零基础玩转各类开源AI项目 希望政安晨的博客能够对...
-
llama 2 改进之 RMSNorm
RMSNorm 论文:https://openreview.net/pdf?id=SygkZ3MTJE Github:https://github.com/bzhangGo/rmsnorm?tab=readme-ov-file 论文假设LayerNorm...
-
hunyuandit_pytorch AIGC 以文生图模型
HunyuanDiT 论文 Hunyuan-DiT : A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding https:/...
-
项目实训:python whisper安装运行 实现语音识别技术
1.最好用python3.9以上的版本 2.安装whisper库 pip install -U openai-whisper 输入whisper查看是否安装成功 3.下载ffmpeg并添加环境变量 Releases · BtbN/FFmpeg...
-
天才程序员周弈帆 | Stable Diffusion 解读(三):原版实现源码解读(篇幅略长,建议收藏!)
本文来源公众号“天才程序员周弈帆”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 解读(三):原版实现源码解读 天才程序员周弈帆 | Stable Diffusion 解读(一):回顾早期工作-CSDN博客 天才程序...
-
第43篇:实现企业级大型AIGC项目:模型并行与分布式训练
在构建企业级大型AIGC(人工智能生成内容)项目时,模型并行与分布式训练是提升计算效率和处理能力的关键技术。随着模型规模和数据量的不断增长,单台设备的计算能力往往无法满足需求。因此,利用多台设备进行并行计算和分布式训练成为了必然选择。本文将深入讲解模型并行...
-
手把手教你在autodl上部署llama模型
文章目录 一、注册AutoDL账号、租用GPU 二、创建conda环境 三、下载llama模型 四、启动模型 一、注册AutoDL账号、租用GPU 进入 AutoDL官网链接 注册账号,需要先充点钱,如下创建新实例。 随便选...