pytorch 第3页 - AIGC资讯

Datawhale X 魔搭 AI夏令营 - AIGC文生图方向Task2笔记

今天做的是AIGC文生图方向的 task 2 ，回顾一下 task 2 step 0 : Task 2 学习规划 step 1 : 认识通义千问（使用通义千问大语言模型学习如何借助AI智能助手帮我们阅读代码）链接：点击直达 1...

人工智能 2024-08-28 人工智能

1088阅读

Datawhale X 魔搭 AI夏令营 Task1

Datawhale X 魔搭 AI夏令营 Task1 赛事解读 AI文生图相关概念可图模型及微调简介魔搭零代码生图、微调工具介绍魔搭AI生图相关应用介绍 DataWhale开源组织网站主页：Datawhale DataWhaleAI夏令营第...

AIGC 2024-08-28 人工智能

938阅读

whisper安装

安装Whisper 首先需要下载ffmpeg并添加环境变量。打开网站：https://github.com/BtbN/FFmpeg-Builds/releases，选择压缩包并下载到本地。解压后，找到bin文件夹下的“ffmpeg.exe”，将它复...

AIGC 2024-08-28 人工智能

1266阅读

Datawhale X 魔搭 AI夏令营-AIGC Task 02 精读代码，实战进阶 --笔记

前言 Task 01 通过预训练模型的调用，在baseline上跑通模型，实现内容→图片。即，根据prompt中输入的文本描述，模型生成对应的图片。Task 02 深入学习。目录一、AI生图技术 1.1 基础点 1.2 技术难点 1.3...

人工智能 2024-08-28 人工智能

861阅读

4060显卡+LLaMA-Factory微调LLM环境准备——（一）安装cuda

本地配置系统：win10**硬件：**i5-12490f+RTX4060 安装原因：最近尝试在本地对开源LLM进行Fine-tune的时候，用到了LLaMA-Factory，在运行的时候，弹出未检测到GPU，后来才发现，是忘记安装cuda等...

AIGC 2024-08-27 人工智能

2836阅读

Datawhale X 魔搭 AI夏令营 AIGC人物风格赛

工具初探一ComfyUI应用场景探索什么是ComfyUI GUI 是 "Graphical User Interface"（图形用户界面）的缩写。简单来说，GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。 ComfyUI 是GU...

生成式AI 2024-08-27 人工智能

770阅读

Datawhale AI夏令营第四期 AIGC方向 task02学习笔记

探探前沿：了解一下 AI生图技术的能力&局限今天我们的任务是对baseline的代码有一个更加细致的理解，然后我们会学习如何借助AI来提升我们的自学习能力，从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔，你可以...

生成式AI 2024-08-27 人工智能

946阅读

黄仁勋对谈扎克伯格：Llama 4或将摆脱聊天机器人形态

黄仁勋认为，Llama 2的发布是2023年最重要的AI事件。北京时间7月30日清晨，英伟达创始人兼CEO黄仁勋与Meta创始人兼CEO马克·扎克伯格，在美国丹佛举行的第50届SIGGRAPH图形大会上完成了一场60分钟的公开对话。上周刚刚发布...

AIGC 2024-08-26 人工智能

846阅读

#Datawhale AI夏令营第4期#AIGC方向文生图 Task2

Task2任务：对baseline的代码有一个更加细致的理解，然后学习如何借助AI来提升我们的自学习能力. 前沿知识：了解一下 AI生图技术的能力&局限 AI生图技术，通常指的是使用人工智能（尤其是深度学习）来生成图像的技术。这类技术可以用于...

生成式AI 2024-08-26 人工智能

940阅读

Datawhale X 魔搭 AI夏令营第四期 AIGC task3

part 1：认识comfyUI 1.初识ComfyUI 1.1什么是Comfy UI GUI是"Graphical User Interface"（图形用户界面）的缩写。简单来说，GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。...

大数据 2024-08-26 人工智能

928阅读

Datawhale X 魔搭AI夏令营第四期-AIGC文生图lora方向 Task2笔记

继task01跑通baseline之后，有时候回想起实例中那些自己摸不着头脑的代码片段，确实有些好奇，task2正好用借助通用大语言模型工具精读了一下这些代码片段，并进行了实战演练一一基于话剧的连环画制作。（这里学习文档给出的大语言模型...

人工智能 2024-08-26 人工智能

864阅读

AI绘画工具Stable Diffusion+ComfyUI的配置

ComfyUI 是一个基于图形用户界面的开源工具，用于搭建和运行复杂的图像生成和处理工作流。它主要围绕使用 Stable Diffusion 模型来生成高质量的图像。这种工具通常允许用户通过拖放不同的模块或节点，定义数据处理和生成流程，然后通过这些流程生成...

生成式AI 2024-08-26 人工智能

2133阅读

Datawhale AI夏令营第四期魔搭-AIGC方向 task02 精读代码，实战进阶

今天我们的任务是对baseline的代码有一个更加细致的理解，然后我们会学习如何借助AI来提升我们的自学习能力，从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔，你可以从中学大模型的提问技巧来实现快速学习，学会如何制作一个话剧连环画...

生成式AI 2024-08-25 人工智能

945阅读

Datawhale AI夏令营第四期AIGC方向Task2学习笔记

Kolors（可图）模型 Kolors是由快手团队开发的大规模文本到图像生成模型（可图 · 模型库 (modelscope.cn ）根据链接的文章内容，Kolors在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面，显著优于开源和专有...

生成式AI 2024-08-25 人工智能

883阅读

关于Stable diffusion的各种模型，看这篇就可以了！

前言这篇文章主要是帮大家梳理下Stable diffusion里面的各种模型，模型在Stable diffusion中占据着至关重要的地位，不仅决定了出图的风格，也决定了出图质量的好坏。但在第一次接触SD的时候，我就被里面的模型搞到头大，不仅有多...

AIGC 2024-08-25 人工智能

1929阅读

DALL·E 2 模型实现与运行指南

DALL·E 2 模型实现与运行指南 DALLE2-pytorchImplementation of DALL-E 2, OpenAI's updated text-to-image synthesis neural network, in Pytor...

大数据 2024-08-25 人工智能

1686阅读

Datawhale X 魔搭 AI夏令营 AIGC Task2笔记

对于task2里的这几句话本人还是十分赞成的定期关注AI生图的最新能力情况都十分重要：对于普通人来说，可以避免被常见的AI生图场景欺骗，偶尔也可以通过相关工具绘图对于创作者来说，通过AI生图的工具可以提效，快速制作自己所需要的内容对...

人工智能 2024-08-24 人工智能

877阅读

Datawhale AI 夏令营 “AIGC”方向 Task1：从零入门AI生图原理&实践

Task1：从零入门AI生图原理&实践提示：本文为对平台文档的解读注释和补充 Task1：从零入门AI生图原理&实践 Task1：从零入门AI生图原理&实践文生图 LoRA 提示词模型参数解读和测试...

大数据 2024-08-24 人工智能

958阅读

介绍 Whisper 模型

介绍 Whisper 模型 Whisper 是一个通用的语音识别模型。它在大规模多样化的音频数据集上进行训练，并且能够执行多任务处理，包括多语言语音识别、语音翻译和语言识别。核心方法 Whisper 使用的是 Transformer 序列到序列...

AIGC 2024-08-23 人工智能

1544阅读

Datawhale X 魔搭 AI夏令营第四期魔搭-AIGC方向 Task2:精读代码，实战进阶

Datawhale X 魔搭 AI夏令营第四期魔搭-AIGC方向 Task2:精读代码，实战进阶 Part1:磨刀准备一一认识通义千问会用ChatGpt就行 Part2：精读baseline——从零入门AI生图 1. 代码的主体架构...

人工智能 2024-08-23 人工智能

959阅读

Datawhale X 魔搭 AI夏令营-第四期 AIGC-Task 2

目录认识AI助手——通义千问操作指南主要功能模块精读baseline代码分析代码的主体架构逐行解释代码其他疑问-向AI追问进行实战——基于话剧的连环画制作提示词准备执行Task1的30分钟速通Baseline 修改...

生成式AI 2024-08-23 人工智能

881阅读

Datawhale X 魔搭 AI夏令营 AIGC方向 Task02

参考教程：Docshttps://datawhaler.feishu.cn/wiki/KxI2wIeAJiRQWhkRt9dcqlNVnFR?from=from_copylink 精读baseline 代码整理使用通义千问辅助理解baseline代...

AIGC 2024-08-23 人工智能

859阅读

如何高效微调多模态Transformers模型：从入门到实践指南

多模态大模型（Multimodal Large Models）是能够处理多种类型数据（如文本、图像、音频等）的机器学习模型。transformers 是当前多模态大模型中的一种重要架构。目录 Transformers简介多模态Transforme...

AIGC 2024-08-22 人工智能

1697阅读

【多模态大模型】LLaMA in arXiv 2023

一、引言论文： LLaMA: Open and Efficient Foundation Language Models作者： Meta AI代码： LLaMA特点：该方法在Transformer的基础上增加了Pre-normalization (...

大数据 2024-08-22 人工智能

1469阅读

Datawhale X 魔塔 AI夏令营 AIGC方向Task1

小白学习笔记，如有错误请各位大佬指正一、跑通baseline教程 Datawhale 教程链接Datawhale 二、baseline代码分析 1.安装库 !pip install simple-aesthetics-predictor !p...

AIGC 2024-08-22 人工智能

902阅读

Datawhale Al夏令营 AIGC方向 task2

1、代码解读 1.1、安装 Data-Juicer 和 DiffSynth-Studio # 安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor # 安...

AIGC 2024-08-21 人工智能

959阅读

Datawhale 魔搭 AI夏令营第四期 AIGC方向 Tesk2 可图Kolors-LoRA模型进阶学习

AI生图的能力与局限 AI生图的原理 AI利用深度学习技术来训练神经网络，训练过程中，神经网络会学习到真实图像中的纹理、结构、颜色等特征，并将这些特征应用于生成新的图像。从而生成具有高保真度的图像。训练后，通过输入关键提示词来让模型...

AIGC 2024-08-21 人工智能

882阅读

Stable Diffusion WebUI 1.10.0来了

大家好，我是每天分享AI应用的萤火君！前几天 AUTOMATIC1111 发布了Stable Diffusion WebUI 1.10，我也在第一时间将云环境的镜像升级到了最新版本，有兴趣的同学可以去体验下，目前已经发布到了AutoDL，镜像地址：...

大数据 2024-08-21 人工智能

1225阅读

使用llama factory对语言模型微调，重塑自我认知，并部署于ollama上

本文记录了从环境部署到微调模型、效果测试并部署的全过程。一环境如果使用autodl租赁服务器则不需要如下步骤，但是请注意llama_factory需要python、cuda等版本满足：首先请确报你已经安装好了conda工具...

人工智能 2024-08-21 人工智能

2708阅读

Datawhale AI夏令营第四期魔搭- AIGC方向 task02笔记

大纲一、前言二、代码块解读 2.1 依赖包安装 2.2 数据集下载 2.3 metadata.jsonl文件生成（图片及对应标签） 2.4 设置data-juicer 配置文件并执行，处理metadata.jsonl文件生成result....

生成式AI 2024-08-21 人工智能

1129阅读

小白教程：Unsloth 打造属于自己的中文版Llama3

在定制化业务场景中，如果利用专属数据集，经过微调的大模型能够在多种任务上与GPT-4媲美，并支持本地部署，保护隐私，同时还能降低运算成本。最新推出的Llama3，作为当前性能最强的开源基础大模型，非常适用于自然语言处理、机器翻译、文本生成、问答系统、聊天机...

AIGC 2024-08-20 人工智能

2999阅读

Positional Encoding | 位置编码【详解】

文章目录 1、位置编码的2种方案 2、位置编码 3、公式详解：绝对位置、相对位置 4、代码 4.1 代码1 4.2 代码2 1、位置编码的2种方案 transformer的作者刚开始说固定的位置编码和可学习的位置...

人工智能 2024-08-20 人工智能

1791阅读

Datawhale X 魔搭 AI夏令营---AIGC Task2

目录 Datawhale X 魔搭 AI夏令营第四期-AIGC文生图方向 Task2：精读代码，实战进阶 0.0 一些link 0.1 任务内容 0.2 AI生图 0.3 **Kolors（可图）模型** 1.1 精读baseline——从...

人工智能 2024-08-20 人工智能

868阅读

微调大语言模型——LLaMa-Factory平台搭建（非常详细）零基础入门到精通，收藏这一篇就够了

我们采用 LLaMA-Factory平台进行微调语言模型，详细信息可以访问github主页（https://github.com/hiyouga/LLaMA-Factory）浏览。租赁显卡采用AutoDL作为云平台进行微调训练。Win系统采用终端...

人工智能 2024-08-19 人工智能

3310阅读

Datawhale X 魔搭 AI夏令营第四期魔搭-AIGC方向 task02笔记

一、探探前沿：了解一下 AI生图技术的能力&局限 1. 为什么要了解AI生图前沿？ AIGC(AI-Generated Content 是通过人工智能技术自动生成内容的生产方式，很早就有专家指出，AIGC将是未来人工智能的重点方向，也将改造相...

AIGC 2024-08-19 人工智能

959阅读

Datawhale X 魔搭 AI夏令营第四期 AIGC方向学习笔记（一）

本期主要任务是了解AI文生图的原理并进行相关实践下面是对baseline部分代码的功能介绍：安装Data-juicere和DiffSynth-Studio !pip install simple-aesthetics-predictor !pip...

大数据 2024-08-19 人工智能

1068阅读

magic-animate_pytorch AIGC使图像中人物按照给定动作动起来

magic-animate 论文 MagicAnimate: Temporally Consistent Human Image Animation using Diffusion Model https://arxiv.org/pdf/2311.1...

人工智能 2024-08-19 人工智能

1131阅读

Datawhale X 魔搭 AI夏令营-AIGC方向-task2知识总结

文生图背景早期探索（1960-1990）最早出现于计算机视觉和图像处理。早期图像生成技术主要依赖与规则和模板匹配，通过预定义的规则将文本转换为简单的图形。受限于计算能力和算法，此阶段生成的图像质量较低，应用场景受限。基于统计...

AIGC 2024-08-18 人工智能

1135阅读

国产可图大模型:厚积薄发,GLM3加持质的飞跃,ComfyUI最全指南与SD3综合评比孰更强？

?大家好！我是安琪！！！ Kolors大模型简就在上周末，国内大厂快手开源了可图大模型文生图模型，这是由快手可图团队开发的基于潜在扩散的大规模文本到图像生成模型。 • Kolors 是在数10亿图文对下进行训练， • 在视觉质量、复杂语...

AIGC 2024-08-17 人工智能

1687阅读

Datawhale X 魔搭 AI夏令营 “AIGC”方向 task1

一、任务要求 task1 的任务和上一期的类似，都是跑通给出的代码即可，没有太大难度。具体要求是训练 Lora 模型，实现文生图，额外的要求是8张图片必须组成一个连贯的故事，需要一定的“写小作文”能力。二、代码解析下载数据集这一步不用分析...

大数据 2024-08-17 人工智能

1026阅读

ComfyUI安装完整攻略

ComfyUI简介 ComfyUI是一种新型的Stable Diffusion用户界面，因其独树一帜的“节点式”界面，逐渐成为了AI绘画领域进阶玩家的得力武器。搭配各式各样的自定义节点与功能强大的工作流，它得以用更低的配置实现许多在WebUI等常规界面里...

AIGC 2024-08-17 人工智能

14146阅读

ComfyUI零基础入门搭建教程

一、介绍 ComfyUI 是一个强大的、模块化的 Stable Diffusion 界面与后端项目。该用户界面允许用户使用基于图形/节点/流程图的界面设计和执行高级稳定的扩散管道。该项目部分其它特点如下：目前全面支持 SD1.x，SD2.x，SDX...

生成式AI 2024-08-17 人工智能

2397阅读

LLaMA-Factory全面指南：从训练到部署

项目背景与概述 LLaMA-Factory项目目标 LLaMA-Factory项目是一个专注于大模型训练、微调、推理和部署的开源平台。其主要目标是提供一个全面且高效的解决方案，帮助研究人员和开发者快速实现大模型的定制化需求。具体来说，LLaMA-F...

大数据 2024-08-16 人工智能

6270阅读

【LLaMA-Factory】常见报错信息及解决方法整理

1.‘llamafactory-cli’ 不是内部或外部命令，也不是可运行的程序或批处理文件。 bash: llamafactory-cli: command not found #3568 解决方法： cd 你路径下的\LLaMA-Factor...

人工智能 2024-08-16 人工智能

5610阅读

SenseVoice多语言语音理解模型之最新部署落地经验

SenseVoice是阿里云通义实验室开发的一款多语言音频基础模型，专注于高精度多语言语音识别、情感辨识和音频事件检测。 SenseVoice支持超过50种语言的识别，并且在中文和粤语上的识别效果优于Whisper模型，提升了50%以上。 SenseV...

AIGC 2024-08-16 人工智能

4294阅读

Datawhale X 魔塔 AI夏令营第四期-AIGC文生图方向 Task1笔记

一、文生图背景文生图（Text-to-Image Generation）是一种通过文本生成图像的技术，其发展历程可以追溯到早期的计算机视觉和自然语言处理研究。文生图的概念最早出现于计算机视觉和图像处理的早期研究中。早期的图像生成技术主要...

AIGC 2024-08-16 人工智能

1339阅读

LLM - 使用 HuggingFace + Ollama 部署最新大模型 (GGUF 格式与 Llama 3.1)

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/141028040 免责声明：本文来源于个人知识与公开资料，仅用于学术交...

生成式AI 2024-08-16 人工智能

4918阅读

Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记--切记我是一个温柔的刀客

Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记作者: 福州大学切记我是一个温柔的刀客 2024/8/10 从零入门AI生图原理&实践是 Datawhale 2024 年 AI 夏令营第四期的学习活...

大数据 2024-08-15 人工智能

799阅读

Datawhale X魔搭AI夏令营魔搭-AIGC方向 Task2笔记

Datawhale X魔搭AI夏令营魔搭-AIGC方向 Task2笔记经过TASK1的学习，我们都或多或少地了解了AI作图的相关知识，那么接下来我们需要学习的便是深入Prompt工程与微调，精准理解AI作图个中原理，深刻探究文生图背...

人工智能 2024-08-15 人工智能

1103阅读

Whisper JAX 深度使用指南

Whisper JAX 深度使用指南 whisper-jaxJAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.项目地址:https://gitcode....

AIGC 2024-08-14 人工智能

1434阅读