clip 第3页 - AIGC资讯

DataWhale多模态赛事Task1

赛事链接：https://tianchi.aliyun.com/competition/entrance/532251/introduction?spm=a2c22.12281925.0.0.2f307137p8qZmp 赛事描述：在当下大数据、大模型时...

生成式AI 2024-08-31 人工智能

734阅读

精通 Stable Diffusion 调优秘籍

一、Stable Diffusion 调优概览 Stable Diffusion 作为一款强大的 AI 绘画工具，其调优具有至关重要的意义。通过合理的调优，可以显著提升图像生成的质量、速度和准确性，满足用户更加多样化和精细化的需求。调优主要涵盖了...

AIGC 2024-08-31 人工智能

887阅读

Stable Diffusion的微调方法原理总结

目录 1、Textural Inversion（简易） 2、DreamBooth（完整） 3、LoRA（灵巧） 4、ControlNet（彻底） 5、其他 1、Textural Inversion（简易）不改变网络结构...

生成式AI 2024-08-31 人工智能

1076阅读

从零开始快速使用comfyUI进行文生图或者图生视频制作

前言今天花时间试了试怎么用 ComfyUI，今天晚上就来介绍一下，怎么简单使用。上面是用 comfyUI 生成的视频。安装首先进行安装。在 github 上搜索 comfyUI，第一个就是，点进去然后点击左侧 Release...

生成式AI 2024-08-30 人工智能

3857阅读

Datawhale AI夏令营第四期AIGC-3进阶上分-实战优化

Task3学习链接 Datawhale (linklearner.com 1. ComfyUI的安装与使用 ComfyUI 是GUI"Graphical User Interface"（图形用户界面）的一种，是基于节点工作的用户界面，主要用于操作图...

人工智能 2024-08-30 人工智能

864阅读

Stable Diffusion 开源项目教程

Stable Diffusion 开源项目教程 stablediffusionHigh-Resolution Image Synthesis with Latent Diffusion Models项目地址:https://gitcode.com/gh...

大数据 2024-08-30 人工智能

1061阅读

Datawhale X 魔搭 AI夏令营第四期--AIGC文生图 task2笔记

先上图看连环画成果一直有个篮球总冠军，根据通义千问的文生图对话式生成8个连贯的文生图故事。通过生成的故事内容生成了下面的图片男主正在练习打篮球动漫风，连环画，一个黑色高个子帅气男生，穿着红色篮球服，正在篮球训练场上，练习投篮，专注地重复...

AIGC 2024-08-29 人工智能

737阅读

VAD-LLaMA：基于大语言模型的视频异常检测和解释（Video Anomaly Detection and Explanation via Large Language Models）

文章目录问题方法整体架构 VE and Feature Extraction Long-Term Context (LTC Module Feature Adaptor LLaMA 训练流程图第一阶段：训练VADor 第二阶段...

大数据 2024-08-29 人工智能

1066阅读

Datawhale X 魔搭 AI夏令营 - AIGC文生图方向Task2笔记

今天做的是AIGC文生图方向的 task 2 ，回顾一下 task 2 step 0 : Task 2 学习规划 step 1 : 认识通义千问（使用通义千问大语言模型学习如何借助AI智能助手帮我们阅读代码）链接：点击直达 1...

人工智能 2024-08-28 人工智能

906阅读

ECCV2024 | 小成本微调CLIP大模型！CLAP开源来袭：零样本和少样本训练有救了！

论文链接：https://arxiv.org/pdf/2311.16445 代码链接：https://github.com/YichaoCai1/CLAP 亮点直击解耦潜在内容和风格因素：本文提出了一种通过对比学习和数据增强，从因果角度微...

人工智能 2024-08-27 人工智能

1124阅读

Datawhale X 魔搭 AI夏令营-AIGC文生图方向Task2笔记

学习链接：https://datawhaler.feishu.cn/wiki/UM7awcAuQicI4ukd2qtccT51nug 因为不会专业性的术语所以在此依然是简单记录自己的运行和打卡。 1.文生图理论学习 Deepfake技术 Deepf...

生成式AI 2024-08-27 人工智能

909阅读

Datawhale X 魔搭 AI0夏令营魔搭-AIGC文生图方向 Tsak 2 震惊！！！AI小白竟然用AI生成这种图片......

本文为AI方向小白记录暑期参加魔搭夏令营-AIGC文生图方向的Task 01 报名赛事链接：可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制欢迎所有小白，大神前来交流学习。一.问题的提...

大数据 2024-08-27 人工智能

820阅读

Datawhale AI夏令营第四期 AIGC方向 task02学习笔记

探探前沿：了解一下 AI生图技术的能力&局限今天我们的任务是对baseline的代码有一个更加细致的理解，然后我们会学习如何借助AI来提升我们的自学习能力，从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔，你可以...

生成式AI 2024-08-27 人工智能

782阅读

#Datawhale AI夏令营第4期#AIGC方向文生图 Task2

Task2任务：对baseline的代码有一个更加细致的理解，然后学习如何借助AI来提升我们的自学习能力. 前沿知识：了解一下 AI生图技术的能力&局限 AI生图技术，通常指的是使用人工智能（尤其是深度学习）来生成图像的技术。这类技术可以用于...

生成式AI 2024-08-26 人工智能

761阅读

3秒让AI变乖，生成风险图片减少30%！复旦新研究拿下扩散模型概念移除新SOTA｜ECCV 2024

让AI绘画模型变“乖”，现在仅需3秒调整模型参数。效果be like:生成的风险图片比以往最佳方法减少30%! 像这样，在充分移除梵高绘画风格的同时，对非目标艺术风格几乎没有影响。在移除裸露内容上，效果达到“只穿衣服，不改结构”。这就是复旦大学提...

人工智能 2024-08-26 人工智能

857阅读

Datawhale X 魔搭AI夏令营第四期-AIGC文生图lora方向 Task2笔记

继task01跑通baseline之后，有时候回想起实例中那些自己摸不着头脑的代码片段，确实有些好奇，task2正好用借助通用大语言模型工具精读了一下这些代码片段，并进行了实战演练一一基于话剧的连环画制作。（这里学习文档给出的大语言模型...

人工智能 2024-08-26 人工智能

731阅读

SD创始团队黑马的Flux真的那强吗？SD Flux与华为ultrapixel大PK！群雄逐鹿！“百模”并起，王者之战~！

前言小南还是没忍住，看大家都在试玩Flux，真的有那么震撼么？小南手痒痒也体验下吧。今天主要简单介绍下Flux以及ComfyUI的安装，重点是和我们“遥遥领先”的华为开源的ultrapixel进行下对比。没有对比就没有伤害！大家应该对Flux也有...

人工智能 2024-08-26 人工智能

1857阅读

图像检索在ImageNet分类任务中的优势：超越扩散模型生成图像

?在之前AIGC助力ResNet分类任务：跃升10个百分点-CSDN博客文章中，提到使用Textual Inversion对COCO、PascalVOC、少样本数据集进行数据增强，再进行分类任务，精度上升。 ?而今天要聊到的这篇论文更全面地探究了扩散模型...

AIGC 2024-08-25 人工智能

1087阅读

Datawhale AI夏令营第四期魔搭-AIGC方向 task02 精读代码，实战进阶

今天我们的任务是对baseline的代码有一个更加细致的理解，然后我们会学习如何借助AI来提升我们的自学习能力，从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔，你可以从中学大模型的提问技巧来实现快速学习，学会如何制作一个话剧连环画...

生成式AI 2024-08-25 人工智能

778阅读

AIGC：clip-interrogator

文字生成图片是近年来多模态和大模型研究的热门方向，openai提出的CLIP提供了一个方法建立起了图片和文字的联系，但是只能做到给定一张图片选择给定文本语义最相近的那一个，实际项目开发中我们总是需要从一张图片获取描述，clip-interrogator应运...

生成式AI 2024-08-25 人工智能

1079阅读

Datawhale X 魔搭 AI夏令营 AIGC Task2笔记

对于task2里的这几句话本人还是十分赞成的定期关注AI生图的最新能力情况都十分重要：对于普通人来说，可以避免被常见的AI生图场景欺骗，偶尔也可以通过相关工具绘图对于创作者来说，通过AI生图的工具可以提效，快速制作自己所需要的内容对...

人工智能 2024-08-24 人工智能

741阅读

Datawhale AI夏令营第四期魔搭-AIGC方向 Task2：精读代码，实战进阶笔记

在夏令营第四期Task1时，我们已经跑通了baseline，本期目的是对baseline的代码有一个更加细致的理解，学习如何借助AI来提升我们的自学习能力，理解每行代码的意思，从大模型提问技巧来实现自主学习，并学习如何制作一个连环画。首先认识大语言模型...

大数据 2024-08-24 人工智能

709阅读

Datawhale X 魔搭 AI夏令营 - AIGC方向（task01笔记）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、基础知识二、实现步骤 1.克隆存储库： 2. 安装环境，然后重启kernel 3. 调整prompt 总结前言赛题介绍...

AIGC 2024-08-24 人工智能

770阅读

Stable Diffusion | Gradio界面设计及webUI API调用

本文基于webUI API编写了类似于webUI的Gradio交互式界面，支持文生图/图生图（SD1.x，SD2.x，SDXL），Embedding，Lora，X/Y/Z Plot，ADetailer、ControlNet，超分放大（Extras），图片信...

AIGC 2024-08-23 人工智能

1146阅读

Datawhale X 魔搭 AI夏令营-第四期 AIGC-Task 2

目录认识AI助手——通义千问操作指南主要功能模块精读baseline代码分析代码的主体架构逐行解释代码其他疑问-向AI追问进行实战——基于话剧的连环画制作提示词准备执行Task1的30分钟速通Baseline 修改...

生成式AI 2024-08-23 人工智能

738阅读

Datawhale X 魔搭 AI夏令营 AIGC方向 Task02

参考教程：Docshttps://datawhaler.feishu.cn/wiki/KxI2wIeAJiRQWhkRt9dcqlNVnFR?from=from_copylink 精读baseline 代码整理使用通义千问辅助理解baseline代...

AIGC 2024-08-23 人工智能

708阅读

AI绘画大模型-StableDiffusion最强模型sd3（本地安装方法）

前言/introduction Stable Diffusion 3（简称SD3）是Stability AI最新推出的文本到图像生成模型。相比前代模型，SD3在生成质量、细节表现以及运行效率上有了显著提升，尤其在细腻的图像渲染和复杂...

人工智能 2024-08-23 人工智能

1522阅读

Datawhale X 魔搭 AI夏令营第四期 AIGC方向 task02笔记

AI工具使用 1. baseline 代码 2. 使用通义千问理解代码 2.1 工作流程 2.2 逐行释意 3. 使用通义千问生成 Prompt 3.1 生成的 Prompt 3.1 根据 Prompt 生成的图片 1. b...

人工智能 2024-08-22 人工智能

714阅读

【Stable Diffusion】最强模型——Flux推荐和下载

前言 Flux是一个由黑森林实验室（Black Forest Lab）推出的模型，开发人员由Stable Diffusion前离职人员构成。做到了很多SD和MJ都做不到或者很难做到的事情。其特点主要如下：参数规模大****：官方号称模型有12B...

AIGC 2024-08-22 人工智能

3227阅读

AI绘画Stable Diffusion基础教程！

Ai绘图真的太火了，挡都挡不住。本着“不断好奇，不停学习”的理念，我打算介绍下Stable Diffusion，有兴趣的小伙伴可以一起学习。目前市面上比较权威，并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney（简称 MJ），另一...

生成式AI 2024-08-22 人工智能

653阅读

Datawhale 魔搭 AI夏令营第四期 AIGC方向 Tesk2 可图Kolors-LoRA模型进阶学习

AI生图的能力与局限 AI生图的原理 AI利用深度学习技术来训练神经网络，训练过程中，神经网络会学习到真实图像中的纹理、结构、颜色等特征，并将这些特征应用于生成新的图像。从而生成具有高保真度的图像。训练后，通过输入关键提示词来让模型...

AIGC 2024-08-21 人工智能

715阅读

Stable Diffusion WebUI 1.10.0来了

大家好，我是每天分享AI应用的萤火君！前几天 AUTOMATIC1111 发布了Stable Diffusion WebUI 1.10，我也在第一时间将云环境的镜像升级到了最新版本，有兴趣的同学可以去体验下，目前已经发布到了AutoDL，镜像地址：...

大数据 2024-08-21 人工智能

1050阅读

MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions

Paper name MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions Paper Reading Note Paper URL: ht...

大数据 2024-08-21 人工智能

1201阅读

大白话讲透AI画图：Stable Diffusion

Stable Diffusion 是一种从文本生成 AI 图像的潜空间扩散模型，它不是在高维图像空间中操作，而是首先将图像压缩到潜在空间（latent space）中。我们将深入了解它的工作机制。知道工作机制有什么用？除了其本身就是个非常值得了解的内容...

生成式AI 2024-08-20 人工智能

780阅读

Datawhale X 魔搭 AI夏令营---AIGC Task2

目录 Datawhale X 魔搭 AI夏令营第四期-AIGC文生图方向 Task2：精读代码，实战进阶 0.0 一些link 0.1 任务内容 0.2 AI生图 0.3 **Kolors（可图）模型** 1.1 精读baseline——从...

人工智能 2024-08-20 人工智能

707阅读

Datawhale X 魔搭 AI夏令营 AIGC方向 task2笔记

纯小白，自学！从零入门AI生图（AIGC方向）基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展实践学习。#Datawhale X 魔搭 AI夏令营# 一、利用AI精读baseline学习代码 task2的目的是精读bas...

AIGC 2024-08-19 人工智能

653阅读

Datawhale X 魔搭 AI夏令营第四期魔搭-AIGC方向 task02笔记

一、探探前沿：了解一下 AI生图技术的能力&局限 1. 为什么要了解AI生图前沿？ AIGC(AI-Generated Content 是通过人工智能技术自动生成内容的生产方式，很早就有专家指出，AIGC将是未来人工智能的重点方向，也将改造相...

AIGC 2024-08-19 人工智能

811阅读

面完 AIGC 大模型算法岗，心态崩了。。。

大家好，今天我们继续聊聊 AI 科技圈发生的那些事。内容包括：AI 科技圈最新动态和最新面试题总结。 Meta 推新一代 SAM 2 图像识别再进化！Meta 推新一代SAM 2 官方链接：https://ai.meta.com/blog/se...

人工智能 2024-08-19 人工智能

741阅读

Datawhale AI夏令营第四期魔搭-AIGC方向 task02笔记

1：精读baseline 这里我使用了ChatGPT 4o对吧baseline文件代码进行了解析(不知道为啥我的通义千问无法使用。 GPT代码解析结果如下： 1. 环境设置与依赖安装 !pip install simple-aest...

人工智能 2024-08-19 人工智能

756阅读

哦吼，新模型？文生图领域的新模型FLUX.1（附模型下载网盘地址和详细使用方法）

?背景 Black Forest Labs 是由 Stable Diffusion 原班人马成立的公司，致力于研发优质的多模态模型并开源。该公司由多位前 Stability AI 研究员组成，包括 Robin Rombach 在内的团队成员，他们在图像和...

AIGC 2024-08-18 人工智能

3265阅读

Datawhale AI夏令营第四期 AIGC方向 task02 初学者笔记

一、Prompt工程介绍:1、概念： Prompt工程，也称为提示工程或指令工程，是在自然语言处理（NLP）领域中一种重要的技术和方法。它主要用于指导预训练的大规模语言模型（Large Language Models, LLMs）生成高质量、准确且有针对...

AIGC 2024-08-18 人工智能

782阅读

Stable Diffusion 模型的安装和使用

一、SD模型简介 Stable Diffusion的绘图风格主要由模型来控制，基础模型主要由二次元图片训练获得，所以在不安装其他模型的情况下，只能生成二次元风格的图像。模型能够有效地控制生成的画风和内容。常用的模型网站有： Stable...

大数据 2024-08-18 人工智能

1192阅读

我果然还是喜欢二次元一些（Stable Diffusion进阶篇：ComfyUI 画风迁移）

现在Stable Diffusion也能做到把一张真人的照片转绘成动漫风格，在保持人物大概形象不变的同时为图片添加合适的背景。时间仓促（有点糙） WebUI的操作（流程演示）这种操作在WebUI里面不算难，大概一分多钟就能完成这样的操...

人工智能 2024-08-18 人工智能

2077阅读

ComfyUI系列教程(1)--Stable Diffusion基本原理

1.Stable Diffusion文生图基本原理 1.1Stable Diffusion原理介绍文生图主要基于Stable Diffusion大模型进行。SD的基本结构图如下图所示，主要包括3个部分。其中1是CLIP图像文本对，将图...

大数据 2024-08-18 人工智能

1017阅读

llama-factory源码详解——以DPO为例

本文记录了我在学习 llama-factory过程中对代码运行过程的梳理代码入口——src/train.py from llamafactory.train.tuner import run_exp def main( : run_exp...

大数据 2024-08-18 人工智能

2139阅读

Datawhale AI夏令营第四期魔搭-AIGC文生图方向 Task01笔记分享

目标：跑通baseline 目录第一步-搭建代码所需环境第二步-报名赛事第三步-在魔塔世界创建免费PAI实例(实例使用完后记得关闭哦第四步-使用阿里云免费算力第五步-提交结果第六步-美学分数赛事链接：可图Kolors-Lo...

AIGC 2024-08-17 人工智能

705阅读

FLUX | 超越SD3、媲美Midjourney的顶级AI绘图模型

本文包含大量AI干货阅读完大约需要8分钟 1.引言在过去的两年中，第一个公开发布且功能齐全的图像合成模型 Stable Diffusion 完全占据了主导地位，一大批竞争对手（PixArt Alpha/Sigma/AuraFlow）试图效仿S...

大数据 2024-08-17 人工智能

1853阅读

Datawhale X 魔搭 AI夏令营-AIGC文生图-task1-笔记

目录 1 赛题解读 2 文生图的历史 3 文生图基础知识介绍 3.1 提示词 3.2 Lora 3.3 ComfyUI 3.4 参考图控制 4 实践-通过代码完成模型微调&AI生图-Test 4.1 体验base...

人工智能 2024-08-17 人工智能

750阅读

2024年最新ComfyUI汉化及manager插件安装详解！

前言在ComfyUI文生图详解中，学习过如果想要安装相应的模型，需要到模型资源网站（抱抱脸、C站、魔塔、哩布等）下载想要的模型，手动安装到ComfyUI安装目录下对应的目录中。为了简化这个流程，我们需要安装ComfyUI-manager插件，通过这...

AIGC 2024-08-17 人工智能

9249阅读

ComfyUI零基础入门搭建教程

一、介绍 ComfyUI 是一个强大的、模块化的 Stable Diffusion 界面与后端项目。该用户界面允许用户使用基于图形/节点/流程图的界面设计和执行高级稳定的扩散管道。该项目部分其它特点如下：目前全面支持 SD1.x，SD2.x，SDX...

生成式AI 2024-08-17 人工智能

2204阅读