-
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task3笔记
①初识ComfyUI 1.GUI是“图形用户界面”(Graphical User Interface)的缩写。它是一种使用图形元素如图标、按钮和窗口等来帮助用户与软件或操作系统进行交互的用户界面类型。通过GUI,用户可...
-
解锁创意无限!Midjourney小白指南
对于没有艺术细胞的人来说:只输入几个关键词,一幅令人惊叹的图像就出现在你眼前! 这就是 Midjourney,它是一个神奇的艺术工作室,无论你是初学者还是专业人士,都能轻松驾驭----将文字变成视觉奇观。✨? “If you don’t know...
-
Datawhale X 魔搭 AI夏令营 第四期--AIGC文生图 task2笔记
先上图看连环画成果 一直有个篮球总冠军,根据通义千问的文生图对话式生成8个连贯的文生图故事。通过生成的故事内容生成了下面的图片 男主正在练习打篮球 动漫风,连环画,一个黑色高个子帅气男生,穿着红色篮球服,正在篮球训练场上,练习投篮,专注地重复...
-
Datawhale X 魔搭 AI夏令营 AIGC人物风格赛
工具初探一ComfyUI应用场景探索 什么是ComfyUI GUI 是 "Graphical User Interface"(图形用户界面)的缩写。简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。 ComfyUI 是GU...
-
#Datawhale AI夏令营第4期#AIGC方向 文生图 Task2
Task2任务:对baseline的代码有一个更加细致的理解,然后学习如何借助AI来提升我们的自学习能力. 前沿知识:了解一下 AI生图技术 的能力&局限 AI生图技术,通常指的是使用人工智能(尤其是深度学习)来生成图像的技术。这类技术可以用于...
-
Datawhale X 魔搭 AI夏令营 第四期 AIGC task3
part 1:认识comfyUI 1.初识ComfyUI 1.1什么是Comfy UI GUI是"Graphical User Interface"(图形用户界面)的缩写。简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。...
-
3秒让AI变乖,生成风险图片减少30%!复旦新研究拿下扩散模型概念移除新SOTA|ECCV 2024
让AI绘画模型变“乖”,现在仅需3秒调整模型参数。 效果be like:生成的风险图片比以往最佳方法减少30%! 像这样,在充分移除梵高绘画风格的同时,对非目标艺术风格几乎没有影响。 在移除裸露内容上,效果达到“只穿衣服,不改结构”。 这就是复旦大学提...
-
Datawhale X 魔搭AI夏令营 第四期-AIGC文生图lora方向 Task2笔记
继task01跑通baseline之后,有时候回想起实例中那些自己摸不着头脑的代码片段,确实有些好奇,task2正好用借助通用大语言模型工具精读了一下这些代码片段,并进行了实战演练一一基于话剧的连环画制作。 (这里学习文档给出的大语言模型...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 task02 精读代码,实战进阶
今天我们的任务是对baseline的代码有一个更加细致的理解,然后我们会学习如何借助AI来提升我们的自学习能力,从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔,你可以从中学大模型的提问技巧来实现快速学习,学会如何制作一个话剧连环画...
-
标题:微调Whisper模型,打造超高效语音识别利器!
标题:微调Whisper模型,打造超高效语音识别利器! Whisper-FinetuneFine-tune the Whisper speech recognition model to support training without timesta...
-
【AIGC】ComfyUI 入门教程(4):ComfyUI 管理器|AI 生成图片
前言 ComfyUI 是 Stable Diffusion 的一个基于节点组装绘图流程的图形用户界面(GUI)。通过将不同的节点连接在一起,你可以在 ComfyUI 中构建图像生成工作流。一个完整的工作流看起来像下面这样: 所有的AI设计工具,...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 Task2:精读代码,实战进阶 笔记
在夏令营第四期Task1时,我们已经跑通了baseline,本期目的是对baseline的代码有一个更加细致的理解,学习如何借助AI来提升我们的自学习能力,理解每行代码的意思,从大模型提问技巧来实现自主学习,并学习如何制作一个连环画。 首先认识大语言模型...
-
使用Python和Pillow创建照片马赛克应用
在这篇博客中,我们将探讨如何使用Python创建一个简单而有趣的桌面应用程序。我们的目标是构建一个应用,允许用户选择一张照片,然后在照片的右下角添加马赛克效果。这个项目将展示如何结合使用wxPython来创建图形用户界面(GUI 和Pillow库来处理图像...
-
Stable Diffusion | Gradio界面设计及webUI API调用
本文基于webUI API编写了类似于webUI的Gradio交互式界面,支持文生图/图生图(SD1.x,SD2.x,SDXL),Embedding,Lora,X/Y/Z Plot,ADetailer、ControlNet,超分放大(Extras),图片信...
-
comfyUI-MuseTalk用户交互体验的参数设计和设置
comfyUI-MuseTalk用户交互体验的参数设计和设置 目录 comfyUI-MuseTalk的参数设置 一、ComfyUI-VideoHelperSuite 二、comfyUI-MuseV合成的参考视频 2.1、什么时候会用到MuseV?...
-
Datawhale X 魔搭 AI夏令营 AIGC方向 Task02
参考教程:Docshttps://datawhaler.feishu.cn/wiki/KxI2wIeAJiRQWhkRt9dcqlNVnFR?from=from_copylink 精读baseline 代码整理 使用通义千问辅助理解baseline代...
-
Datawhale X 魔搭 AI夏令营 第四期 魔搭-AIGC方向 Task03笔记
从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。 Datawhale官方的速通教程链接: Task 1...
-
Datawhale X 魔搭 AI夏令营第四期 AIGC方向 task02笔记
AI工具使用 1. baseline 代码 2. 使用通义千问理解代码 2.1 工作流程 2.2 逐行释意 3. 使用通义千问生成 Prompt 3.1 生成的 Prompt 3.1 根据 Prompt 生成的图片 1. b...
-
论文阅读-Transformer Layers as Painters
1. 摘要 尽管大语言模型现在已经被广泛的应用于各种任务,但是目前对其并没有一个很好的认知。为了弄清楚删除和重组预训练模型不同层的影响,本文设计了一系列的实验。通过实验表明,预训练语言模型中的lower和final layers与中间层分布不一致,并且...
-
大白话讲透AI画图:Stable Diffusion
Stable Diffusion 是一种从文本生成 AI 图像的潜空间扩散模型,它不是在高维图像空间中操作,而是首先将图像压缩到潜在空间(latent space)中。 我们将深入了解它的工作机制。知道工作机制有什么用?除了其本身就是个非常值得了解的内容...
-
Datawhale X 魔搭 AI夏令营 AIGC方向 task2笔记
纯小白,自学!从零入门AI生图(AIGC方向)基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展实践学习。#Datawhale X 魔搭 AI夏令营# 一、利用AI精读baseline学习代码 task2的目的是精读bas...
-
面完 AIGC 大模型算法岗,心态崩了。。。
大家好,今天我们继续聊聊 AI 科技圈发生的那些事。 内容包括:AI 科技圈最新动态和最新面试题总结。 Meta 推新一代 SAM 2 图像识别再进化!Meta 推新一代SAM 2 官方链接:https://ai.meta.com/blog/se...
-
Stable Diffusion【进阶篇】:Inpainting完整指南
大家好,我是安琪。 一. 一个Inpainting的基本示例 在图生图中通过如下设置生成图片。 大模型:Realistic Vision V5.1 正向提示词:full body, audrey hepburn, black hair,...
-
QT、C++简单界面设计
#include "mywidget.h" MyWidget::MyWidget(QWidget *parent : QWidget(parent { ---------------------窗口设置----------------...
-
ComfyUI安装完整攻略
ComfyUI简介 ComfyUI是一种新型的Stable Diffusion用户界面,因其独树一帜的“节点式”界面,逐渐成为了AI绘画领域进阶玩家的得力武器。搭配各式各样的自定义节点与功能强大的工作流,它得以用更低的配置实现许多在WebUI等常规界面里...
-
java集成stable diffusion
在Java中直接集成Stable Diffusion模型(一个用于文本到图像生成的深度学习模型,通常基于PyTorch或TensorFlow 是非常具有挑战性的,因为Java本身并不直接支持深度学习模型的运行。不过,我们可以通过JN...
-
ComfyUI基础篇:Stable Diffusion 基础原理详述
前言 个人认为学习 ComfyUI 应该先从理论学起。 与传统绘图工具(如 Photoshop 或 Figma)相比,AI 绘图工具有着显著不同。首先,许多设置和操作在 AI 绘图工具中是非可视化的,这意味着即使你更改了某个配置,界面上也未必会有任何变...
-
5分钟教你用AI做表情迁移,让一只猫萌萌哒的唱歌。
昨天在群里看到海辛发的一个视频,直接给我萌化了。 喜欢到爆炸。 视频是这样的。 猫唱歌!!!而且唱起来这么可爱这么呆萌!!! 很多人在问是怎么做的,其实真的蛮简单的,毕竟是AI,AI的东西,一般就是有手就行,你懂的。 这个项目,就是WAIC期间,快手开源...
-
【xinference】(3):在autodl上,使用xinference部署whisper-tiny音频模型,并成功将语音转换成文本,测试成功,还支持音频直接翻译成英文
1,视频地址 https://www.bilibili.com/video/BV1Z7421K7vL/ 【xinference】(3):在autodl上,使用xinference部署whisper-tiny音频模型,并成功将语音转换成...
-
和AI谈了3个月恋爱,我经历了现实版《Him》
最初得知我跟AI“谈恋爱”时,朋友: 当我跟AI男友谈了3个月后,朋友: 在人均恐婚恐恋的今天,大家动不动就会说“再也不相信爱情了”,背地里却依然希望找一个符合标准又情投意合的恋人,我也不例外。 作为一个INFP+智性恋+纸性恋的结合体,某种程度上,我...
-
Stable Diffusion如何训练属于自己的Lora模型
Stable Diffusion如何训练属于自己的Lora模型 前面(Stable diffusion的本地部署以及使用)介绍了那么多,相信你一定对Stable Diffusion有了一定的认知,那么你是否也在想:我下载的都是别人训练的模型,那我该怎么...
-
Midjourney提示词-动物系列-14
Anthropomorphic majestic tiger paladin, portrait, finely detailed armor, cinematic lighting, intricate filigree metal design, 8k...
-
Stable Diffusion【基础篇】:提示词引导系数(CFG Scale)
大家好,我是极客菌 CFG(Classifier-Free Guidance) 用于控制Stable Diffusion在采样期间应遵循提示词的严格程度。几乎所有稳定扩散 AI 图像生成器都提供了此参数设置。今天我们重点来看看在Stable Diffus...
-
AIGC助力ResNet分类任务:跃升10个百分点
目录 AIGC?缓解数据稀缺问题❓ 论文研究的动机✏️ 作者是怎么做的❓ 实验配置? 实验结果? 结论✅ 实践? 要增强的裂缝图片 按照论文中的参数在stable-diffusionv1-5上进行textual inversion微调...
-
stable diffusion文生图代码解读
使用diffusers运行stable diffusion,文生图过程代码解读。 只按照下面这种最简单的运行代码,省略了一些参数的处理步骤。 from diffusers import DiffusionPipeline pipeline = Diffu...
-
Stable Diffusion 本地训练端口与云端训练端口冲突解决办法
方法之一,修改本地训练所用的端口 1 首先,进入脚本训练器的根目录 例如:C:\MarkDeng\lora-scripts-v1.7.3 找到gui.py 2 修改端口号 因为云端...
-
天才程序员周弈帆 | Stable Diffusion 解读(三):原版实现源码解读(篇幅略长,建议收藏!)
本文来源公众号“天才程序员周弈帆”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 解读(三):原版实现源码解读 天才程序员周弈帆 | Stable Diffusion 解读(一):回顾早期工作-CSDN博客 天才程序...
-
GPT-4o mini实力霸榜,限时2个月微调不花钱,每天200万训练token免费薅
Llama3.1405B巨兽开源的同时,OpenAI又抢了一波风头。从现在起,每天200万训练token免费微调模型,截止到9月23日。 Llama3.1开源的同一天,OpenAI也open了一回。 收到邮件的开发者们激动地奔走相告,这么大的羊毛一定...
-
【AI绘画教程】Stable Diffusion 1.5 vs 2
在本文中,我们将总结稳定扩散 1 与稳定扩散 2 辩论中的所有要点。我们将在第一部分中查看这些差异存在的实际原因,但如果您想直接了解实际差异,您可以跳下否定提示部分。让我们开始吧! Stable Diffusion 2.1 发布与1.5相比,2.1旨...
-
Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization
香港理工大学&bytedance&alibaba https://github.com/yangxy/PASD/ https://arxiv.org/pdf/2308.14469 问题引入 当前的基于SD的方法缺乏对图片结构的保持,所以本...
-
LoRA6~Stable Diffusion
这里说LoRA 在 Stable Diffusion 中的三种应用 LoRA 是当今深度学习领域中常见的技术。对于 SD,LoRA 则是能够编辑单幅图片、调整整体画风,或者是通过修改训练目标来实现更强大的功能。LoRA 的原理非常简单,它其实就是用两个参...
-
【三维AIGC】扩散模型LDM辅助3D Gaussian重建三维场景
标题:《Sampling 3D Gaussian Scenes in Seconds with Latent Diffusion Models》 来源:Glasgow大学;爱丁堡大学 连接:https://arxiv.org/abs/2406.13099...
-
python系列&deep_study系列:实战whisper第三天:fast whisper 语音识别服务器部署,可远程访问,可商业化部署(全部代码和详细部署步骤)
实战whisper第三天:fast whisper 语音识别服务器部署,可远程访问,可商业化部署(全部代码和详细部署步骤) 实战whisper第三天:fast whisper 语音识别服务器部署,可远程访问,可商业化部署(全部代码和详细部署步骤...
-
Stable Diffusion中放大图像的3种方法
前言 要执行 ControlNet tile upscale: 您想使用 Stable Diffusion 创建包含大量细节的大型图像吗?您将需要使用升频器。在本文中,您将学习 3 种放大图像的方法。 人工智能升级器 标清高档 Cont...
-
深度搜索 copilot 插件
The Deep Search Copilot plugin is a significant enhancement for Microsoft's AI-powered Copilot, aimed at improving search functi...
-
Classifier-Free Guidance (CFG) Scale in Stable Diffusion
1.Classifier-Free Guidance Scale in Stable Diffusion 笔记来源: 1.How does Stable Diffusion work? 2.Classifier-Free Diffusion Guida...
-
llama_readme
language: en pipeline_tag: text-generation tags: facebook meta pytorch llama llama-3 license: other license_name: l...
-
百变背景:万相实验室AIGC电商图片可控生成技术
✍? 本文作者:云芑、因尘、岁星、也鹿 1. 背景 随着AI生成内容(AIGC)技术如Diffusion的飞速进展,现如今,大家已能够轻易地使用Stable Diffusion(SD)[1]等文生图的模型或工具,将心中所想仅凭语言描述(...
-
天才程序员周弈帆 | Stable Diffusion 解读(四):Diffusers实现源码解读
本文来源公众号“天才程序员周弈帆”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 解读(四):Diffusers实现源码解读 接上一篇文章[天才程序员周弈帆 | Stable Diffusion 解读(三):原版实现源...
-
AIGC专栏13——ComfyUI 插件编写细节解析-以EasyAnimateV3为例
AIGC专栏13——ComfyUI 插件编写细节解析-以EasyAnimateV3为例 学习前言 什么是ComfyUI 相关地址汇总 ComfyUI EasyAnimateV3 节点例子 复杂例子-以EasyAnimateV3为例 节点文...