-
大白话讲透AI画图:Stable Diffusion
Stable Diffusion 是一种从文本生成 AI 图像的潜空间扩散模型,它不是在高维图像空间中操作,而是首先将图像压缩到潜在空间(latent space)中。 我们将深入了解它的工作机制。知道工作机制有什么用?除了其本身就是个非常值得了解的内容...
-
Datawhale X 魔搭 AI夏令营---AIGC Task2
目录 Datawhale X 魔搭 AI夏令营第四期-AIGC文生图方向 Task2:精读代码,实战进阶 0.0 一些link 0.1 任务内容 0.2 AI生图 0.3 **Kolors(可图)模型** 1.1 精读baseline——从...
-
Golang httputil 包深度解析:HTTP请求与响应的操控艺术
标题:Golang httputil 包深度解析:HTTP请求与响应的操控艺术 引言 在Go语言的丰富标准库中,net/http/httputil包是一个强大的工具集,它提供了操作HTTP请求和响应的高级功能。从创建自定义的HTTP代理到调试HTT...
-
Datawhale X 魔搭 AI夏令营 AIGC方向 task2笔记
纯小白,自学!从零入门AI生图(AIGC方向)基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展实践学习。#Datawhale X 魔搭 AI夏令营# 一、利用AI精读baseline学习代码 task2的目的是精读bas...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task02笔记
一、探探前沿:了解一下 AI生图技术 的能力&局限 1. 为什么要了解AI生图前沿? AIGC(AI-Generated Content 是通过人工智能技术自动生成内容的生产方式,很早就有专家指出,AIGC将是未来人工智能的重点方向,也将改造相...
-
面完 AIGC 大模型算法岗,心态崩了。。。
大家好,今天我们继续聊聊 AI 科技圈发生的那些事。 内容包括:AI 科技圈最新动态和最新面试题总结。 Meta 推新一代 SAM 2 图像识别再进化!Meta 推新一代SAM 2 官方链接:https://ai.meta.com/blog/se...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 task02笔记
1:精读baseline 这里我使用了ChatGPT 4o对吧baseline文件代码进行了解析(不知道为啥我的通义千问无法使用 。 GPT代码解析结果如下: 1. 环境设置与依赖安装 !pip install simple-aest...
-
哦吼,新模型?文生图领域的新模型FLUX.1(附模型下载网盘地址和详细使用方法)
?背景 Black Forest Labs 是由 Stable Diffusion 原班人马成立的公司,致力于研发优质的多模态模型并开源。该公司由多位前 Stability AI 研究员组成,包括 Robin Rombach 在内的团队成员,他们在图像和...
-
Datawhale AI夏令营第四期 AIGC方向 task02 初学者笔记
一、Prompt工程介绍:1、概念: Prompt工程,也称为提示工程或指令工程,是在自然语言处理(NLP)领域中一种重要的技术和方法。它主要用于指导预训练的大规模语言模型(Large Language Models, LLMs)生成高质量、准确且有针对...
-
Stable Diffusion 模型的安装和使用
一、SD模型简介 Stable Diffusion的绘图风格主要由模型来控制,基础模型主要由二次元图片训练获得,所以在不安装其他模型的情况下,只能生成二次元风格的图像。 模型能够有效地控制生成的画风和内容。 常用的模型网站有: Stable...
-
【论文+中文文生图】Kolors:快手可图绘画模型实测(24.07.06开源)
代码:https://github.com/Kwai-Kolors/Kolors | 权重 论文原文:Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Imag...
-
我果然还是喜欢二次元一些(Stable Diffusion进阶篇:ComfyUI 画风迁移)
现在Stable Diffusion也能做到把一张真人的照片转绘成动漫风格,在保持人物大概形象不变的同时为图片添加合适的背景。 时间仓促(有点糙) WebUI的操作(流程演示) 这种操作在WebUI里面不算难,大概一分多钟就能完成这样的操...
-
ComfyUI系列教程(1)--Stable Diffusion基本原理
1.Stable Diffusion文生图基本原理 1.1Stable Diffusion原理介绍 文生图主要基于Stable Diffusion大模型进行。SD的基本结构图如下图所示,主要包括3个部分。其中1是CLIP图像文本对,将图...
-
llama-factory源码详解——以DPO为例
本文记录了我在学习 llama-factory过程中对代码运行过程的梳理 代码入口——src/train.py from llamafactory.train.tuner import run_exp def main( : run_exp...
-
Datawhale AI夏令营第四期魔搭-AIGC文生图方向 Task01笔记分享
目标:跑通baseline 目录 第一步-搭建代码所需环境 第二步-报名赛事 第三步-在魔塔世界创建免费PAI实例(实例使用完后记得关闭哦 第四步-使用阿里云免费算力 第五步-提交结果 第六步-美学分数 赛事链接:可图Kolors-Lo...
-
FLUX | 超越SD3、媲美Midjourney的顶级AI绘图模型
本文包含大量AI干货 阅读完大约需要8分钟 1.引言 在过去的两年中,第一个公开发布且功能齐全的图像合成模型 Stable Diffusion 完全占据了主导地位,一大批竞争对手(PixArt Alpha/Sigma/AuraFlow)试图效仿S...
-
LLama.cpp轻量化模型部署及量化
模型文件下载 首先说一下用到的模型,这次用的是Llama3-8B-Chinese-Chat-GGUF-8bit模型,想要快速的从huggingface下载模型可以参考我的另一篇博文。 从huggingface更快的下载模型 1.准备模型文件...
-
2024年最新ComfyUI汉化及manager插件安装详解!
前言 在ComfyUI文生图详解中,学习过如果想要安装相应的模型,需要到模型资源网站(抱抱脸、C站、魔塔、哩布等)下载想要的模型,手动安装到ComfyUI安装目录下对应的目录中。 为了简化这个流程,我们需要安装ComfyUI-manager插件,通过这...
-
ComfyUI零基础入门搭建教程
一、介绍 ComfyUI 是一个强大的、模块化的 Stable Diffusion 界面与后端项目。该用户界面允许用户使用基于图形/节点/流程图的界面设计和执行高级稳定的扩散管道。该项目部分其它特点如下: 目前全面支持 SD1.x,SD2.x,SDX...
-
【Qwen-Audio部署实战】Qwen-Audio-Chat模型之对话机器人部署测试
系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat:阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验:用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...
-
【LLaMA-Factory】常见报错信息及解决方法整理
1.‘llamafactory-cli’ 不是内部或外部命令,也不是可运行的程序 或批处理文件。 bash: llamafactory-cli: command not found #3568 解决方法: cd 你路径下的\LLaMA-Factor...
-
ECCV2024|AIGC(图像生成,视频生成,3D生成等)相关论文汇总(附论文链接/开源代码)【持续更新】
ECCV2024|AIGC相关论文汇总(如果觉得有帮助,欢迎点赞和收藏) Awesome-ECCV2024-AIGC 1.图像生成(Image Generation/Image Synthesis Accelerating Diffusio...
-
【Qwen2微调实战】LLaMA-Factory框架对Qwen2-7B模型的微调实践
系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat:阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验:用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...
-
ARR千万美金,找到PMF的toC AI产品又多了一个?
前几天刷小红书,刷到一个帖子讨论有哪些 toC 的 AI 产品跑通了 PMF。验证市场需求,绊倒了不少创业者,而找到 PMF 的产品们,被其他人拿来反复研究。 小红书上讨论已经验证市场需求的面向 C 端用户的AIGC 产品 | 图片来源:小红书用户晓音的...
-
Datawhale X 魔塔 AI夏令营第四期-AIGC文生图方向 Task1笔记
一、文生图背景 文生图(Text-to-Image Generation)是一种通过文本生成图像的技术,其发展历程可以追溯到早期的计算机视觉和自然语言处理研究。文生图的概念最早出现于计算机视觉和图像处理的早期研究中。早期的图像生成技术主要...
-
java集成stable diffusion
在Java中直接集成Stable Diffusion模型(一个用于文本到图像生成的深度学习模型,通常基于PyTorch或TensorFlow 是非常具有挑战性的,因为Java本身并不直接支持深度学习模型的运行。不过,我们可以通过JN...
-
LLM - 使用 HuggingFace + Ollama 部署最新大模型 (GGUF 格式 与 Llama 3.1)
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/141028040 免责声明:本文来源于个人知识与公开资料,仅用于学术交...
-
Stable Diffusion WebUI v1.10.0重大更新,支持SD3!
前言 Hello,大家好!前不久,SDWebUI的作者AUTOMATIC1111终于把它更新到了v1.10.0,这次不仅修复以往的一些BUG,提升了一些性能,这次还支持了SD3_medium.safetensors模型以及SD3_LoRA模型,同时还支...
-
AIGC-ToonCrafter: Generative Cartoon Interpolation-CVPR2024
论文:https://arxiv.org/pdf/2405.17933 代码:https://doubiiu.github.io/projects/ToonCrafter 给定首尾帧,生成逼真生动的动画,动画插值生成 MOTIVATION T...
-
【SD3】发布,送你3个ComfyUI工作流,轻松搞定AI绘画
这几天AI绘画界最轰动的消息莫过于Stable Diffusion 3(简称SD3)的发布。SD3是一个多模态的 Diffusion Transformer 模型,其在图像质量、排版、复杂提示理解和资源效率方面具有显著提升。 废话不多说,先给大家看看我使...
-
Datawhale X 魔搭 AI夏令营-AIGC方向 task01笔记
目录 文生图技术的相关知识储备 SD结构图 种子 提示词 生成过程简单介绍 接下来开始随教程操作 Ⅰ开通阿里云PAI-DSW试用 Ⅱ在魔搭社区进行授权 Ⅲ报名“可图Kolors-LoRA风格故事挑战赛 Ⅳ在魔搭社区创建PAI实例编辑...
-
Datawhale X 魔搭 AI夏令营第四期AIGC文生图方向Task1笔记
目录 前置知识 生成对抗网络(GAN) 大规模预训练模型 LoRA baseline一站式实现过程 下载baseline文件 安装环境,然后重启kernel 调整prompt 总结 前置知识 指导手册里写得很详细,这里写一...
-
LLaMA-Factory 大模型微调超简单,从零开始玩转大模型微调
目录 LLaMA-Factory 大模型微调超简单,从零开始开始玩转大模型微调 为什么要使用LLaMA-Factory进行微调? 如何使用LLaMA-Factory进行微调? 安装 启动 数据准备 Alpaca 格式 指令监督微调数据集...
-
超越sd3!比肩Midjourney-v6?AI绘画大模型FLUX1.0详细评测与本地部署方法(附安装文件)
FLUX.1模型是什么? FLUX模型是一个开源的AI图像生成模型,由黑森林工作室研发。 堪比sd3以及Midjourney-v6 背景/backdrop 黑森林工作室(Black Forest...
-
【愚公系列】《微信小程序开发解析》005-事件
? 作者简介,愚公搬代码 ?《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专...
-
如何使用 Llama 3 构建本地文件生成式搜索引擎(附源码&文档)
系统设计 为了构建一个本地生成式搜索引擎或助手,我们需要几个组建: 包含本地文件内容的索引,具有信息检索引擎,用于检索给定查询/问题的最相关文档。 大语言模型,用于从本地文档中选择内容并生成摘要答案 一个用户界面 这些组件的交互方式如下...
-
ComfyUI基础篇:Stable Diffusion 基础原理详述
前言 个人认为学习 ComfyUI 应该先从理论学起。 与传统绘图工具(如 Photoshop 或 Figma)相比,AI 绘图工具有着显著不同。首先,许多设置和操作在 AI 绘图工具中是非可视化的,这意味着即使你更改了某个配置,界面上也未必会有任何变...
-
FLUX.1 实测,堪比 Midjourney 的开源 AI 绘画模型,无需本地显卡,带你免费实战
要列举 AI 绘画开源界的几个关键贡献,一定少不了 Stable Diffusion。 还记否前不久刚推出的 Stable Diffusion 3? 其背后的团队 Stability AI,真的是一波三折,其核心成员出走,成立了一个新公司:Black...
-
实操: 如何在AirBox上跑Stable Diffusion 3
以下文章来源于Radxa ,作者瑞莎 Stable Diffusion 3 Medium 是一种多模态扩散变换器 (MMDiT 文本到图像模型,在图像质量、排版、复杂提示理解和资源效率方面具有显著提升的性能。 目前瑞莎团队使用 Stab...
-
【震撼来袭】Flux横空出世,吊打Midjourney,重塑AI艺术创作新格局!(附保姆级部署教程)
目录 一、Flux介绍 二、ComfyUI本地电脑部署 2.1、Flux模型下载 2.2、Clip模型下载 2.3、VAE模型 2.4、更新ComfyUI 2.5、导入工作流并进行测试 2.6、云服务部署并体验 一、Flux介绍...
-
【AIGC】ComfyUI入门-安装ComfyUI
栏目: 栏目目录里面会收录我关于AIGC相关的笔记博文,大家如果有什么不懂的可以通过阅读我的笔记进行学习。【AIGC目录】 最近自己在抽时间研究ComfyUI相关的内容,抽时间整理一下自己了解到的内容,希望可以帮到其他想要学习的小伙伴。 安装Co...
-
Linux 常用命令最全总结大全【推荐收藏】
小伙伴们好,欢迎关注,一起学习、无限进步 文章目录 一、文件和命令 1、cd 命令 2、pwd 命令 3、ls 命令 4、cp 命令 5、mv 命令 6、rm 命令 二、查看文件内容 7、cat 命令 三、文件搜索 8、find...
-
LLaMA-Factory微调llama3之模型的合并,并采用llama.cpp量化成ollama支持的gguf格式模型,生成api使用
上期我们已经成功的训练了模型,让llama3中文聊天版知道了自己的名字 这次我们从合并模型开始,然后使用llama.cpp量化成gguf格式,并且调用api (1 前期准备 上期链接: 基于LLaMA-Factory微调llama3成为一个角色扮演...
-
使用Llama-factory微调Llama3教程
一、登录OpenBayes进行注册登录 通过以下链接,新用户注册登录 OpenBayes , 即可获得 四个小时 RTX 4090免费使用时长 !! 注册链接:https://openbayes.com/console/signup?r=zzl99_W...
-
微调stable diffusion
微调stable diffusion 一. 代码参考 不在stable diffusion官方仓库中修改,而是到huggingface 中找到微调的文件微调stable diffusion, 在其上面进行修改, 二. 出现的问题: huggi...
-
怎么使用Stable diffusion中的models
Stable diffusion中的models Stable diffusion model也可以叫做checkpoint model,是预先训练好的Stable diffusion权重,用于生成特定风格的图像。模型生成的图像类型取决于训练图像。...
-
Datawhale X 魔搭 AI夏令营 第四期魔搭-AIGC文生图方向Task1笔记
(赛题链接:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛) (学习链接:从零入门AI生图原理&实践) 速通指南 ...
-
FLUX.1 最强AI绘画开源模型,最新本地部署教程
Stable Diffusion 作者之一 Robin Rombach 官宣创业,成立了新公司「Black Forest Labs」(黑森林实验室),并推出了最新文生图模型「FLUX.1」。Black Forest Labs 在 AI 开发方面拥有丰富的经...
-
基于树莓派的智能家居中控系统:集成Flask、HTML、JavaScript与MQTT协议的文心一言AI接入(代码示例)
一、项目概述 随着智能家居技术的快速发展,越来越多的用户希望通过智能设备提升家居生活的便利性和智能化水平。本项目旨在搭建一个基于树莓派的AI接入文心一言智能家居中控系统。该系统能够根据AI获取的实时数据(如天气、温度、湿度等)自动控制家居设备,并支持用户...
-
【AIGC】文心一言大模型使用教程:从入门到精通
引言 文心一言,作为百度强大的自然语言处理大模型,凭借其深厚的语言理解和生成能力,在文本创作、问答系统、智能客服等多个领域展现出巨大的潜力。本教程旨在帮助初学者及进阶用户全面了解文心一言大模型,掌握其调用方法、使用技巧,并通过实际案例提升使用效率。 一...