-
全球下载量最大的AI绘画大模型,更新Lightning极速版
几个月前,Stable Diffusion的大模型连续推出了两中提速技术,一个是官方的Turbo,一个是清华团队的LCM。 都能在5-8步实现出图效果,把出图时间缩短了5-10倍。 但是,除了Dreamshaper等少数几个大模型坚决跟进外,大部分大模...
-
【AI绘画】没有大显存?新人上手SD1.5模型推荐
SDXL有千般好,但是大显存却绕不开。更何况很多优秀的模型目前只有SD1.5版本的,今天就来介绍一些不同领域内好用的代表性的SD1.5模型,足够新人探索一段时间喽。(相关模型去C站搜标题找或者直接文末扫马领取 目录 好看到不真实的写实风:maj...
-
开源文生图大模型Playground v2.5发布:超越SD、DALL·E 3和 Midjourney
前言 在AI技术迅速发展的今天,文生图模型成为了艺术创作、设计创新等领域的重要工具。Playground v2.5的发布,不仅在技术上取得了突破,更在开源文化的推广与实践上迈出了重要一步。 Huggingface模型下载:https://huggi...
-
离职谷歌的Transformer作者创业,连发3个模型(附技术报告)
去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。其中,Llion Jones 是谷歌 2017 年经典研究论文《Attention is all you n...
-
图像生成地表最强!Playground v2.5技术报告解读重磅来袭!超越SD、DALL·E 3和 Midjourney
文章链接:https://arxiv.org/pdf/2402.17245 模型地址: https://huggingface.co/playgroundai/playground-v2.5-1024px-aesthetic 本文分享了在文本到图像生成模...
-
stable diffusion webui升级bug问题解决思路(纯干货)
个人网站:https://tianfeng.space/ 文章目录 一、前言 二、个人方案 1.扼杀在萌芽中 A.解压后点击启动器运行依赖,然后点击A启动器 B.更新本体和扩展(全部到最新版本) C.把controlnet1.1放入sta...
-
stable diffusion模型微调方法
文章目录 embeddings 准备训练集 图片预处理 裁剪 打标签 点击生成运行程序 调节训练参数 训练嵌入式模型 使用微调模型进行生成 LoRA Kohya GUI 准备工作 收集训练集 图片预处理 设置训练参数 Dream...
-
AI绘画工具Fooocus最新加强版V2来袭!支持图生图、controlnet,4G显卡也能畅玩SDXL
之前给大家介绍过一款Stable diffusion的衍生软件——fooocus。它采用了与webUI和comfyUI完全不同的操作模式,使用起来有点像midjourney,只需要填写提示词就能得到相应的图像,非常便捷。而且它对硬件的要求不高,基本上4G的...
-
游戏NPC“活”了,英伟达AI立大功
智能NPC,已经承担起推动游戏主线的任务了! 育碧的一个DEMO中,两名个性鲜明的智能NPC带着玩家,在游戏世界中畅游了十五分钟。 不仅对话过程流畅、表情动作自然,而且还最新支持了多轮对话。 最关键的是,与NPC的对话不再只是闲聊,而是时时刻刻在推进主...
-
本地用AIGC生成图像与视频
最近AI界最火的话题,当属Sora了。遗憾的是,Sora目前还没开源或提供模型下载,所以没法在本地跑起来。但是,业界有一些开源的图像与视频生成模型。虽然效果上还没那么惊艳,但还是值得我们体验与学习下的。 Stable Diffusion(SD)是比较流行...
-
一个开源免费的实时AI绘画软件Krita
Krita是由Krita插件+ComfyUI+LCM插件结合的一个实时可预览的AI绘画工具,是一款自由开源、免费的专业级绘画软件,Krita采用的是GNU GPL许可证确保它将一直保持自由开源的本色。 一:搭建Krita创作平台 1、Krita客户...
-
端到端大一统前夕?GenAD:LLM和轨迹规划全搞定
今天汽车人和大家分享一篇自动驾驶领域中第一个大规模视频预测模型。为了消除高成本数据收集的限制,并增强模型的泛化能力,从网络获取了大量数据,并将其与多样化和高质量的文本描述配对。由此产生的数据集累积了超过2000小时的驾驶视频,涵盖了世界各地具有多样化天气...
-
在Win11上部署Stable Diffusion WebUI Forge
Stable Diffusion WebUI Forge 是 Stable Diffusion WebUI(基于 Gradio)之上的平台,可简化开发、优化资源管理并加快推理速度。“Forge”这个名字的灵感来自“Minecraft Forge”。这个项目...
-
AI绘画专栏之 提升40% 4步搞定StableCascadeComfyui工作流 不再报错
上一期我们提到了Stability更新的Cascade模型,这个模型在图像质量上对比SDXL提升了40%的性能,现已官方版本支持了Comfyui的工作流,让我们4步搞定它吧 StableCascade 链接:https://pan.quark.cn...
-
今日AI:英伟达再出王炸!推最强AI加速卡GB200+机器人模型GR00T;Magnific AI照片风格化功能上线;免费好用的SDXL动漫模型Animagine XL3.1来了
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 📰🤖📢AI新鲜事 英伟达发布最强...
-
1秒AI出图的时代来了!Stable Diffusion WebUI Forge+SVD整合包
速度快N倍!Stable Diffusion WebUI Forge整合包 要说今年绘画圈最大的新秀 那妥妥的就Stable Diffution 本次更新的 Stable Diffusion WebUI Forge整合包+SVD 比之前推送...
-
Stable Diffusion 3报告
报告链接:https://stability.ai/news/stable-diffusion-3-research-paper 文章目录 要点 表现 架构细节 通过重新加权改善整流流量 Scaling Rectified Flow Tr...
-
新智元 | Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3?
本文来源公众号“新智元”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3? 【新智元导读】Stability AI放出了号称能暴...
-
ComfyUI-SUPIR官网体验入口 图像放大AI处理工具下载地址
ComfyUI-SUPIR是一个为ComfyUI设计的SUPIR图像放大封装器,它使用先进的AI技术来提升图像质量。该工具目前还在开发中,支持从原始链接下载SUPIR模型,并需要SDXL模型。它适用于非商业用途,并且对系统内存有较高要求。 点击前往Com...
-
【Datawhale组队学习:Sora原理与技术实战】AIGC技术基础知识
AIGC是什么 AIGC全称叫做AI generated content,AlGC (Al-Generated Content,人工智能生产内容 ,是利用AlI自动生产内容的生产方式。 在传统的内容创作领域中,PGC(Professionally-g...
-
手把手教你搭建更节省显存的AI绘画工具ComfyUI
前言 相信大家玩 Stable Diffusion(以下简称 SD)都是用的 web UI 操作界面吧,不知道有没有小伙伴听说过**ComfyUI(**最强大、模块化的稳定扩散 GUI 。 // ComfyUI示例 https://comfyanon...
-
stable diffusion 1.5大模型炼制详细教程,几块钱即可炼制大模型
前言 之前已经讲过SDXL_LORA,SD1.5_LORA训练过程,基本说的比较清楚了,有兴趣可以去看看,下面我将讲解一下SD1.5大模型的炼制。 SDXL_LORA:https://tian-feng.blog.csdn.net/article/d...
-
与Sora同架构的Stable Diffusion 3.0 震撼发布
Stability AI 发布了 Stable Diffusion 3,这款图像生成 AI 模型再次刷新了人们的认知。 这款由 Stability AI 倾力打造的文本变图模型,可是迄今为止最强大的“黑科技”!无论你想生成多主题的奇幻场景,还是高精度的风...
-
Stable Diffusion XL on diffusers
Stable Diffusion XL on diffusers 翻译自:https://huggingface.co/docs/diffusers/using-diffusers/sdxl v0.24.0 非逐字翻译 Stable Dif...
-
上热榜了!抖音博主被曝用AI作品欺骗观众;看看Sora炸出来多少好东西;我帮你踩遍了AIGC创业的各种坑;图解 Stable Diffusion | ShowMeAI日报
👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 👀 抖音知名绘画博主被曝作品是AI制作的,然后道歉也是 ChatGPT 生成的? 2月21日,抖音知名绘画博主 @曾bobi 发布了最新作品,是他们几...
-
How does Stable Diffusion work?
Stable Diffusion is a latent diffusion model that generates AI images from text. Instead of operating in the high-dimensional im...
-
Glyph-ByT5:确保AI绘画图片中文字渲染的准确性并自动排版
在当今的数字时代,图像生成任务的重要性日益凸显。然而,一个长期存在的问题是文本渲染的准确性。幸运的是,一个新的文本编码器——Glyph-ByT5,已经将这个问题解决了。 Glyph-ByT5是一个强大的工具,它可以显著提高图像生成中文本渲染的准确性。在实际...
-
Glyph-ByT5官网体验入口 AI文本编码器与图像生成工具在线使用地址
Glyph-ByT5是一种定制的文本编码器,旨在提高文本到图像生成模型中的视觉文本渲染准确性。它通过微调字符感知的ByT5 编码器并使用精心策划的成对字形文本数据集来实现。将Glyph-ByT5 与SDXL集成后,形成了Glyph-SDXL模型,使设计图像...
-
(含代码)利用TensorRT的8位PTQ将Stable Diffusion速度提高 2 倍
利用TensorRT的8位PTQ将Stable Diffusion速度提高 2 倍 在生成人工智能的动态领域中,扩散模型脱颖而出,成为生成带有文本提示的高质量图像的最强大的架构。 像稳定扩散这样的模型已经彻底改变了创意应用。 然而,由于需要迭代去...
-
【深度学习】风格迁移,转换,Stable Diffusion,FreeStyle : Free Lunch for Text-guided Style Transfer using Diffusion
论文:https://arxiv.org/abs/2401.15636 代码:https://github.com/FreeStyleFreeLunch/FreeStyle 介绍 生成扩散模型的快速发展极大地推进了风格迁移领域的发展。然而,大多数当...
-
文生图的最新进展:从一致性模型CMs、LCM、SDXL到Stable Diffusion3、SDXL-Lightning
前言 很明显,OpenAI的首个视频生成模型sora极大程度的提高了大家对文生图、文生视频的热情,也极大的扩展了大家对AIGC的想象力 第一部分(选读 一致性模型Consistency Model 注,本文第一部分最早写在23年11月份的这篇文...
-
Stable Diffusion系列(四):提示词规则与使用
文章目录 基础规则 高级规则 插件使用 基于相机镜头增强提示词 常用提示词总结 奇特提示词珍藏 基础规则 所谓提示词,也就是文生图中的文,由连贯的英语单词或句子组成。其最基础的规则是: 不同提示词之间需要用英文逗号分隔,空格和...
-
Stable Diffusion ———LDM、SD 1.0, 1.5, 2.0、SDXL、SDXL-Turbo等版本之间关系现原理详解
一、简介 2021年5月,OpenAI发表了《扩散模型超越GANs》的文章,标志着扩散模型(Diffusion Models,DM)在图像生成领域开始超越传统的GAN模型,进一步推动了DM的应用。 然而,早期的DM直接作用于像素空间,这意味着要优化一...
-
Stable Diffusion 3 架构细节大揭秘
在众多前沿成果都不再透露技术细节之际,Stable Diffusion 3 论文的发布显得相当珍贵。 Stable Diffusion 3 的论文终于来了! 这个模型于两周前发布,采用了与 Sora 相同的 DiT(Diffusion Transf...
-
Stable Diffusion 插件AnimateDiff
AnimateDiff简介 该插件主要用来制作动图,并不能用来生成比较长的视频,我体验着和pika差不多,效果上照着商用还有不小的距离。在githup的网址中有论文地址和许多示例。 githup:GitHub - guoyww/AnimateDiff:...
-
AI绘画专栏之 终于来了!4步 webui使用Stableforge实现SVD文生视频
以前我们分享的SVD不管是文生视频还是长视频还是图生视频,都是在Comfyui中实现的,但是大多数的用户还是在webui中使用的,那么forge它来了,A111点赞的实现SVD的整合方式。 与原始 WebUI(用于 1024px 的 SDXL 推理)相比...
-
基于 Amazon EKS 的 Stable Diffusion ComfyUI 部署方案
01 背景介绍 Stable Diffusion 作为当下最流行的开源 AI 图像生成模型在游戏行业有着广泛的应用实践,无论是 ToC 面向玩家的游戏社区场景,还是 ToB 面向游戏工作室的美术制作场景,都可以发挥很大的价值,如何更好地...
-
AI绘画再提速-stable diffusion LCM Lora模型简书
这是基于stable diffusion webui (automatic1111项目)中安装LCM 模型的方法,可大幅提升绘图速度。 方法一:SD1.5基础模型,方法比较简单,直接从https://huggingface.co/latent-consi...
-
【复现】FreeU以及结合stable diffusion
code:GitHub - ChenyangSi/FreeU: FreeU: Free Lunch in Diffusion U-Net 目录 代码分析 模型复现 问题 效果 总结 FreeU + Diffusers 才发现Ani...
-
chatglm2-2b+sdxl1.0+langchain打造私有AIGC(六)-完结
一、前言 前面五篇文章已经将整个应用介绍得差不多了,昨天我将应用的已经开源到github,源码下载地址: https://github.com/hubo0417/EasyGC 在此我要说两点 1.开源版本的LLM,是基于ChatGLM2-6B-IN...
-
Stable Diffusion 3论文终于发布,架构细节大揭秘,对复现Sora有帮助?
Stable Diffusion 3 的论文终于来了! 这个模型于两周前发布,采用了与 Sora 相同的 DiT(Diffusion Transformer)架构,一经发布就引起了不小的轰动。 与之前的版本相比,Stable Diffusion 3 生成...
-
【Stable Diffusion初学者指南】如何使用Stable Diffusion
文章目录 什么是Stable Diffusion 如何使用Stable Diffusion Stable Diffusion有什么好处 Stable Diffusion 免费吗 Stable Diffusion能做什么 1. 从文本生成图像...
-
Stable Diffusion 【写实模型】:逼真|肖像|摄影|超现实|建筑|室内设计的写实大模型NightVision XL
大家好,我是程序员晓晓。 今天和大家介绍一款从官网名字介绍就感觉非常NB的大模型NightVision XL。我们看一下C站官网首页该模型的名称介绍。 (1)NightVision XL是一个经过轻微训练的基础 SDXL 模型,然后通过社区 LOR...
-
Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3?
Stability AI在发布了Stable Diffusion 3之后,今天公布了详细的技术报告。 论文深入分析了Stable Diffusion 3的核心技术——改进版的Diffusion模型和一个基于DiT的文生图全新架构! 报告地址: http...
-
一秒出图?SDXL-Turbo实时AI绘画整合包下载
SDXL Turbo是一种快速生成的AI构图模型,它基于一种称为对抗性扩散蒸馏的新训练方法,该方法允许在1到4个步骤中以高图像质量对大规模基础图像扩散模型进行采样,并将其与对抗性损失相结合,以确保即使在一个或两个采样步骤的低阶模式下也能获得高图像保真度...
-
Stable Diffusion的基础内容以及几个电商用法
1.安装 采用的一直是秋叶大佬提供的汉化包,已安装,只需要云盘下载解压就行。 对应的安装视频以下: 【【AI绘画】Stable Diffusion 最终版 无需额外下载安装!可更新✓ 训练✓ 汉化✓ 提供7G模型 NovelAI】 https...
-
ComfyUI-SUPIR官网体验入口 图像放大AI处理软件下载地址
ComfyUI-SUPIR是一个为ComfyUI设计的SUPIR图像放大封装器,它使用先进的AI技术来提升图像质量。该工具目前还在开发中,支持从原始链接下载SUPIR模型,并需要SDXL模型。它适用于非商业用途,并且对系统内存有较高要求。 点击前往Com...
-
Stable diffusion不同模型变量的work pipeline:checkpoint、lora、vae等等到底是怎么work together的?
SD里面有很多不同种类的模型参数,比如embedding、vae、checkpoint、hypernetwork、controlNet、clip还有lora,我看了很多博客,发现它们都是言语寥寥几句说什么改变风格,用于调整和改善生成图片的色彩之类的有点废话...
-
Stable Diffusion 3 Early Preview发布
2月22日,Stability AI 发布了 Stable Diffusion 3 early preview,这是一种开放权重的下一代图像合成模型。据报道,它继承了其前身,生成了详细的多主题图像,并提高了文本生成的质量和准确性。这一简短的公告并未附带公开...
-
1024 分辨率下最快模型,字节跳动文生图开放模型 SDXL-Lightning 发布
模型|https://huggingface.co/ByteDance/SDXL-Lightning 论文|https://arxiv.org/abs/2402.13929 1、闪电般的图片生成 生成式 AI 正凭借其根据文本提示(text prom...