-
你想要的照片,AI都能帮你画出来:记录Stable Diffusion的力量
目录 前言 一、配置软件环境(可以跳过直接看第二部分效果图) 1.启动界面 二、解锁新功能 2.1 开源模型的获取 三、如何生成细节更加可控的内容呢? 3.1 充分利用prompt: 3.2 词不达意时,充分使用lora 3.2 使用多个lo...
-
AIGC——ComfyUI工作流搭建、导入与常用工作流下载
工作流 ComfyUI工作流是一个基于图形节点编辑器的工作流程,通过拖拽各种节点到画布上,连接节点之间的关系,构建从加载模型到生成图像的流程。每个节点代表一个与Stable Diffusion相关的模型或功能,节点之间通过连线传递图片信息。工作流程始于...
-
Stable Diffusion介绍
Stable Diffusion是一种前沿的开源深度学习模型框架,专门设计用于从文本描述生成高质量的图像。这种称为文本到图像生成的技术,利用了大规模变换器(transformers)和生成对抗网络(GANs)的力量,以创建与给定文本提示相一致的图像。...
-
Stable Diffusion【ControlNet】:ControlNet的IP-Adapter预处理器:SD垫图实现
大家好,今天我们来详细介绍一下ControlNet的预处理器IP-Adapter。简单来说它就是一个垫图的功能,我们在ControlNet插件上传一张图片,然后经过这个预处理器,我们的图片就会在这张上传的图片的基础上进行生成。该预处理器提供的垫图功能,让S...
-
AI绘画Stable Diffusion【Forge】:速度更快更好用的新Web UI工具Forge
大家好,我是程序员晓晓。 Stable Diffusion WebUI Forge 是一个基于 Stable Diffusion WebUI的平台,相当于是一个升级版本。“Forge”这个名字的灵感来自于“Minecraft Forge”。其旨在成为 S...
-
CVPR 2024 | 风格迁移和人像生成汇总!扩散模型diffusion用于经典AIGC方向
风格迁移 1、DEADiff: An Efficient Stylization Diffusion Model with Disentangled Representations 基于文本到图像扩散模型在迁移参考风格方面具有巨大潜力。然而,...
-
AI绘画入门指南:完备的AI绘画学习路线,十分钟把你领进门
2024新风口大揭秘!不是直播,也不是短视频,而是AI+绘本! 有一句话说得好:站在风口上,猪都能飞起来!想要用AI拿到大结果,一定要选对大的垂类赛道。 那么,为什么是AI+绘本呢? 我国的绘本市场规模在300-500亿之间,还有巨大的增长空间哦!...
-
AI绘画Stable diffusion 4.7最新版终于来了!一键安装,本地部署!
如果这个世界有上帝,那么他一定是程序员。 国内SD绘画启动器第一人是我认为是B站的秋葉aaaki 因为制作了这款Stable Diffusion启动器,降低了国内使用SD的门槛,秋叶被粉丝戏称赛博菩萨。 1、背景信息 ▍Stable Di...
-
AI绘图:Controlnet在ComfyUI中的使用教程:提升Stable Diffusion可控性
前言 Controlnet是Stable Diffusion中一个至关重要的功能,它极大地增强了图像生成的可控性。通过引入额外的条件,Controlnet使我们能够更精确地控制生成的图像内容。本教程将详细介绍如何在ComfyUI中使用Controlnet...
-
全网最全stable diffusion webui API调用示例,包含controlneth和segment anything的API(附json示例)
全网最全stable diffusion webui API调用示例,包含controlneth和segment anything的API(附json示例) 交流群 100419879 欢迎合作?? V : 864399407 GitHub:https...
-
运行stable-diffusion出现的问题
1、运行txt2img.py出现huggingface下载safety-cheaker问题 问题:OSError: We couldn't connect to 'https://huggingface.co' to load this model, c...
-
51-37 由浅入深理解 Stable Diffusion 3
2024年3月5日,Stability AI公开Stable Diffusion 3论文,Scaling Rectified Flow Transformers for High-Resolution Image Synthesis。公司像往常一样承诺后续...
-
真人版“奇迹暖暖”?谷歌阿里竞相布局的AI试衣有何商机?
618开始了,你可能加购了很多夏季新衣,想趁优惠激情下单,但一想到每件都要试穿,不合适的还要退货邮寄,其繁琐程度又让你望而却步。 “要是有人能帮我试穿衣服就好了。” 基于这样的消费心声,多款AI虚拟试衣产品相继上线。 据“头号AI玩家”不完全统计,目前AI...
-
Stable-Diffusion 报错: no attribute ‘lowvram‘ 或not implemented for ‘Half‘
AttributeError: ‘NoneType‘ object has no attribute ‘lowvram‘; RuntimeError: “addmm_impl_cpu_” not implemented for ‘Half’ 进入stabl...
-
stable-diffusion-webui报OSError: Can‘t load tokenizer for ‘openai/clip-vit-large-patch14‘的正确解决方法
这个是个普遍问题,例如:Windows平台安装stable-diffusion-webui-1.7.0解决少工具包clip-vit-large-patch14 - 知乎 Stable Diffusion WebUI linux部署问题_oserror:...
-
[stable diffusion] 错误:RuntimeError: Found no NVIDIA driver on your system. Please check that ...
错误:RuntimeError: Found no NVIDIA driver on your system. Please check that you have an NVIDIA GPU and 因为我电脑没有英伟达显卡所以遇到这个错误,可以改用...
-
一篇文章详细介绍Stable Diffusion模型原理及实现过程(附常用模型网站、下载方式)
目录 前言 何为Stable Diffusion模型? Stable Diffusion工作原理: Stable Diffusion模型的应用场景 Stable Diffusion免费使用网站 stability.ai: 本地部...
-
Stable Diffusion Windows本地部署超详细教程(手动+自动+整合包三种方式)
一、 Stable Diffusion简介 2022年作为AIGC(Artificial Intelligence Generated Content)时代的元年,各个领域的AIGC技术都有一个迅猛的发展,给工业界、学术界、投资界甚至竞赛...
-
世界模型也扩散!训练出的智能体竟然不错
世界模型提供了一种以安全且样本高效的方式训练强化学习智能体的方法。近期,世界模型主要对离散潜在变量序列进行操作来模拟环境动态。 然而,这种压缩为紧凑离散表征的方式可能会忽略对强化学习很重要的视觉细节。另一方面,扩散模型已成为图像生成的主要方法,对离散潜在...
-
Stable Diffusion AI绘画
我们今天来了解一下最近很火的SD模型 ✨在人工智能领域,生成模型一直是研究的热点之一。随着深度学习技术的飞速发展,一种名为Stable Diffusion的新型生成模型引起了广泛关注。Stable Diffusion是一种基于概率的生成模型,它可以学...
-
Stable Diffusion教程:LoRA模型
LoRA模型是一种微调模型,它不能独立生成图片,常常用作大模型的补充,用来生成某种特定主体或者风格的图片。 下载模型 在模型下载网站,如果模型是LoRA模型,网站会特别标识出来。以 liblib.ai为例: 模型左上角会有一个模型类型的标记,CHE...
-
Ai绘画|如何安装使用秋叶comfyui整合包,手把手详细教程
B 站的秋叶大佬在 1 月份就已经发布了 comfy ui 的整合包。用户将压缩包下载后,能够一键启动 comfy ui。其便利性与之前的 webui 整合包如出一辙。然而在整合包下载完成后,新手或许会遭遇插件以及模型缺失的情况,同时也不清楚该如何运行工作...
-
AIGC-controlnet代码详细解读
hugging face 社区diffusers官方代码:stable_diffusion/controlnetcontrolnet.ipynb 原始代码的解读可以看看这个博主的:万字长文解读Stable Diffusion的核心插件—ControlNet...
-
Stable Diffusion最美亚洲女性真人大模型之一【XXMix_9realistic】已升级SDXL版~
大家好,我是程序员晓晓 如果你用过XXMix_9realistic4.0的模型你就会觉得他确实是个不错的大模型,虽然是基于SD1.5的,但效果很不错。 进入SDXL时代,经过作者不断地迭代更新,也已经正式向大家推出了SDXL版本。 XMix_9r...
-
我奶都能看懂的Controlnet简明教程(AI绘画Stable Diffusion最强插件)
大家好,我是程序员晓晓 Ai绘画目前可控性不强是一个共识,绝大部分工具甚至连人物姿势都无法控制,所以每次绘画都是一次开盲盒过程,在这种情况下,很难应用到实际工作中去,很多时候几乎就是一个玩具。 Controlnet的出现,改变了这种局面。它是Stabl...
-
我们该如何看待AIGC(人工智能)
目录 AIGC的概述: AIGC的发展经历: AIGC的发展带来的机遇: 我们该如何去看待AIGC: AIGC的概述: @[TOC]( ?文章目录 ---AIGC全称为AI-Generated Content,指基于生成对抗网...
-
掌阅科技携手亚马逊云科技,以生成式 AI 之力重塑阅读体验
在数字化时代,尽管信息获取变得轻而易举,但读者在享受阅读的过程中仍面临着诸多挑战。从挑选书籍的迷茫,到阅读过程中的注意力分散,再到阅读后的知识吸收与整理,构成了读者体验中的一道道难关。 作为深耕数字阅读领域的领军企业,掌阅科技深刻洞察用户在阅读方面的不同...
-
FBI指控一美国男子使用AI工具生成了13000张儿童性虐待图片
美国联邦调查局(FBI)指控一名美国男子制作了10,000多张儿童色情和虐待图像,据称他使用流行的人工智能工具生成了这些图像。当局还指控这名42岁的男子史蒂文·安德雷格(Steven Anderegg 在Instagram上向一名15岁的男孩发送色情的人工...
-
AI初创公司CEO下场做网红,创立5个月,吸引用户超70万
创立仅5个月,吸引注册用户超70万。 那个制造了AI产品快速盈利神话的、两人公司Magnific AI最近被收购了。 Magnific AI(以下简称Magnific)是一家西班牙人工智能初创公司,由Javi Lopez担任CEO、Emilio Nico...
-
AI日报:骨折价!通义千问模型费用下降97%;豆包大模型也拼性价比;从零复现Llama3代码库爆火;智谱开源大模型CogVLM2
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、阿里云宣布GPT-4级主力模型...
-
AI 框架Ambient Diffusion:从图像中获取灵感,而非复制
强大的人工智能模型有时会出现错误,包括虚构错误信息或将他人作品作为自己的。为了解决后者的问题,德克萨斯大学奥斯汀分校的研究团队开发了一种名为 "Ambient Diffusion" 的框架。该框架通过对无法辨认的图像数据进行训练,绕过了 AI 模型复制他人...
-
微软重新定义AI PC:与GPT-4o共享屏幕,看过的一切再也不会忘
今天,微软重新定义了个人电脑。 刚刚发布新一代Copilot+PC,让上市还没几天的第一批AI PC直接过时了。 在新一代PC里,打游戏时可与AI实时对话,提供吐槽陪玩或攻略指导,由GPT-4o提供支持。 任何文件或网页浏览记录都可以用自然语言搜索,轻...
-
开源模型穷途末路?Stability AI欠下1亿美元,四处找钱
曾经创造出Stable Diffusion系列模型的Stability AI,目前面临前所未有的财务危机。 这个曾经有10亿美元估值,却只有180名员工的明星初创公司正在考虑出售,并积极与潜在买家接触。 有知情人士表示,Stability AI曾私下联系...
-
Stability AI与Facebook前总裁等投资人进行筹款谈判
一位直接参与交易谈判的人士透露,包括 Facebook 前总裁 Sean Parker 在内的一组投资者正与 Stability AI 进行筹款谈判。Stability AI 是一家开发基于开源图像生成器 Stable Diffusion 的产品的初创公司...
-
腾讯混元将发布大模型C端App腾讯元宝:超万亿参数规模
在腾讯云生成式AI产业应用峰会上,腾讯表示,将于5月30日正式发布面向C端的全新App——“腾讯元宝”。这款应用的背后,是腾讯全链路自研的通用大语言模型——混元大模型,它以其超过万亿的参数规模,展现了卓越的中文理解与创作能力、逻辑推理能力以及可靠的任务执行...
-
报道称:Stability AI 面临资金危机,考虑出售
根据知情人士透露,作为投资者追捧未经验证的人工智能初创公司的典型代表,Stability AI 最近几周已与至少一家潜在买家讨论出售事宜,因为该公司面临资金危机。 这家成立四年的初创公司从包括 Coatue Management 和 Lightspeed...
-
英国AI初创公司Stability AI或将面临出售
根国外报道,英国AI初创公司Stability AI最近几周至少与一位潜在买家就出售问题进行了讨论。 据悉,该公司在 2024 年第一季度的营收不到 500 万美元,但却亏损超过 3000 万美元。更令人担忧的是,Stability AI目前拖欠云计...
-
首个中文原生DiT架构!腾讯混元文生图大模型全面开源,免费商用
中文 AI 社区迎来了一个好消息:与 Sora 同架构的开源文生图大模型来了! 5 月 14 日,腾讯宣布旗下混元文生图大模型全面升级并全面开源,目前已在 Hugging Face 平台及 GitHub 上发布,包含模型权重、推理代码、模型算法等完整模型...
-
为什么腾讯认为DiT架构是未来的主流?做了哪些改进?
OpenAI迭代ChatGPT的过程,发现随着参数量的提升,基于Transformer 架构的大语言模型出现了涌现现象。因此,在文生图领域,很可能参数量更大的模型,也会更“聪明”。 而此前文生图领域大火的Unet 模型容易陷入性能瓶颈与可扩展性的问题,且...
-
腾讯宣布混元文生图大模型开源: Sora 同架构,可免费商用
5月14日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。 这是业内首个中文原生的 DiT 架构文生图开源模型...
-
重磅!腾讯宣布混元文生图大模型开源: Sora 同架构,中英文原生DiT,可免费商用
5月14日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。 这是业内首个中文原生的DiT架构文生图开源模型,支...
-
扩散模型与文生视频
一、快速发展的文生视频 在当前的人工智能领域,文生视频技术有着引人注目的进展。该技术的核心任务非常明确,就是利用文本指令来控制视频内容的生成。具体而言,用户可以输入特定文本,系统则根据这段文本生成相应的视觉画面。这一过程并不局限于单一的输出,相同的文本可...
-
AlphaFold 3一夜预测地球所有生物分子,谷歌DeepMind颠覆生物学登Nature头版!
时隔3年,AlphaFold 3横空出世,再次掀起AI学术圈巨震! 初代AlphaFold诞生之后,一直停留在预测「蛋白质」的宇宙中。 今天,升级后的AlphaFold 3能够以前所未有的「原子精度」,预测出所有生物分子的结构和相互作用。 图片 最重要的...
-
综述170篇「自监督学习」推荐算法,港大发布SSL4Rec:代码、资料库全面开源!
推荐系统对于应对信息过载挑战至关重要,它们根据用户的个人偏好提供定制化推荐。近年来深度学习技术极大地推动了推荐系统的发展,提升了对用户行为和偏好的洞察力。 然而,由于数据稀疏性的问题,传统的监督学习方法在实际应用中面临挑战,这限制了它们有效学习用户表示的...
-
AI日报:白菜价!DeepSeek发布V2模型;零一万物发布最懂打工人的AI特助;ChatGPT.COM域名启用;全国首例“AI外挂”案公开宣判
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、DeepSeek发布V2模型...
-
Logo Diffusion:用AI几秒钟就能快速生成4个logo
Logo Diffusion是一个创新的AI平台,旨在彻底改变Logo设计的过程。它利用人工智能技术,使得任何人在几秒钟内就能轻松创建出独特且定制化的Logo标志。 官网地址:https://top.aibase.com/tool/logo-diffus...
-
AI日报:Remini“黏土AI”攻占小红书;HeyGen推自动剪辑工具;多图漫画工具StoryDiffusion来了;AI音乐Udio可生成15分钟音频
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、这个五一假期,小红书被Remi...
-
看透物体的3D表示和生成模型:NUS团队提出X-Ray
项目主页:https://tau-yihouxiang.github.io/projects/X-Ray/X-Ray.html 论文地址:https://arxiv.org/abs/2404.14329 代码地址:https://github.com...
-
强大到不敢给普通人用!史诗级大模型 Sora 如何让众行业一夜变天?
1视频生成模型“新王登基”,Sora 何以成为全球焦点? 2023年以来,多模态视频生成技术取得了显著的进展和突破,从 Runway 到 Pika 再到年末的 VideoPoet,视频生成模型进入到加速阶段。2024年2月,OpenAI 旗下视频生成模型...
-
AI技术再现经典,1950年代真人版马里奥电影在美版“知乎”爆火
近日,一个以1950年代为背景的真人版马里奥电影在Reddit上引发了广泛关注。这部由AI生成的电影,改编自Switch红白机时代最经典的游戏之一——马里奥,自从游戏问世以来就吸引了无数粉丝,并衍生出多种类型的相关作品。 该真人版马里奥电影凭借其创意和A...