-
【AI绘画】comfyUI抠图工作流,用免费打败收费,实现素材自由
大家好,我是爱绘画的彤姐。 近段时间AI非常的火。目前有很多软件已经拥抱了AI,加入了AI的一些功能。像AI绘画的功能,基本上是每个大厂的软件产品都会配备。但是呢,这些功能都是要付费的。而且是按月收费或者是按年收费。整体算下来十分的不划算。所以我尝试用s...
-
Stable Diffusion 使用详解(12)--- 设计师风格变换
目录 背景 seg模型(语义分割) 描述 原理 实战-装修风格变换 现代风格 欧式风格转换 提示词及相关参数设置 模型选择 seg cn 加持 效果 还能做点啥 问题 解决方法 出图效果 二次优化调整 二次出图效果 地...
-
【AI绘画】Stable Diffusion进阶 | 室内设计神器:ControlNet MLSD/Seg 实现令人惊叹的视觉转换
大家好,我是写编程的木木。 你是否已经厌倦了传统的室内设计方式,想探索新方法来增强作品设计感?本期小编就同大家分享一个新武器,用Stable Diffusion的ControlNet来打造一个室内设计全新工作流。无论你是经验丰富的室内设计师还是初学小白,...
-
Mac 部署Stable Diffusion WebUI和ControlNet的保姆级教程(附安装包)
Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述生成详细图像,它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词(英语)指导下产生图生图的翻译。详细介绍看维基百科词条Stable Diffusi...
-
Stable Diffusion学习指南【ControlNet下篇】- 超全面控图类型&模型拆解
(注:文末扫码获取AI工具安装包和AI学习资料) 以下是正文部分 在上一篇里我已经为大家介绍了关于ControlNet的基本功能、安装和使用技巧,相信大家对这款神级插件已经有了基本认识,今天我会为大家更详细的介绍14种官方控图模型的差异和使用技巧,以及...
-
江大白 | 视觉Transformer与Mamba的创新改进,完美融合(附论文及源码)
本文来源公众号“江大白”,仅用于学术分享,侵权删,干货满满。 原文链接:视觉Transformer与Mamba的创新改进,完美融合(附论文及源码) 以下文章来源于微信公众号:AI视界引擎 作者:AI引擎 链接:https://mp.weixin.q...
-
神奇的交融竟意外的好用!在PS中玩转Stable Diffusion的插件!
前言 用过PS的各位AI大师们,是否曾闻及并涉足SD(Stable Diffusion)领域?这两款软件各自独立而庞大,在今年AI浪潮的冲刷下,似乎难以忽视SD这款强大而高度可控的AI软件。 一、插件介绍 在设计师的创作中,PS几乎是不可或缺的工具...
-
Stable Diffusion系列课程二:ControlNet
AUTOMATIC1111/stable-diffusion-webui 参考B站Nenly视频《零基础学会Stable Diffusion》、视频课件 推荐网站:stable-diffusion-art、Civitai(魔法) 、libilibi、AI...
-
WD1.4标签器:Stable Diffusion的提示词反推神器
引言 在AI绘画领域,Stable Diffusion(SD)因其强大的生成能力而备受关注。然而,如何精准地控制和优化生成效果,常常是许多用户面临的问题。今天,我们将详细介绍一款实用的插件——WD1.4标签器,它可以帮助我们反推出图片背后的提示词,从而...
-
【Stable Diffusion】AI商业换装如此简单,Segment Anything保姆级教学
大家好,我是程序员晓晓 在SD里面画蒙版难吗?难,可太难了。画面那么小,画笔只能用鼠标涂,工具很少,还时灵时不灵的,想要精确绘制几乎是不可能完成的任务。 在PS里面画蒙版难吗?简单,可太简单了。要快速的,可以用自动选择主题的工具;要精确的,可以用钢笔慢...
-
Diffusion【1】:SDSeg——基于Stable Diffusion的单步扩散分割!
文章目录 前言 Abstract Introduction Methods Latent Estimation Concatenate Latent Fusion Trainable Vision Encoder Experiment D...
-
AI绘画的救星!手把手教你在ComfyUI玩转局部重绘!
我们在用AI创作图片的时候,通过模型和提示词,让AI有了很大的随意发挥空间,这种随意发挥带来了很多随机性和不确定性,大部分情况下会给我们带来更多的惊喜。但是总会有一些时候,有一些小细节不尽人意 这个时候,我们就需要一个很普通,却很重要的功能——局部重绘...
-
AI绘画Stable Diffusion 生成智能家电产品效果图,我给AI的 vs AI给我的,AI电商进阶教程!
大家好,我是程序员晓晓 今天给大家分享一下如何用AI绘画制作电商产品海报图,全程干货诚意满满,赶快学起来吧! 图文教程 首先,我们使用的是AI绘画工具 Stable Diffusion(如需要SD的安装包可看我往期入门教程AI绘画专题—Sta...
-
用 stable diffusion 做图文女装号,开启你的带货之旅!!
对于很多入门级的新人来说,很想做副业,但是会遇见各种各样的问题,比如不会写文案,不会拍摄视频,不会剪辑视频,不会二次创作,导致没有原创的作品,直接搬运没有流量等,基于这些原因,很多人都只是观望,过段时间后又该干啥干啥了。 图文带货目前在各大平台都很火,不...
-
如何在PS里使用stable diffusion插件?
各位设计界的领军人物们,你们一定对PS(也就是大家熟知的Photoshop)不陌生吧。同样,对于AI领域的精英们,SD(stablediffusion)这款软件也应该是如雷贯耳。这两款软件,各自独立且功能强大,都是设计领域不可或缺的工具。 特别是在今年A...
-
使用Stable Diffusion进行AI模特快速换装教程
看了下,效果还是可以的。 教程 1.安装 Inpaint Anything 图像检测分割插件 https://github.com/Uminosachi/sd-webui-inpaint-anything 2. 下载 Inpaint A...
-
硬核解读KubeEdge基于大模型边云协同的机器人语义分割算法
本文分享自华为云社区《KubeEdge:基于大模型边云协同的机器人语义分割算法》,作者:云容器大未来。 近年来快速发展的视觉大模型(例如 SAM 在促进高精度的智能感知方面具有很大的潜力。然而,边缘环境中的资源限制往往会限制这种视觉大模型在本地部署,从...
-
从零开始学AI绘画,万字Stable Diffusion终极教程(五)
【第5期】ControlNet 欢迎来到SD的终极教程,这是我们的第五节课 这套课程分为六节课,会系统性的介绍sd的全部功能,让你打下坚实牢靠的基础 1.SD入门 2.关键词 3.Lora模型 4.图生图 5.controlnet 6.知识...
-
AI绘画专栏之Stablediffusion webui Controlnet SDXL 插件之segment-anything(40)
1.是什么 分割任何物体模型,还记得语义分割和镜头风格词库,这个原理就是根据语义分割做的词库 ## [2024最全大厂面试题无需C币点我下载或者在网页打开全套面试题已打包](https://pan.quark.cn/s/865a0bbd5...
-
Stable Diffusion教程|一篇讲透Controlnet实用高阶组合用法
本文将教会你,如何利用多个controlnet组合以及一些最新的SD插件,来精准的控制画面,生成角色三视图、光源和颜色控制、替换背景,控制手脚完美生成等极具实用性的高级技巧,更多内容详见目录。 笔者研究了不同的controlnet组合和参数调整,踩了...
-
CLIP当RNN用入选CVPR:无需训练即可分割无数概念|牛津大学&谷歌研究院
循环调用CLIP,无需额外训练就有效分割无数概念。 包括电影动漫人物,地标,品牌,和普通类别在内的任意短语。 牛津大学与谷歌研究院联合团队的这项新成果,已被CVPR 2024接收,并开源了代码。 团队提出名为CLIP as RNN(简称CaR)的新技...
-
AI绘画-Stable Diffusion 商业设计,小白也可以掌握SD使用
课程下载:https://download.csdn.net/download/m0_66047725/89066313 更多资源下载:关注我。 课程内容: 1 1 AI绘画的原理.mp4 1 2 AI绘画平台介绍与Stable Diffusion...
-
实时局部建图的深入思考 | MapTR继往开来的18篇论文剖析!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 实时局部建图领域自从端到端方案MapTR(2023.1 [1]问世后已经又涌现出非常多优秀的工作,基本是在MapTR基本框架的基础上进行一系列改进,包括原班人马的升级作品MapTRv2(2023.8 ...
-
Hinton奥特曼重磅出席联合国AI大会,代表中国AI登台的竟是一位「癌患者」?
【新智元导读】达摩院医疗AI,又达新里程碑!国际顶刊《自然·医学》直接将其评价为,开启「医疗影像AI的黄金时代」。就在昨天,世卫组织亦宣布与达摩院合作,向发展中国家推广这项来自中国的AI多癌早筛技术。 5月30日,在日内瓦举行的AI for Good全球峰...
-
AI在咳嗽中检出癌症,不信?世卫组织正全球推广
中国的AI技术,登上联合国了! AI for Good峰会是联合国在AI领域的旗舰峰会,今年,联合国秘书长古特雷斯、“深度学习三巨头”之一的Hinton,以及OpenAI CEO奥特曼等都来参会了。 这样一场盛会中,一位中国女性患者吹奏口琴的视频吸引了全...
-
智慧建筑:基于YOLOv7的建筑外墙缺陷检测
01 前景概要 现有的基于深度学习的方法在识别速度和模型复杂性方面面临一些挑战。为了保证建筑外墙缺陷检测的准确性和速度,我们研究了了一种改进的YOLOv7方法BFD-YOLO。首先,将YOLOv7中原有的ELAN模块替换为轻量级的MobileOne模块,...
-
DiffMap:首个利用LDM来增强高精地图构建的网络
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文标题: DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model 论文作者: Peijin Jia, Tuo...
-
我奶都能看懂的Controlnet简明教程(AI绘画Stable Diffusion最强插件)
大家好,我是程序员晓晓 Ai绘画目前可控性不强是一个共识,绝大部分工具甚至连人物姿势都无法控制,所以每次绘画都是一次开盲盒过程,在这种情况下,很难应用到实际工作中去,很多时候几乎就是一个玩具。 Controlnet的出现,改变了这种局面。它是Stabl...
-
简单通用:视觉基础网络最高3倍无损训练加速,清华EfficientTrain++入选TPAMI 2024
本文经计算机视觉研究院公众号授权转载,转载请联系出处。 论文链接:https://arxiv.org/pdf/2405.08768 代码和预训练模型已开源:https://github.com/LeapLabTHU/EfficientTrain 会议...
-
西浦、利物浦大学提出:点云数据增强首个全面综述
本论文的第一作者朱钦峰是西交利物浦大学和利物浦大学联合培养的一年级在读博士,其导师为范磊副教授。他的主要研究方向为语义分割、多模态信息融合、3D视觉、高光谱图像和数据增强。 本文是对发表于模式识别领域顶刊Pattern Recognition 2024的...
-
2024年,端到端自动驾驶在国内是否会有实质性的突破和进展?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 毫不意外,随着Tesla V12在北美大范围推送以及凭借其良好的表现开始获得越来越多用户的认同,端到端自动驾驶也成为了自动驾驶行业里大家最为关注的技术方向。最近有机会和很多行业中的一流工程师,产品经理,...
-
一览Occ与自动驾驶的前世今生!首篇综述全面汇总特征增强/量产部署/高效标注三大主题
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 近年来,自动驾驶因其在减轻驾驶员负担和提高驾驶安全方面的潜力而越来越受到关注。基于视觉的三维占用预测是一种新兴的感知任务,适用于具有成本效益的自动驾驶感知系统,它可以...
-
最新综述!万字长文彻底搞懂单目3D车道线检测
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 3D车道检测在自动驾驶中起着至关重要的作用,通过从三维空间中提取道路的结构和交通信息,协助自动驾驶汽车进行合理、安全和舒适的路径规划和运动控制。考虑到传感器成本和视觉数...
-
超越BEVFusion!DifFUSER:扩散模型杀入自动驾驶多任务(BEV分割+检测双SOTA)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 目前,随着自动驾驶技术的越发成熟以及自动驾驶感知任务需求的日益增多,工业界和学术界非常希望一个理想的感知算法模型,可以同时完成如3D目标检测以及基于BEV空间的语义分...
-
Stable Diffusion 绘画入门教程(webui)-ControlNet(Tile/Blur)
上篇文章介绍了y语义分割Seg,这篇文章介绍下Tile/Blur(增加/减少细节) Tile用于增加图片细节,一般用于高清修复,Blur用于减少图片细节(图片模糊),如下图,用Tile做修复:左边为原图(比较模糊),右边就是高清修复后的图(还是拿之前的小...
-
多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 最近,多模态大模型(LMM)取得了一系列引人注目的成就,特别是在视觉 - 语言任务上的表现令人瞩目。它们的成功不仅展现了多模态大模型在各...
-
“真假难辨”!巧用NeRF生成的自动驾驶仿真数据
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 神经辐射场(NeRF)已成为推进自动驾驶(AD)重新搜索的有前途的工具,提供可扩展的闭环模拟和数据增强功能。然而,为了信任模拟中获得的结果,需要确保AD系统以相同的方式...
-
UniPAD:一种通用的自动驾驶预训练模式
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 UniPAD研究了一个关键问题:如何有效地利用大量未标记的3D点云数据进行自监督学习,以增强其在3D目标检测和语义分割等下游任务中的应用效率。这个问题之所以重要,是...
-
Stable Diffusion——常用插件安装与测试(一)
前言 随着Stable Diffusion不断演进,越来越多的开发者开始涉足插件开发。尽管网络上存在大量教程,但它们通常零散分布,逐个学习和查找非常耗时,使人感觉每天都在劳累思考。这里总结了Stable Diffusion常用的插件安装与测试方法。 感...
-
进一步加速落地:压缩自动驾驶端到端运动规划模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:On the Road to Portability: Compressing End-to-End Motion Planner for Autonomous Driving 论文链接:ht...
-
实时加SOTA一飞冲天!FastOcc:推理更快、部署友好Occ算法来啦!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 在自动驾驶系统当中,感知任务是整个自驾系统中至关重要的组成部分。感知任务的主要目标是使自动驾驶车辆能够理解和感知周围的环境元素,如行驶在路上的车辆、路旁的行人、行驶过...
-
端到端没有数据怎么办?ActiveAD:面向规划的端到端自动驾驶主动学习!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 自动驾驶的端到端可微学习最近已成为一种突出的范式。一个主要瓶颈在于其对高质量标记数据的巨大需求,例如3D框和语义分割,这些数据的手动注释成本是出了名的昂贵。由于AD中样本内的行为往往存在长尾分布这一...
-
1.3ms耗时!清华最新开源移动端神经网络架构 RepViT
论文地址:https://arxiv.org/abs/2307.09283 代码地址:https://github.com/THU-MIG/RepViT 可以看出,RepViT 相比于其它主流的移动端 ViT 架构确实时很优异。接下来让我们来看下本工...
-
华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究
OpenAI又迎来一位AI大将。 最近,华人科学家程博文官宣离职特斯拉,即将加入OpenAI专攻多模态模型的研究。 图片 今天是我在特斯拉自动驾驶部门的最后一天,这一年半的经历真的很棒:有机会与才华横溢的同事们共事,学习了如何开发出色的产品等等。但我向通...
-
“羊驼“入侵CV,美团&浙大沈春华团队将LLaMA向CV扩展,构建全新基础模型VisionLLaMA
本文首发:AIWalker https://arxiv.org/abs/2403.00522 https://github.com/Meituan-AutoML/VisionLLaMA 本文概述 大型语言模型构建在基于Transf...
-
CLRNet:一种用于自动驾驶车道检测的分层细化网络算法
车道是具有高级语义的交通标志,特别是在视觉导航系统中尤其重要。检测车道可以使许多应用受益,例如自动驾驶和高级驾驶员辅助系统(ADAS)中的视觉导航就是一个典型的应用,它可以帮助智能车辆更好地进行自车定位并更安全地行驶。 然而,车道检测拥有特定的局部模式,...
-
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA
半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。 沿袭 ViT 的研究思路,我们能否借助创新性的 LLaMA 架构,真正实现语言和图像的架构统一? 在这一命题上,最近的一项研究 Visi...
-
VPR 2024 满分论文!Meta提出EfficientSAM:快速分割一切!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 EfficientSAM 这篇工作以5/5/5满分收录于CVPR 2024!作者在某社交媒体上分享了该结果,如下图所示: LeCun 图灵奖得主也强烈推荐了该工作! 在最近的一项研究中,Meta...
-
解锁SLAM新纪元!基于NeRF和3D GS方法综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 在过去的二十年里,SLAM领域的研究经历了重大的发展,突出了其在实现未知环境的自主探索方面的关键作用。这种演变从手工制作的方法到深度学习时代,再到最近专注于神经辐射场...
-
OccNeRF:完全无需激光雷达数据监督
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人总结 近年来,3D 占据预测(3D Occupancy Prediction)任务因其独特的优势获得了学界及业界的广泛关注。3D 占据预测通过重建周围环境的 3D 结构为自...