AI绘画凉了吗？ - 人工智能

上个月忙别的事情去了，回来后发现自媒体上SD（Stable Diffusion）和MJ（Mid Journey）相关的创作和讨论明显少了很多，而且似乎都还是那老一套东西；然后又看到说是妙鸭这类APP的数据也是掉头向下。

不禁怀疑现在AI绘画是不是凉了？为什么？

原本是个绘画爱好者，对ai的话题接触挺多的，本着求真的理念，再加上最近ai绘画领域的发展确实突飞猛进，在今年4月左右，我开始通过自学了解ai。

因为想要实现对画面细节的调整，单纯的提示词出图满足不了我，想要使用功能强大一些的软件，所以我选择了大名鼎鼎的stable diffusion，通过在外网查询资料（国内靠谱教程太少了），我先后学习了webui以及新火起来的comfyuia。

先说结论，我发现stable diffusion确实有很多地方挺方便的，能够一定程度的运用在实际的一些行业领域中。例如以下是一个我自己用comfyui复现的一个webui制作产品海报的流程，也就是工作流搭建：

在webui可能我要滑上滑下调整参数切换n个模块功能才能达到的效果，在comfyui只需要搭建好如上图工作流，就可以一键出图了。全程只需要一张白底的产品图（左下角那张），以及点击一下运行按钮，最后就会得到右下角的海报。我特意用的公司的产品做例子，这个工作流还可以发给小白同事，他们导入就能用了。（我觉得这是comfyui有别于webui的价值之一，只需要有一个人会搭建工作流，再分享出来，其他人就都可以直接用，而且使用的流程更简单快速。）

（插个题外话，我把这个东东告诉了公司领导，领导非常开心，并且集团最近也在筹建AIGC的应用研究团队，领导拿我这个工作流去代表公司参赛了）

以及提到的多人插图，以下是我做的两个测试，前两张图使用的是webui的controlnet插件中的openpose(姿态）模型，来达到用两个绑骨控制两个角色，做到动作上的交互。后面一张图是我用gpt4.0辅助生成的一个关于“阖家团圆”这个成语的描述多人画面的提示词，在没有任何插件辅助的情况下直接文生图生成的图像（第三张图我是从我自己做的视频里截的，有字幕请见谅）。

以及，以下是我使用comfyui的条件合并以及条件设置遮置来达到控制图像的复数主体物或者分别单独控制前景背景的生成画面的示例

考虑到comfyui的开源性以及目前的发展趋势，很难预料到后续应用方面能开发到什么程度，我个人感觉还是很有前景。

不过目前我接触到的部分看来，ai也还是有一些bug，需要结合ps去做图像细节的调整。非常细节的地方很难控制好（手，脚，以及其他想要要求的细节），就算有调节的lora也还是需要大量生图从里面挑瑕疵更少的，甚至需要自行训练模型，某方面来说直接手改还快一些。对于特别要求细节，或者有指定细节内容的图像，就不是ai绘图擅长的领域了。

另外就是图像放大方面，目前还没有能无损放大的插件，想要和原图减少物体造型的差异，就只能用填充噪点更少的方式去编码原图（可以理解为放大图像的时候，减少填充马赛克的像素的数量，以此达到维持人物面部等细节，避免在放大图像后产生造型变化），但是这样的插件在放大图像的同时，画面精度不会增加太多，效果不好。而想要提升精度，就必然导致有差异（填充的像素多了呀，画面肯定就变了）。还有就是效果越好的放大插件运行时间越长，这个试错效率又提升了（毕竟需要多次生成然后挑最好的）。

以下是一个放大and背景替换示例，可以看到显示器的数字显示乱码，并且产品的造型发生了改变。

到目前学下来的感觉，还是和我之前说的一样，中低端市场是能用的，但是代替不了高端的美术行业，能做一定程度上的辅助，完全依靠它创作不太行。

最后再说一下，不要贸然相信国内的一些ai绘画的教程，那种几块钱的体验课你可以去看个热闹，几百上千的奉劝不要轻易的去购买，首先就是国内这方面的教程很多不靠谱的（我是踩了很多雷，最后不得不拿着ai翻译软件，翻墙去学）。大家都知道ai绘画的技术目前还在发展阶段，每天都会有更新换代，据我所知例如comfyui，这些平台找人买的工作流，发给学生用，有时候某一个插件更新了，运行不了了，这些平台也不知道怎么办，不负责的给你想不出解决方法，就随便编一个你网不好的理由让你换一个插件用，很多问题他们解释不出原理，就用别的借囗替代，让你换一个用，非常不靠谱。第二就是，ai绘画的技术虽然发展的很快，但是依然处在有局限、不成熟的阶段，你可以去了解学习，或者像我一样查资料学，但是花大价钱去学我觉得不值，学会了能运用在实际工作或者商业领域的地方非常非常少，如果你有一些美术功底，会自己改图，那都还行，如果你纯小白，学了真的局限很大。可以再等等看，在有更有效的办法解决它的这些bug了以后再说。

最后就是，如果实在喜欢，当作爱好，想要找靠谱的老师学（仅限stablediffusion,别的我没接触过不了解），也不介意投入钱，我建议可以在githob上搜搜一些用户遇到的bug，在网上搜不到解决方法那种，拿去问老师，他如果能答上来能解决，说明他是有两把刷子的，如果顾左右而言他，或者直接一句网络问题，插件问题，或者让你换个插件用（能提供更好用的插件例外），那多半自己也是半灌水。

总结

文章主要讲述了作者近期对AI绘画领域（特别是Stable Diffusion和Mid Journey等软件）的观察和自身体验。作者发现近来自媒体上关于AI绘画的讨论有所减少，部分应用如妙鸭的数据也呈现下滑趋势，因此对AI绘画的现状和未来提出了疑问。
作者作为绘画爱好者，今年4月开始自学AI绘画，尤其深入学习了Stable Diffusion及其改进版本ComfyUI。通过实践，作者发现Stable Diffusion与ComfyUI在为特定行业（如产品广告海报的设计）提供便利上有其独特价值。作者详细介绍了使用ComfyUI制作海报的工作流程，突显了其简单快捷的特点，并能有效分享给同事使用。
然而，作者也指出了当前AI绘画的一些局限，如需要人工调整图像细节、图像放大存在局限、以及需要不断更新插件以应对软件更新等问题。在这些问题面前，作者认为AI在中低端市场可以作为一个辅助工具，但在高端美术产业尚不能完全替代传统绘画。
此外，作者给对此领域感兴趣的读者提供了一些建议：谨慎选择国内的AI绘画教程或课程，真正的实用价值可能不高，而对于真正有志于深入研究该领域并愿意投入金钱的爱好者，建议在GitHub等平台寻找专家咨询，确保教学者的专业性。
整体而言，文章既表达了作者对AI绘画发展潜力的认可，也指出了当前该领域的局限性与挑战，以及为感兴趣的读者提供了一些宝贵的参考建议。