前言
Flux是一个由黑森林实验室(Black Forest Lab)推出的模型,开发人员由Stable Diffusion前离职人员构成。做到了很多SD和MJ都做不到或者很难做到的事情。其特点主要如下:
参数规模大****:官方号称模型有12B(120亿)参数,是迄今为止最大的开源文本到图像模型之一。在视觉质量、提示词遵循、大小/纵横比可变性、字体和输出多样性等方面超越了其他流行的模型。
针对不同需求的多种模型:提供三种不同性能和用途的变体,包括专业版(FLUX.1 [pro])、开发版(FLUX.1 [dev])和快速版(FLUX.1 [schnell])。
技术层面提升:引入了流匹配训练方法、旋转位置嵌入和并行注意力层,提高了模型性能和硬件效率。
对文字的写入:可以将文字写入图片中,成为图片的一部分。
Flux的官方介绍如下:
所有的AI设计工具,模型和插件,都已经整理好了,👇获取~
官方示例:
把 Markdown 文本粘贴到这里,点上面的按钮,就可以开始一键转换了,可以选择带时间模块,也可以不带。
_1_
先说结论
非常强大
要用一个短语总结只有“非常强大”四个字。在刚出来的时候很多人的评价就是拳打Stable Diffusion3,脚踢Midjourney,在使用过后我觉得毫不夸张。有几个非常值得注意的点:
图片有非常好的精神和虚化效果
全图中背景虚化以达到景深的感觉,对人物的刻画细节满满。
人物的手指非常清晰且无需修正
实际上对于人物手指的刻画,基本上没有出过错
线条非常漂亮,没有弯曲的迹象
图片提示词没写好,出图很模糊,但是可以看出窗户等是规规整整的,没有扭曲变形。
2
如何使用Flux
1、非自部署需要使用ComfyUI
对于非开发者或者开发能力不强的人来说,直接使用ComfyUI是比较好的选择。
**2、使用相应的工作流和权重模型
**
Flux需要对应使用其vae编码器/解码器,clip模型使用t5xxl_fp16.safetensors,具体可见工作流。
3、ComfyUI工作流
默认提供下载的工作流比较繁琐,可以考虑自己重新搭建,主要为大模型加载器、vae加载器、clip加载器(需要单独加载)、Ksampler采样器和最后的预览。
4、硬件要求
Flux对硬件要求很高,官方推荐是12g显存,这个数字一般只有笔记本/台式机4080或者以上显卡能达到(魔改的2080不算),但是实际测试下来,我的3070 8g的显存也能跑起来,但是内存却吃掉了16g,同时CPU也跑满了,出一个1024X1024的图大概需要3~5分钟,512X768的大概1分钟。
5、出漂亮图的重点
提示词非常重要,建议使用长句式。另外采样器和调度器在一定程度上会决定出图的风格与颜色艳丽程度。一般情况下使用Eular a祖先采样器+Karras或者DPM 2M++等效果还不错。
3
模型能力对比
这里列出Flux和其他几个模型的对比能力
模型对比有一定的主观性
这里分享给大家一份Adobe大神整理的《AIGC全家桶学习笔记》,相信大家会对AIGC有着更深入、更系统的理解。
有需要的朋友,可以点击下方免费领取!
AIGC所有方向的学习路线思维导图
这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。如果下面这个学习路线能帮助大家将AI利用到自身工作上去,那么我的使命也就完成了:
AIGC工具库
AIGC工具库是一个利用人工智能技术来生成应用程序的代码和内容的工具集合,通过使用AIGC工具库,能更加快速,准确的辅助我们学习AIGC
有需要的朋友,可以点击下方卡片免费领取!
精品AIGC学习书籍手册
书籍阅读永不过时,阅读AIGC经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验,结合自身案例融会贯通。
AI绘画视频合集
我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,科学有趣才能更方便的学习下去。
总结
**Flux模型全面总结****前言**
Flux,这个由黑森林实验室倾力打造的模型,汇聚了一众Stable Diffusion前精英成员的心血,成功突破了现有AI绘图的诸多局限。其庞大的12B(120亿)参数规模,不仅在视觉质量、提示词遵循、尺寸灵活性及输出多样性上傲视群雄,还针对不同需求提供了专业版、开发版和快速版三种变体。Flux通过引入流匹配训练方法、旋转位置嵌入和并行注意力层等技术革新,进一步提升了模型效能与硬件兼容性。尤为值得一提的是,Flux能将文字无缝融入画中,为创作带来前所未有的自由度。
**强大特性概览**
- **视觉盛宴**:Flux生成的图片展现出卓越的精神内涵与自然虚化效果,人物刻画精细入微,尤其是手指细节几无瑕疵。
- **线条艺术**:即便是在提示词模糊的情况下,Flux依然能产出线条流畅、无扭曲变形的佳作。
- **多版本选择**:满足不同场景和需求的专业版、开发版与快速版,提供个性化解决方案。
- **技术创新**:流匹配训练、旋转位置嵌入并行注意力层等技术,让性能与效率齐飞。
- **文字入画**:实现文字与图像的完美融合,拓宽创作边界。
**使用方法简析**
- 非开发者推荐使用ComfyUI平台,上手简便。
- 选择适合的工作流与权重模型至关重要,搭配Flux专用的vae编码器/解码器及clip模型。
- 构建高效工作流时,可考虑自定义搭建以优化体验。
- Flux对硬件要求颇高,推荐至少12G显存的高级显卡,但适当配置下,主流显卡也能一展身手。
- 出图质量高度依赖于精准的提示词、合适的采样器与调度器,调整这些细节将极大地提升作品的表现力。
**模型对比与展望**
Flux在与其他顶级模型的对比中表现出色,但仍需强调,模型对比存在主观性。为帮助大家全面了解AIGC,我们提供了详尽的学习笔记、工具库、精品书籍及视频合集,助力您在AIGC领域乘风破浪。
**结语**
Flux以其无与伦比的强大性能,为AI绘画开辟了新的纪元。无论是专业艺术家还是爱好者,都能在这片沃土上找到属于自己的创作灵感与乐趣。未来,随着技术的不断进步,我们有理由期待Flux能够引领AIGC走向更加辉煌的明天。