超越sd3！比肩Midjourney-v6？AI绘画大模型FLUX1.0详细评测与本地部署方法（附安装文件）

FLUX.1模型是什么？

FLUX模型是一个开源的AI图像生成模型，由黑森林工作室研发。

堪比sd3以及Midjourney-v6

背景/backdrop

黑森林工作室（Black Forest Labs）由前Stability AI核心成员团队成立，专注于开发高级生成式AI模型。以下是该工作室的一些背景信息：

创始团队：

• 艾里克·斯通（Eric Stone）：在深度学习和模型压缩方面具有丰富经验，致力于提升模型的计算效率和生成质量。

• 卡拉·李（Cara Lee）：负责模型的工程实现和优化，确保模型在不同硬件平台上的高效运行。

• 雷恩·托马斯（Ryan Thomas）：专注于大规模数据处理和模型训练管道的开发，提升了模型的训练速度和稳定性。

技术贡献：

• 团队成员曾参与开发过多个知名的AI项目，包括VQGAN、Latent Diffusion和Stable Diffusion等。这些项目在生成式AI领域具有重要影响力，为FLUX模型的开发奠定了坚实的基础。

融资与支持：

• 黑森林工作室获得了由安德森·霍洛维茨（Andreessen Horowitz）领投的3100万美元融资，其他投资者包括布伦丹·伊里比（Brendan Iribe）、迈克尔·奥维茨（Michael Ovitz）、加里·谭（Garry Tan）、提莫·艾拉（Timo Aila）和弗拉德伦·科尔顿（Vladlen Koltun）等知名专家。

模型发布：

• FLUX模型是他们最新的开源图像生成模型，拥有120亿参数，能够处理复杂的图像生成任务，同时保持较高的效率。FLUX模型的权重和推理代码已在HuggingFace和GitHub上公开，方便开发者使用和二次开发。

FLUX.1功能特点

强大的文本理解和生成能力：FLUX模型能够精确地理解和执行用户的文本提示，生成图像时的提示跟随能力较强。这意味着用户可以更准确地通过文字描述生成所需的图像。

高质量图像输出：该模型生成的图像细节丰富，色彩鲜明，整体质量较高。尤其是在生成手指和手部细节方面，FLUX.1取得了显著的进步，解决了许多AI模型在这方面常见的错误。

多样化的图像风格和输出：FLUX模型可以生成多种风格的图像，从写实风格到超现实主义，再到简约卡通风格，满足用户的各种创意需求。

开源和社区支持：FLUX模型的权重和推理代码在HuggingFace和GitHub上公开，便于开发者使用和二次开发。此外，用户还可以通过Replicate和fal.ai等平台在线体验FLUX模型的功能

FLUX.1模型的3个版本

pro专业版

性能最佳，但只能通过API调用

dev开发版

由pro版提炼而来，生成质量相似，略差一点

schnell快速版

比dev更差，但速度更快

FLUX.1本地部署条件

最新版comfyUI

电脑配置（16g显存以上+32g内存以上）

FLUX.1模型文件下载

hugginface

dev版：https://huggingface.co/black-forest-labs/FLUX.1-dev/tree/main

schnell版：https://huggingface.co/black-forest-labs/FLUX.1-schnell

github

https://github.com/black-forest-labs/flux

打包好的文件

链接: https://pan.baidu.com/s/1BSpw63l4_y9YtlKXXK1JJw?pwd=fhsb 提取码: fhsb

FLUX.1模型本地部署

将下载好的文件放入对应的根目录

模型本体文件（flux1-dev.sft）➡️ models的unet文件夹

vae文件（flux-ae.sft）➡️ vae文件夹

clip文件（带clip的与带t5xxl的文件）➡️ clip文件夹

运行FLUX.1模型

打开comfyUI加载对应的工作流（FLUX.json）

unet、clip、vae都选择flux对应的，

如果我们用的是完整版的dev模型，这个权重模型就用默认的，

clip那些用哪个其实也相差无几。

参数方面先用默认就好，然后我们是不需要写负面提示词设置cfg的

跑图评测

整个跑图的时长还是很长的，一张图片3分多钟，我现在这个配置是32g内存+16g显存，跑图过程内存是直接拉满的100%，生成的效果我觉得还是很棒的，真比sd3medium强，但细节还是稍差Midjourney一点，仅此而已，配置如果足够好的话用来替代mj倒也行，特别是后面开始适配controlnet跟IPadapter，但我估计4090ti都不太够

总结

**FLUX.1模型综述**
**FLUX.1模型简介**
FLUX.1是一款由黑森林工作室（Black Forest Labs）研发的开源AI图像生成模型，其在性能上可媲美sd3及Midjourney-v6。该模型以其强大的文本理解和图像生成能力，以及高质量、多样化的图像输出而受到关注。
**黑森林工作室背景**
- **创始团队**：由前Stability AI核心成员组成，包括在深度学习和模型压缩方面有丰富经验的艾里克·斯通，负责模型工程实现和优化的卡拉·李，及负责大规模数据处理和模型训练管道开发的雷恩·托马斯。
- **技术贡献**：团队成员曾参与多个知名AI项目开发，包括VQGAN、Latent Diffusion和Stable Diffusion，为FLUX模型打下了坚实的技术基础。
- **融资与支持**：工作室获得了由安德森·霍洛维茨领投的3100万美元融资，投资阵容强大，展现了其良好的发展前景。
**FLUX.1模型的功能特点**
- **强大的文本理解和生成能力**：能够精确响应用户文本指令，生成符合要求的图像。
- **高质量图像输出**：生成的图像细节丰富、色彩鲜明，特别是在手部细节处理上有显著进步。
- **多样化图像风格和输出**：满足不同用户的创意需求，从写实到超现实，再到卡通风格一网打尽。
- **开源与社区支持**：模型权重和推理代码公开于HuggingFace和GitHub，便于开发者使用和进一步开发。
**FLUX.1模型的版本**
- **pro专业版**：性能最优，但仅限API调用访问。
- **dev开发版**：由pro版提炼而来，生成质量略逊一筹，但可自由使用和改进。
- **schnell快速版**：速度更快，但以牺牲一定生成质量为代价。
**FLUX.1模型的部署与运行**
- **本地部署条件**：需要安装最新版comfyUI，并确保电脑配置满足要求（至少16G显存+32G内存）。
- **文件下载与部署**：可从HuggingFace、GitHub或提供的链接获取不同版本的模型文件，并按照指定路径安装在本地。
- **模型运行**：通过comfyUI加载FLUX.json工作流，选择相应的模型文件和默认参数即可开始生成图像。
**评测与总结**
- **性能表现**：尽管FLUX.1在生成效果和速度上已相当出色，但在某些细节上仍略逊于Midjourney。然而，对于拥有足够配置的用户来说，FLUX.1无疑是一个强大的图像生成工具。
- **展望未来**：随着控制网（ControlNet）和IPadapter等功能的适配，FLUX.1的潜力将进一步被发掘，为用户提供更加丰富和个性化的图像生成体验。