FLUX.1模型是什么?
FLUX模型是一个开源的AI图像生成模型,由黑森林工作室研发。
堪比sd3以及Midjourney-v6
背景/backdrop
黑森林工作室(Black Forest Labs)由前Stability AI核心成员团队成立,专注于开发高级生成式AI模型。以下是该工作室的一些背景信息:
创始团队:
• 艾里克·斯通(Eric Stone):在深度学习和模型压缩方面具有丰富经验,致力于提升模型的计算效率和生成质量 。
• 卡拉·李(Cara Lee):负责模型的工程实现和优化,确保模型在不同硬件平台上的高效运行 。
• 雷恩·托马斯(Ryan Thomas):专注于大规模数据处理和模型训练管道的开发,提升了模型的训练速度和稳定性 。
技术贡献:
• 团队成员曾参与开发过多个知名的AI项目,包括VQGAN、Latent Diffusion和Stable Diffusion等 。这些项目在生成式AI领域具有重要影响力,为FLUX模型的开发奠定了坚实的基础。
融资与支持:
• 黑森林工作室获得了由安德森·霍洛维茨(Andreessen Horowitz)领投的3100万美元融资,其他投资者包括布伦丹·伊里比(Brendan Iribe)、迈克尔·奥维茨(Michael Ovitz)、加里·谭(Garry Tan)、提莫·艾拉(Timo Aila)和弗拉德伦·科尔顿(Vladlen Koltun)等知名专家 。
模型发布:
• FLUX模型是他们最新的开源图像生成模型,拥有120亿参数,能够处理复杂的图像生成任务,同时保持较高的效率 。FLUX模型的权重和推理代码已在HuggingFace和GitHub上公开,方便开发者使用和二次开发 。
FLUX.1功能特点
强大的文本理解和生成能力:FLUX模型能够精确地理解和执行用户的文本提示,生成图像时的提示跟随能力较强。这意味着用户可以更准确地通过文字描述生成所需的图像 。
高质量图像输出:该模型生成的图像细节丰富,色彩鲜明,整体质量较高。尤其是在生成手指和手部细节方面,FLUX.1取得了显著的进步,解决了许多AI模型在这方面常见的错误 。
多样化的图像风格和输出:FLUX模型可以生成多种风格的图像,从写实风格到超现实主义,再到简约卡通风格,满足用户的各种创意需求 。
开源和社区支持:FLUX模型的权重和推理代码在HuggingFace和GitHub上公开,便于开发者使用和二次开发。此外,用户还可以通过Replicate和fal.ai等平台在线体验FLUX模型的功能
FLUX.1模型的3个版本
pro专业版
性能最佳,但只能通过API调用
dev开发版
由pro版提炼而来,生成质量相似,略差一点
schnell快速版
比dev更差,但速度更快
FLUX.1本地部署条件
最新版comfyUI
电脑配置(16g显存以上+32g内存以上)
FLUX.1模型文件下载
hugginface
dev版:https://huggingface.co/black-forest-labs/FLUX.1-dev/tree/main
schnell版:https://huggingface.co/black-forest-labs/FLUX.1-schnell
github
https://github.com/black-forest-labs/flux
打包好的文件
链接: https://pan.baidu.com/s/1BSpw63l4_y9YtlKXXK1JJw?pwd=fhsb 提取码: fhsb
FLUX.1模型本地部署
将下载好的文件放入对应的根目录
模型本体文件(flux1-dev.sft)➡️ models的unet文件夹
vae文件(flux-ae.sft)➡️ vae文件夹
clip文件(带clip的与带t5xxl的文件)➡️ clip文件夹
运行FLUX.1模型
打开comfyUI加载对应的工作流(FLUX.json)
unet、clip、vae都选择flux对应的,
如果我们用的是完整版的dev模型,这个权重模型就用默认的,
clip那些用哪个其实也相差无几。
参数方面先用默认就好,然后我们是不需要写负面提示词设置cfg的
跑图评测
整个跑图的时长还是很长的,一张图片3分多钟,我现在这个配置是32g内存+16g显存,跑图过程内存是直接拉满的100%,生成的效果我觉得还是很棒的,真比sd3medium强,但细节还是稍差Midjourney一点,仅此而已,配置如果足够好的话用来替代mj倒也行,特别是后面开始适配controlnet跟IPadapter,但我估计4090ti都不太够
总结
**FLUX.1模型综述****FLUX.1模型简介**
FLUX.1是一款由黑森林工作室(Black Forest Labs)研发的开源AI图像生成模型,其在性能上可媲美sd3及Midjourney-v6。该模型以其强大的文本理解和图像生成能力,以及高质量、多样化的图像输出而受到关注。
**黑森林工作室背景**
- **创始团队**:由前Stability AI核心成员组成,包括在深度学习和模型压缩方面有丰富经验的艾里克·斯通,负责模型工程实现和优化的卡拉·李,及负责大规模数据处理和模型训练管道开发的雷恩·托马斯。
- **技术贡献**:团队成员曾参与多个知名AI项目开发,包括VQGAN、Latent Diffusion和Stable Diffusion,为FLUX模型打下了坚实的技术基础。
- **融资与支持**:工作室获得了由安德森·霍洛维茨领投的3100万美元融资,投资阵容强大,展现了其良好的发展前景。
**FLUX.1模型的功能特点**
- **强大的文本理解和生成能力**:能够精确响应用户文本指令,生成符合要求的图像。
- **高质量图像输出**:生成的图像细节丰富、色彩鲜明,特别是在手部细节处理上有显著进步。
- **多样化图像风格和输出**:满足不同用户的创意需求,从写实到超现实,再到卡通风格一网打尽。
- **开源与社区支持**:模型权重和推理代码公开于HuggingFace和GitHub,便于开发者使用和进一步开发。
**FLUX.1模型的版本**
- **pro专业版**:性能最优,但仅限API调用访问。
- **dev开发版**:由pro版提炼而来,生成质量略逊一筹,但可自由使用和改进。
- **schnell快速版**:速度更快,但以牺牲一定生成质量为代价。
**FLUX.1模型的部署与运行**
- **本地部署条件**:需要安装最新版comfyUI,并确保电脑配置满足要求(至少16G显存+32G内存)。
- **文件下载与部署**:可从HuggingFace、GitHub或提供的链接获取不同版本的模型文件,并按照指定路径安装在本地。
- **模型运行**:通过comfyUI加载FLUX.json工作流,选择相应的模型文件和默认参数即可开始生成图像。
**评测与总结**
- **性能表现**:尽管FLUX.1在生成效果和速度上已相当出色,但在某些细节上仍略逊于Midjourney。然而,对于拥有足够配置的用户来说,FLUX.1无疑是一个强大的图像生成工具。
- **展望未来**:随着控制网(ControlNet)和IPadapter等功能的适配,FLUX.1的潜力将进一步被发掘,为用户提供更加丰富和个性化的图像生成体验。