大家好,我是程序员晓晓
8月1号,由AI绘画Stable Diffusion 创始团队开发的FLUX模型全网震撼发布,引发了AI绘画行业的全体狂欢,这也是目前真正超越Midjourney & DALL-E 的,能够支持中文提示词的,拥有23G大小的迄今最大开源文生图模型。
今天就给大家全方位测评一下 FLUX 模型的表现如何,FLUX 模型仅支持在ComfyUI 中进行使用,相关工作流和模型已经给大家准备好了,需要的小伙伴可以看文末扫描免费获取哦
FLUX模型简介
8月1日这天,开源文生图模型迈入了有一个大里程碑,黑森林实验室(一家已完成3100万美元的种子轮系列融资)的12B文生图大模型:FLUX震撼发布。
这是迄今为止最大的文生图开源模型。这也是目前高质量的文生图模型,FLUX.1文生图模型套件,为文本到图像合成定义了新的最先进水平,在图像细节、提示遵循、风格多样性和场景复杂性方面树立了新的基准标准。
FLUX.1一共有三个版本:FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell]:
FLUX.1 [dev] :基础模型,开源且拥有非商业许可,供社区在此基础上进行构建。(模型下载请看文末扫描免费获取)
FLUX.1 [schnell] :基本模型的精简版本,蒸馏版本,23.8 GB,运行速度最高可提高 10 倍。Apache 2 许可。(模型下载请看文末扫描免费获取)
FLUX.1 [pro] :官方闭源版本,可以通过 API提供服务使用。
API地址:https://replicate.com/black-forest-labs/flux-pro、https://docs.bfl.ml/
FLUX模型评估
FLUX.1 [pro] 和 [dev] 在以下每个方面超越了流行的模型,如 Midjourney v6.0、DALL·E 3(HD) 和 SD3-Ultra。
从视觉质量、提示遵循、尺寸/方面变化、排版和输出多样性。FLUX.1 [schnell] 是迄今为止最先进的几步模型,不仅超越了其同类竞争对手,还超越了像 Midjourney v6.0 和 DALL·E 3(HD)这样的强大非蒸馏模型。FLux模型专门针对预训练中保持整个输出多样性进行了微调。与当前的最先进技术相比,它们提供了显著改进的可能性,如下所示。
所有FLUX.1模型变体都支持 0.1 和 2.0 百万像素的多种纵横比和分辨率,如下例所示。
FLUX.1 支持的纵横比和分辨率示例
另外黑森林实验室团队提到在Flux文生图模型之后,计划会进一步进军文生视频领域。不久的将来我们可能会在文生视频领域的重大里程碑震撼发布。
Flux模型体验
Flux ComfyUI安装
ComfyUI的最新版本已支持Flux模型的运行,仅需将ComfyUI更新到最新版本即可。
需要下载模型Flux1-schnell.sft放置到目录 ComfyUI/models/unet/ 下。如果你的显卡显存不足24,还请尽量采用8为量化版本
需要下载VAE模型ae.sft放置到目录ComfyUI/models/vae 下。
需要下载T5文本编码模型 t5xxl_fp8_e4m3fn.safetensors 放置到目录ComfyUI/models/clip 下。
(以上ComfyUI最新版、FLUX模型、VAE模型、T5文本编码模型已备好,需要的小伙伴请扫描免费获取哦)
工作流界面
该工作流同样可看上方免费获取哦
01. 牛魔女
A Korean beautiful idol with horns and beautiful face, in a black outfit in the style of James Jean, against a flat red background, with cinematic lighting, in a minimalistic design, with dark contrast
02. 光影
masterpiece, best quality, 1girl ((pure gradient background, )), long hair, floating hair, blush, looking at viewers, happy, ((front)),(upper body), (studio light), soft light, dark style, night style
03. 旗袍
(look at viewer:2), 1 girl, solo,chinese dress, cheongsam, earrings, Chinese roll, smile, lips, light green background,sfw,8k high definition, 35 mm film photography, photo realistic, insanely detailed, intricate, elegant, best quality, ultra-detailed, masterpiece, finely detail, highres, 8k wallpaper
04. 动漫
(Animation style:1.3),a female character with long, flowing hair that appears to be made of ethereal, swirling patterns resembling the Northern Lights or Aurora Borealis. The background is dominated by deep blues and purples, creating a mysterious and dramatic atmosphere. The character’s face is serene, with pale skin and striking features. She wears a dark-colored outfit with subtle patterns. The overall style of the artwork is reminiscent of fantasy or supernatural genres
05. 摄影构图-全身镜头+正面视角
front view, full body shot),1girl, solo, realistic, chinese girl,(cowboy shot:1.2), real life location,tiny pink shirts, midriff, short skirt, smile, cute, thin short waist, large pelvis, (high quality:1.4), (photorealistic:1.6), 8k, uhd, highres, absurdres, professional photo, highly detailed, detailed skin
06. 莲花
A lotus flower, close to the sun, triple exposure, fantastic illustrations
07. 小黄人
a group of six minions in a yellow boat on a river in Paris, France. The boat is floating on the water, with the Eiffel Tower in the background. The minions are all facing the same direction and appear to be happy and excited. They are all wearing blue overalls and have big smiles on their faces. The river is lined with buildings on both sides, and there are pink and purple flowers floating in the water. The sky is blue and the overall mood of the image is cheerful and playful.
08. 冰雕-文学讲坛
three statues of Chinese characters standing on a stage with a blue background. The statues are made of ice and are intricately carved with detailed features. The characters are dressed in traditional Chinese clothing, with long robes and hats. They are standing in a line, facing towards the left side of the image. The figure on the left is holding a book in his hands, while the figure in the middle is standing with his hands clasped in front of him. All three figures have a serious expression on their faces and appear to be in a contemplative pose. The background is a gradient of blue and white, with rays of light shining down on the figures
感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
一、AIGC所有方向的学习路线
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
总结
### 文章总结:《FLUX模型震撼发布:改写AI绘画新篇章》**作者介绍**:
- 文章由程序员晓晓撰写,聚焦于AI绘画领域的最新动态。
**FLUX模型发布**:
- FLUX模型由AI绘画Stable Diffusion创始团队联合黑森林实验室在8月1日震撼发布。
- 这是目前最大的开源文生图模型,达到23G大小,支持中文提示词,超越Midjourney与DALL-E等模型。
- FLUX模型分为三个版本:[pro]、[dev]、[schnell],分别面向不同用户群体和场景。
- **[pro]**:闭源版本,通过API提供服务。
- **[dev]**:基础模型,开源非商用,供社区开发。
- **[schnell]**:精简版模型,速度快,适合高效运行。
**模型优势与评估**:
- FLUX模型在视觉质量、提示遵循、排版、输出多样性方面表现卓越,多项标准均超越现有主流AI绘画模型。
- 支持多种分辨率和纵横比,提供广泛的创作选择和极高的灵活性。
**使用体验**:
- FLUX模型通过ComfyUI平台运行,用户需安装最新版ComfyUI并下载相应模型文件。
- 文章详细指导FLUX模型的安装步骤和工作流程,并附带了使用示例,如创作牛魔女、光影、旗袍等主题的图像。
**未来展望**:
- 黑森林实验室计划将进一步推动文本生成视频技术的发展,或在不久的将来发布相关重大成果。
- AIGC技术的发展前景广阔,将在游戏、计算领域等更多场景下得到广泛应用,这项技术也与人工智能技术的深化融合息息相关。
**学习资料与工具**:
- 文章提供了AIGC方向的全面学习资源,包括但不限于学习笔记、工具合集、视频教程和实战案例,帮助读者从入门到深入掌握AI绘画技术。
总的来说,FLUX模型的发布标志着AI绘画领域的一次重大飞跃,不仅为创作者提供了更高质量的工具,也预示着文本生成图像及视频技术的未来潜力。