当前位置:AIGC资讯 > AIGC > 正文

图像生成新模型FLUX1对比Midjourney V6,到底谁更强?多场景实际测试对比

🍟背景介绍

如果想简单了解下FLUX1模型的基础内容,或者想要自己上手下载模型尝试下,可以看我上一篇内容,包含了模型的简单介绍和下载地址,以及如何在comfyui中做测试:

哦吼,新模型?文生图领域的新模型FLUX.1(附模型下载网盘地址和详细使用方法)-CSDN博客

本篇内容重点通过实际图片生成效果来看下,FLUX1对比Midjourney V6,到底谁更强,相信大家看完本篇内容,会有自己的判断。

🍩生成质量参考

我们对比下开源版本中效果最好的一个搭配:flux1_dev模型+t5xxl_fp16+clip_l+20步,对比midjourney V6,选几个典型场景,看下生成效果到底如何;

上图片:

第一组:

一位非常漂亮的亚洲美女,照片特写,非常写实,摄影工作室,ins,彩色的太阳眼镜,眼镜镜片上写着“hello,world”,

A very beautiful Asian beauty, Photo close-up, It's very well written, Photographic studio, ins, Colored sunglasses, The glasses say "Hello.", world”

FLUX1:

Midjourney:

两组画面整体风格还可以,Flux1整体风格更写实一点,但是对于ins风格的理解和对文字排版的理解,Midjourney赢了;

第二组:

一只花栗鼠抱着一颗巨大的橡果,奔跑在沙滩上,背景是蓝色的天空和大海,天空中是白云组成的文字:“Dream”,卡通风格,迪士尼风格,3D,

A squirrel is holding a huge acorn, running on the beach with a background of blue sky and sea, and the sky is filled with white clouds forming the word: "Dream", in a cartoon style, Disney style, 3D

Flux1:

Midjourney:

这一次测试,flux1生成的图像画面比较模糊,大概率是生成步骤太低造成的。所以我们暂时忽略画质,把图像缩小先看下整体的感觉。

个人认为,从对迪士尼风格的理解和对文字“云彩组成的文字”的理解方面,flux1搬回一局。

接下来我们尝试把step从20修改到40来看下是否可以解决画面模糊的问题:嗯,立竿见影的提升了,但是生成时间也由27秒上升到了42秒,要知道这是一台4090+64G内存的电脑,属实,配置要求高了一点点。

第三组:

夜晚的星空下,五六位开发者坐在一台巨大的老式电视机前,电视机上用英文写着“hello,everyone, this is a test for the world...”,科幻电影风格,背景是巨大的飞船残骸,

Under the starry night sky, five or six developers sit in front of a huge vintage television. The television displays the message "hello, everyone, this is a test for the world..." in English. The scene is in a science fiction film style, with the backdrop of a massive spaceship wreckage.

Flux1:

Midjourney:

单从画面美术上看,毫无疑问midjourney赢了,但是结合对于语义的理解,“科幻电影风格”“背景是巨大的飞船残骸”,以及文字的精准表现方面,Flux1怎么也不能算是输了,可以算打平?毕竟各有千秋。

我在flux1中,尝试提示词中指定是卡通风格,效果如下,也还行:

第四组:

紫色和蓝色暗光在黑色背景上以曲线流动线条形状旋转,变形镜头,抽打线条,螺旋群组,读数,高清。

purple and blue dark light spinning on black background in Curved flow line shape, anamorphic lens, whipping lines, spiral group, readout, HD

(提示词来源于小红书的一位分享者)

Flux1:

Midjourney:

从最终呈现效果上来说,Midjourney赢了,这种描述方式以及艺术感的表现,本来也是Midjourey的强项,相比之下Flux1的色彩质感和构图,都不如Midjourney,但是跟之前的sdxl和sd3相比,还是有一些进步的,或许通过微调可以实现最终效果有的一拼。

第五组:

一张电影海报,电影海报的名字是"Dream", 画面主题是人鱼公主在海底的岩石上,独自唱歌,周围有很多发着各种颜色光芒的水母,非常漂亮,吉卜力工作室风格,

A movie poster with the title "Dream," featuring the theme of a mermaid princess singing alone on the seabed rocks, surrounded by many jellyfish emitting various colors of light, very beautiful, in the style of Studio Ghibli.

Flux1:

Midjourney:

本以为这一组flux1能搬回一局的,结果出乎意料,Midjourney赢的很扎实。

总体来说,通过为数不多的几个典型场景的测试,flux1模型比之前的模型有进步,但是碰瓷midjourney,还是不太行,期待后续的迭代吧,就像sd1.5时代,生态的微调能把那么普通的基础模型调到现在还经典永流传。

✨写在最后

如果对comfyui还不熟悉的话,最近面向ComfyUI的新手,开了一门图文课程,现在已经更新完成了,如果大家在学习过程中遇到什么问题,也可以直接文章下留言,会持续更新相关答疑内容哈。欢迎订阅哦~

https://blog.csdn.net/jumengxiaoketang/category_12683612.html

​​

感谢大家的支持~

总结

**文章总结:《FLUX1 vs Midjourney V6:图像生成质量对比》**
---
本文对比了新型文生图模型FLUX1与颇受欢迎的Midjourney V6,在不同场景下的图像生成效果。作者通过实际测试,挑选了多个典型图片生成任务,从风格理解、文字排版、细节清晰度及艺术表现力等方面进行了综合评估。
**测试环境与基础信息**:
- FLUX1采取的配置为`flux1_dev`模型+`t5xxl_fp16`+`clip_l`,设置生成步数为20。
- 中途为优化画面质量,增加生成步数至40进行测试。
**测试场景与结果**:
1. **亚洲美女特写**:
- FLUX1风格更写实,但在ins风格及文字排版上不如Midjourney。
2. **花栗鼠与橡果**:
- FLUX1初次生成效果模糊,提高步数后显著改善,展现了较强的迪士尼风格理解能力。
3. **星空下的开发者**:
- Midjourney画面美术上优胜,但Flux1在语义理解和展现科幻元素方面不落下风。
4. **抽象光线效果**:
- Midjourney展现了更强的艺术表现力和色彩质感,Flux1虽有进步但仍显不足。
5. **吉卜力风格电影海报**:
- Midjourney再次胜出,在风格还原和细节处理上优于Flux1。
**总体评价**:
FLUX1模型相较于之前的版本有显著进步,但在与Midjourney V6的直接较量中,尽管在特定场景下展现出一定优势,整体而言仍无法全面匹敌Midjourney。尤其是在艺术表现、色彩质感及风格把握上,Midjourney展现了更高的水准。然而,FLUX1的发展潜力值得期待,通过后续的迭代与微调,未来或有更大提升。
**额外信息**:
- 作者提供了对ComfyUI平台不熟悉的读者的一门图文课程链接,并邀请大家在学习过程中留言提问,以便及时解答。
本文不仅为读者提供了FLUX1与Midjourney V6的直观对比,还通过具体分析各模型的优缺点,为相关领域的学习者和创作者提供了有价值的参考信息。

更新时间 2024-08-05