Midjourney V6超进化，大神网友深度评测来了！画质逼真到可怕，人像图片令人惊呆

最近，国外的一位名叫Andrei Kovalev的大神网友，做出了一份Midjourney V6的超深度评测。

指南很专业，V6和V5.2有什么不同，很直观地就能看出来。

下面，就让我们来跟随大神的脚步，深入感受一下Midjourney V6的性能有多强吧。

V6模型，究竟比V5.2强在哪

在以往，当我们看一张AI生图时，可能马上就会感觉到这是AI画的。

但在Midjourney V6中，你很少会有这样的感觉。

在这一部分中，Kovalev介绍了V6的优势、劣势，以及和V5.2相比的主要变化。

Tim Walker的高级时装正面肖像，清澈的白色空灵机器人，半透明的皮肤淹没在电线的海洋中。红色和青色色调，发光的高光，深色阴影

V5.2

Kovalev发现，V6有以下升级（因为当前还处于Alpha测试，以后还会发生变化）。

在遵循提示时更准确了，并且使用更长的提示时，效果会更好。

新模型的一致性大大增强了。

V6改进了图像提示功能。

现在V6有了两个新的升频器，具有微妙和创意模式（都将分辨率提高了两倍）。

有一个「unopinionated」的 --style raw模式（类似于 V5.2）。

此外，还可以在图像中添加文本了。

所以，V6究竟变成了什么样子？

超现实主义

以往每次的Midjourney升级，都会提升照片的真实感，V6也不例外。

最能定义V6的关键词，恐怕就是超现实主义。

川内凛子的少女太空飞行员摄影肖像

V5.2

总而言之，V6的逼真度爆表，上升到了一个新台阶，尤其是在摄影风格上，已经到了让人迷惑的程度。

Kourtney Roy的老海员摄影肖像

而Midjourney V6中逼真图像功能之所以如此惊人，恰恰是因为存在缺陷：镜头像差、故意过度突出的区域、意外的失焦元素以及各种胶片效果。

Mitsuo Katsui拍摄的初音未来照片 --stylize 175

当然，V6不止是人像画得好。

第比利斯的延时摄影 --stylize 175

而且，在某些情况下需要更微妙的外观和感觉，这时V6的超现实主义就显得有些尖锐，显得有些矫枉过正。

Ara Guler对1970年代伊斯坦布尔赌场赌徒的肖像

V5.2

细节很疯狂

每次在Midjourney的下一个模型发布之前，许多人都会屏住呼吸，想看看他们会如何处理细节。

V6中的细节，很疯狂。而新的upscalers功能，则让细节更进一步。

Ivan Bilibin的画作，描绘骑着白狼的冬季领主

V5.2

不过，虽然图像的复杂性随着每个新模型的出现而稳步上升，但在此过程中，却丢失了一些东西，比如纹理。

比如，V4的精细程度在V5+中提高了十倍，因此几乎不可能实现胶片颗粒或真实笔触这类效果。

虽然离真正的颗粒感似乎仍然遥不可及，但V6显然朝着以前失去的原始性，迈出了明确的一步。

它的纹理令人惊叹，比起V5来大放异彩（在V5中，需要选择「non-refined」的视觉风格）。

Marianna Rothen的梦幻女孩

V5.2

另一个能很好地描述V6的概念，是非常规组合（unconventional composition），这导致了V5.2中结构化和平衡方法的重大转变。

以前的模型追求几何完美、黄金比例和中心主体，而V6追求不对称，经常将主体从画面中间移开。

Tyrus Wong的跨维度神秘野兽

这可能会提供更具动态性和吸引力的视觉效果，但也需要相应地调整提示。即使是很小的调整，也可以恢复中心构图和对称性。

可变性增强

可以看到，在V6中，同一提示结果的可变性增强了。

与早期模型相比，单个提示的四个变体，通常显示出更明显的差异。

Jessie Willcox Smith的《银术士》

V5.2

许多情况下，这会产生一种更具创意、更有趣，有时甚至更忠实于现实生活中原型的多样性的艺术风格表现。

艺术风格

在提示中，我们可以引用「Style modifiers」的名称，召唤图像的特定视觉风格、技术、流派、主题或上下文。

像素艺术

V5.2

现在，每个新模型都更善于了解源材料，并且在输出中重新创建它，这已经是一个传统。

然而，Midjourney从未停止这种戏剧性的变化。

by Jody Bergsma

V5.2

无论这些风格本身多么伟大，真正将它们从对原作的单纯解释转变为独特的东西的，是我们添加的提示。

图片中添加文本

双手拿着报纸，标题为「Midjourney的文本 - 真实还是骗局？」

V5.2