最近,国外的一位名叫Andrei Kovalev的大神网友,做出了一份Midjourney V6的超深度评测。
指南很专业,V6和V5.2有什么不同,很直观地就能看出来。
下面,就让我们来跟随大神的脚步,深入感受一下Midjourney V6的性能有多强吧。
V6模型,究竟比V5.2强在哪
在以往,当我们看一张AI生图时,可能马上就会感觉到这是AI画的。
但在Midjourney V6中,你很少会有这样的感觉。
在这一部分中,Kovalev介绍了V6的优势、劣势,以及和V5.2相比的主要变化。
Tim Walker的高级时装正面肖像,清澈的白色空灵机器人,半透明的皮肤淹没在电线的海洋中。红色和青色色调,发光的高光,深色阴影
V6
V5.2
Kovalev发现,V6有以下升级(因为当前还处于Alpha测试,以后还会发生变化)。
在遵循提示时更准确了,并且使用更长的提示时,效果会更好。
新模型的一致性大大增强了。
V6改进了图像提示功能。
现在V6有了两个新的升频器,具有微妙和创意模式(都将分辨率提高了两倍)。
有一个「unopinionated」的 --style raw模式(类似于 V5.2)。
此外,还可以在图像中添加文本了。
所以,V6究竟变成了什么样子?
超现实主义
以往每次的Midjourney升级,都会提升照片的真实感,V6也不例外。
最能定义V6的关键词,恐怕就是超现实主义。
川内凛子的少女太空飞行员摄影肖像
V6
V5.2
总而言之,V6的逼真度爆表,上升到了一个新台阶,尤其是在摄影风格上,已经到了让人迷惑的程度。
Kourtney Roy的老海员摄影肖像
V6
而Midjourney V6中逼真图像功能之所以如此惊人,恰恰是因为存在缺陷:镜头像差、故意过度突出的区域、意外的失焦元素以及各种胶片效果。
Mitsuo Katsui拍摄的初音未来照片 --stylize 175
当然,V6不止是人像画得好。
第比利斯的延时摄影 --stylize 175
而且,在某些情况下需要更微妙的外观和感觉,这时V6的超现实主义就显得有些尖锐,显得有些矫枉过正。
Ara Guler对1970年代伊斯坦布尔赌场赌徒的肖像
V6
V5.2
细节很疯狂
每次在Midjourney的下一个模型发布之前,许多人都会屏住呼吸,想看看他们会如何处理细节。
V6中的细节,很疯狂。而新的upscalers功能,则让细节更进一步。
Ivan Bilibin的画作,描绘骑着白狼的冬季领主
V6
V5.2
不过,虽然图像的复杂性随着每个新模型的出现而稳步上升,但在此过程中,却丢失了一些东西,比如纹理。
比如,V4的精细程度在V5+中提高了十倍,因此几乎不可能实现胶片颗粒或真实笔触这类效果。
虽然离真正的颗粒感似乎仍然遥不可及,但V6显然朝着以前失去的原始性,迈出了明确的一步。
它的纹理令人惊叹,比起V5来大放异彩(在V5中,需要选择「non-refined」的视觉风格)。
Marianna Rothen的梦幻女孩
V6
V5.2
另一个能很好地描述V6的概念,是非常规组合(unconventional composition),这导致了V5.2中结构化和平衡方法的重大转变。
以前的模型追求几何完美、黄金比例和中心主体,而V6追求不对称,经常将主体从画面中间移开。
Tyrus Wong的跨维度神秘野兽
V6
V5
这可能会提供更具动态性和吸引力的视觉效果,但也需要相应地调整提示。即使是很小的调整,也可以恢复中心构图和对称性。
可变性增强
可以看到,在V6中,同一提示结果的可变性增强了。
与早期模型相比,单个提示的四个变体,通常显示出更明显的差异。
Jessie Willcox Smith的《银术士》
V6
V5.2
许多情况下,这会产生一种更具创意、更有趣,有时甚至更忠实于现实生活中原型的多样性的艺术风格表现。
艺术风格
在提示中,我们可以引用「Style modifiers」的名称,召唤图像的特定视觉风格、技术、流派、主题或上下文。
像素艺术
V6
V5.2
现在,每个新模型都更善于了解源材料,并且在输出中重新创建它,这已经是一个传统。
然而,Midjourney从未停止这种戏剧性的变化。
by Jody Bergsma
V6
V5.2
无论这些风格本身多么伟大,真正将它们从对原作的单纯解释转变为独特的东西的,是我们添加的提示。
图片中添加文本
双手拿着报纸,标题为「Midjourney的文本 - 真实还是骗局?」
V6
V5.2
更多详解,还请参考原文网站。