当前位置:AIGC资讯 > AIGC > 正文

Midjourney v6 快速入门指南

Midjourney V6快速入门教程来了,这是Midjourney的AI图像生成器的又一次令人印象深刻的升级。最显著的是,V6在逼真渲染和图像中的文字功能方面取得了重大进展。

在这篇文章中,我们将探讨如何开始使用Midjourney V6,并提供一些示例提示来测试这些新功能。你还可以在互联网上找到更多Midjourney V6的提示词示例

Midjourney V6概述

Midjourney V6经过9个月的开发,凭借增强的真实感、更连贯的提示响应以及期待已久的图像内文字功能脱颖而出。虽然这个图像内文字功能还不完美,但根据我的经验,它在处理一两个字时效果很好。

Midjourney V6的关键特点
增强的真实感:V6提供了更详细和逼真的图像,将AI艺术的逼真度推向新的高度。 改进的提示连贯性:模型现在能够更准确地遵循提示,并可以处理更长、更复杂的输入。 图像内文字功能:用户现在可以在图像中包含可读的文字,增加了新的创意和功能层次。 高级放大功能:改进的放大选项,包括微妙和创意模式,增强了生成图像的分辨率。
如何使用Midjourney V6

你需要在Midjourney的Discord服务器上启用它,现在是默认v6版本的。或者国内用户访问GPT.Biz即可直接使用。

Midjourney V6提示

与以前的版本相比,Midjourney V6的提示方式发生了显著变化。以下是需要注意的关键变化:

对提示的敏感度提高:Midjourney V6对提示的具体措辞更加敏感。这意味着你需要更加明确,避免使用诸如“获奖”、“逼真”或分辨率规格如“4k”、“8k”之类的模糊术语。 提示风格和长度:V6允许更准确地遵循提示,并且可以处理更长的提示。但需要注意的是,使用长提示并不自动保证更好或更详细的结果。像其他AI模型一样,Midjourney只能解释一定数量的令牌,因此通常最好将提示保持简洁,关注主要概念。 详细和描述性的提示:与以前更注重关键词的方法不同,V6在处理详细、描述性的提示时效果很好。 图像内文字生成:为了生成文字,你可以使用引号来指导图像内的文字生成。 造型和美学的调整:最后,为了获得更具照片感和较少主观色彩的结果,建议用户默认使用--style raw。较低的--stylize值可能提供更好的提示理解,而较高的值则可以增强美学效果。

总之,Midjourney V6在提示方面更倾向于精确和详细的方法,关注明确的描述,避免使用不具描述性的术语。

Midjourney V6图像内文字

如果你以前尝试过带文字的AI生成图像,你会知道大多数时候你得到的都是乱码……

虽然V6还远未完美,但比V5.2有了很大改进。根据我的经验,它在处理像"Welcome", "Hello"等常见词汇时表现不错,但对于像“GPT.Biz”这样的未训练词汇则经常失败,需要多修改几次,需要注意的是,目前还不支持中文。

使用图像内文字的技巧
引号:将你的文字用引号括起来以保持清晰。 样式选项:使用"--style raw"命令或较低的--stylize值以更好地融合文字。

图像内文字的示例提示

Prompt:A cozy café's chalkboard menu, with "Coffee" artistically written at the top --ar 16:9 --v 6.0 --style raw --stylize 75

提示词:一个舒适咖啡馆的黑板菜单,顶部艺术性地写着“Coffee”--ar 16:9 --v 6.0 --style raw --stylize 75

Prompt:A close-up of a dew-covered leaf, with the word "Nature" formed by the dew drops --ar 16:9 --v 6.0 --style raw --stylize 80

提示词:一片被露水覆盖的叶子的特写,露珠形成了“Nature”一词 --ar 16:9 --v 6.0 --style raw --stylize 80

Prompt:The words "Hello, World" displayed on a futuristic computer screen with a holographic interface --ar 16:9 --v 6.0 --style raw

提示词:带有全息界面的未来主义计算机屏幕上显示的“Hello, World”字样 --ar 16:9 --v 6.0 --style raw

Prompt:A sleek, modern logo featuring stylized text " GPT.Biz" in bold, futuristic font, with a subtle AI circuit pattern in the background --ar 16:9 --style raw --v 6

提示词:一个时尚、现代的标志,以粗体、未来主义的字体写着风格化的文字“GPT.biz”,背景中有一个微妙的 AI 电路图案 --ar 16:9 --style raw --v 6

还不错,尽管需要几次尝试才能得到正确的字母……但还是在正确的轨道上。

Midjourney V6 写实主义

Midjourney已经是最逼真的图像生成器之一,因此有时很难注意到输出结果的差异……但整体效果还是非常令人印象深刻的。

在Midjourney V6中,--style参数,特别是--style raw,用于指导AI生成更逼真且较少风格化的图像。 --stylize参数,范围从0到1000,通过控制艺术解释的程度来补充这一点。 较低的--stylize值会生成更符合提示字面细节的图像,适合逼真的描绘。较高的值则会为艺术作品注入更多的创意和抽象元素。

prompt:Albert Einstein in his study, a look of deep concentration, papers with mathematical formulas scattered around, his signature hair slightly disheveled --ar 16:9 --v 6.0

提示词:爱因斯坦在他的书房里,深思熟虑的表情,桌上散布着数学公式,标志性的头发略显凌乱--ar 16:9 --v 6.0

prompt:Ada Lovelace at a Victorian desk, early mechanical computing designs spread out, holding a quill, thoughtful expression --style raw --stylize 70 --ar 16:9 --v 6.0

提示词:艾达·洛夫莱斯在维多利亚风格的桌子旁,早期机械计算设计散落在桌上,手持羽毛笔,神情专注--style raw --stylize 70 --ar 16:9 --v 6.0

prompt:An undercover agent in Neo-Tokyo, smart-glass eyewear catching neon reflections, blending with tech-savvy passersby --ar 16:9 --style raw --v 6.0

提示词:新东京的卧底特工,智能眼镜反射出霓虹灯,与科技感十足的路人融为一体--ar 16:9 --style raw --v 6.0

prompt:A robotics engineer fine-tuning a humanoid robot, the lab filled with robotic parts and tools, a look of concentration on the engineer's face --style raw --ar 16:9 --v 6.0

提示词:一个机器人工程师正在微调人形机器人,实验室里充满了机器人部件和工具,工程师脸上带着专注的表情--style raw --ar 16:9 --v 6.0

多重提示

Midjourney机器人可以使用::作为分隔符来混合多个概念。使用多重提示可以为提示中的概念分配相对重要性,帮助你控制它们如何混合在一起。

多提示基础知识

:: 在提示中添加双冒号会向 Midjourney Bot 表示,它应该单独考虑提示的每个部分。对于提示, space ship 这两个词被放在一起考虑,Midjourney Bot 会生成科幻宇宙飞船的图像。如果将提示分成两部分, space:: ship 则将两个概念分开考虑,然后混合在一起,创建一艘穿越太空的帆船。(注意双冒号之间没有空格)

提示权重

当使用双冒号 :: 将提示分隔为不同的部分时,可以在双冒号后立即添加一个数字,以分配提示的该部分的相对重要性。(只接受整数1,2,3作为权重,默认为1)

在下面的示例中,提示词astronauts::3的重要性是最高的,从而生成以其他为支撑元素的图像。以此递减

Prompt:space::2 exploration::1 with astronauts::3 on a distant planet::2 --ar 16:9 --style raw --v 6.0

提示词:空间::2 探索::1 和宇航员::3 在一个遥远的星球::2 --ar 16:9 --style raw --v 6.0

简洁有力。

总结

在我看来,Midjourney V6 仍然是排名第一的图像生成器,DALLE 3 紧随其后。以下是关键的总结:

 增强的真实感:具有先进逼真度的逼真图像。  改进的提示:对更长、更复杂输入的更准确响应。  图像内文字:能够在图像中包含可读的文字。  高级放大:具有创意模式的更高分辨率。

除了V6显然令人印象深刻的结果之外,更令人印象深刻的是,据报道Midjourney正走向2亿美元的年收入和100亿美元的估值,且完全没有外部资金。

更新时间 2024-06-23