作者先说:这几天想系统整理下mj知识体系,从这篇开始都是对阅读官方文档后的个人解读,跳过了官方的quick start和Community guidelines,从prompt开始写起。才疏学浅,如有错误或更好的方法,拜托大家指正
什么是Prompt?
官方大白话
提示词就是一段文本短语,midjourney机器人会理解这些短语,把这些短语拆分成更小的单元,再将这些小单元和他们的训练数据比较,最后通过一些算法输出图像。
举例:
你的提示词: a dog,midjourney机器人理解了a dog后,去他们的数据训练集找狗有关的图像。于是就给你输出了一条狗的图像。
踩坑注意:
1.提示词必须是英文的,可以是句子,也可以是短语。简洁的话句子更好。根据官方文档,简短明确的句子更适合midjourney。官方例子如下:(已翻译为中文)
错误:给我看一张盛开的加州罂粟花的照片,把它们做成明亮、充满活力的橙色,然后用彩色铅笔画成带插图的风格。
正确:用彩色铅笔绘制明亮的橙色加州罂粟花
2.个人经验,midjourney的刻板印象和严重,比如你的prompt是"a Chinese girl",很容易出来丑女,"In China"也很容易出现上世纪油画风的图片,而"a Korean girl"都是idol美女。这可能和他们的训练数据有关。如果想出好图,有风格或人物参考的最好先用/discribe指令,看看mj是怎么描述这张图片的,它能理解的词是怎样的,再去改或者重写prompt,避免无用功。
prompt的构成
prompt可以是简单的一串单词,也可以是包括图片指令、文本指令、参数的复杂指令。
下图源自官方:
Image prompts
图像指令,可以是一张或多张,对生成图的风格和内容都有影响。使用图像指令时,必须有多个图像或一个图像和一个文本指令的组合才能出图,不能只有一个图像但啥也不写。
使用多张图片的时候,你可能会得到下面的结果,以下为mj官方案例
图像与文字指令的权重的调整
图像和文字指令都会对图像质量,可以通过--iw(images weight图像权重) 调整图像对成片的影响,值在0-3之间,值越高生成图越像参考图,不写的话就是按默认值。不同权重效果如下,图源官方文档:
Text prompt
官方给的提示词小技巧
1.提示词越具体越好,想要的东西一定要写上,不然mj会脑补。
2.提示词只写想要的,不要蛋糕不要写no cake,不要的可以通过--no 参数实现,比如--no cake。但在实际做图中,--no参数经常没用,要去掉某样东西最好是局部重绘。
Parameters
这部分用来控制图片的宽高比和风格等,特别重要。这部分明天单独整理文档出来。
看官方文档挺有用的,强烈推荐,链接如下:
Midjourney Quick Start Guide
总结
这篇文章主要讲解了Midjourney(简称mj)中的Prompt(提示词)的使用方法和技巧。作者首先提到他准备系统整理mj知识体系,并指出这篇文章是他对官方文档的个人解读。关于Prompt,作者解释道,它是一段文本短语,midjourney机器人会理解并拆分这些短语,再与训练数据对比,最后通过算法输出图像。例如,输入提示词"a dog",机器人就会输出一张狗的图像。同时,作者也提醒使用者注意提示词必须是英文的,且简洁明确的句子更适合midjourney。另外,midjourney的刻板印象问题也可能影响图像输出,使用者可以通过/discripe指令查看mj的图片描述来改进prompt。
在构成上,Prompt可以是简单单词串联,也可以是包含图片指令、文本指令和参数的复杂指令。图像指令可以影响生成图的风格和内容,同时可以通过调整图像权重来改变图像的影响。文本指令方面,官方建议提示词越具体越好,只写想要的内容,不必要的内容可以通过--no参数去除,但实际操作中可能效果有限。
最后,作者提到了控制图片的宽高比和风格等参数的重要性,并承诺将单独整理一份相关文档。同时推荐读者阅读Midjourney的官方文档以获取更多信息。