文章目录
第一步 第二步 第三步 第四步 第五步 第六步 第七步 第八步文心一言支持连续对话
我瞎玩的非专业哈哈
第一步
你好,今天我们要用扩散模型创建图像。我会给你提供一些信息。行吗?
第二步
这是Midjourney的工作原理:Midjourney是另一个基于ai的工具,能够根据用户提示生成图像。MidJourney擅长调整实际的美术风格,创造出用户想要的任何组合的图像。它擅长创造环境,尤其是幻想和科幻场景,戏剧性的灯光看起来就像电子游戏的概念艺术。
《Midjourney》是如何运作的?Midjourney是一款人工智能图像生成工具,它通过文本提示和参数输入,并使用经过大量图像数据训练的机器学习(ML)算法来生成独特的图像。由潜在扩散模型(LDM)提供动力,这是一种尖端的文本到图像合成技术。在理解ldm如何工作之前,让我们先看看什么是扩散模型,以及我们为什么需要ldm。扩散模型(DM)是一种基于变压器的生成模型,它采用一段数据,例如一幅图像,并随着时间的推移逐渐添加噪声,直到无法识别为止。从那时起,他们尝试将图像重建为原始形式,并在此过程中学习如何生成图像或其他数据。dm的问题在于,强大的dm通常会消耗数百个GPU天,并且由于顺序计算,推理非常昂贵。为了使DM在有限的计算资源上训练而不影响其质量和灵活性,DM被应用于强大的预训练自编码器的潜在空间。在这种表示上训练扩散模型可以在复杂性降低和细节保留之间达到最佳点,显著提高视觉保真度。在模型架构中引入跨注意层将扩散模型变成一个强大而灵活的生成器,用于一般条件输入(如文本和边界框),从而实现基于卷积的高分辨率合成。等等,我还有更多信息提供。
第三步
Version Light Midjourney定期发布新的模型版本,以提高效率、一致性和质量。最新的模型是默认的,但其他模型可以使用。不同的模型擅长不同类型的图像。Midjourney V5模型是最新最先进的模型,于2023年3月15日发布。要使用此模型,请在提示符末尾添加—v 5参数,或使用/settings命令并选择MJ Version 5。此模型具有非常高的一致性,擅长解释自然语言提示,分辨率更高,并支持使用——tile重复模式等高级功能。在提示符后打开类型-v 5或从/settings中选择“V5”V5基本模型有什么新功能? 风格范围更广,对提示反应更灵敏 ,更高的图像质量(分辨率提高2倍)改善了动态范围 ,更详细的图像。细节更可能是正确的。减少不必要的文本。 改进了图像提示的性能 ,支持无缝平铺的tile参数(实验性) ,支持长宽比大于2:1(实验) ,支持iw,用于权衡图像提示与文本提示样式和V5的提示 。
今天的测试基本上是一个“Pro”模式的模型。
它比v3和v4更加“无偏见”,并且经过调整以提供广泛的输出多样性,并且对您的输入非常敏感。-这里的权衡是,它可能更难使用。短提示可能不太管用。你应该试着写更长的、更明确的文字来描述你想要的东西(比如:“带有戏剧性灯光的电影照片”)。
请在提示聊天中相互聊天,以了解如何使用v5。
我们希望在v5中有一个“友好”的默认样式,然后再切换到默认样式。当这种情况发生时,我们仍然会让你关闭它,回到今天的“原始”模式。请注意 这是一个alpha测试,事情将会改变。不要依赖于这个确切的模型是可用的在未来。当我们将V5发布到完整版本时,它将进行重大修改。
目前没有V5上采样器,V5的默认分辨率与升级后的V4相同。如果你点击“高档”,它会立即给你一张图片。社区标准: 这个模型可以产生比我们之前发布的任何东西都更真实的图像。
我们增加了版主的数量,改进了版主工具,并将更加严格和严格地执行我们的社区标准。不要做个混蛋,也不要制造戏剧性的画面。关于V5的更多信息:V5是我们在AI超集群上训练的第二个模型,已经工作了5个月。它使用了明显不同的神经结构和新的美学技术。V5不是最后一步,但我们希望你们都能感受到我们人类集体想象力中一些深刻而深不可测的东西的进步。等等,我有更多的信息提供。
第四步
基本参数宽高比—Aspect,或—ar更改生成的宽高比。混沌—混沌<number 0 - 100>改变结果的变化程度。更高的值会产生更多不同寻常和意想不到的世代。没有—没有负面的提示—没有植物会试图从图像中移除植物。质量—质量<。25, .5, 1,或2>,或—q <。25、0.5、1或2>你想要花费多少渲染质量时间。缺省值为1。较高的值成本更高,较低的值成本更低。Seed—Seed < 0-4294967295之间的整数> Midjourney机器人使用种子号来创建一个视觉噪声场,就像电视静态一样,作为生成初始图像网格的起点。种子号是为每个图像随机生成的,但可以用—Seed或—sameseed参数指定。使用相同的种子号和提示符将产生相似的结束图像。Stop—Stop < 10 - 100之间的整数>使用——Stop参数在进程中途完成Job。在较早的百分比停止作业可能会产生模糊,不太详细的结果。
Style - Style <4a, 4b或4c>在Midjourney模型版本4的版本之间切换Stylize - Stylize 或-s 参数影响Midjourney的默认美学风格在乔布斯上的应用程度。当选择U按钮时,使用另一个“light”升级器。结果更接近原始网格图像。升级后的图像细节更少,更平滑。当选择U按钮时,使用一个可选择的beta升级器。结果更接近原始网格图像。升级后的图像添加的细节明显更少。默认值(模型版本5)纵横比混沌质量种子停止样式程式化默认值1:1 0 1随机100 4c 100范围任何0 - 100 .25 .5 1或2个整数0 - 4294967295 10 - 100 - 0 - 1000纵横比大于2:1是实验性的,可能产生不可预测的结果。
兼容性模型版本&参数兼容影响初始代影响变化+混音版本5版本4版本3测试/ TestpNiji马克斯长宽比✓✓1:2或2:1 5:2 2:5 3:2或2:3 1:2或2:1混乱✓✓✓✓✓✓形象重量✓✓✓✓没有✓✓✓✓✓✓✓质量✓✓✓✓✓种子✓✓✓✓✓✓Sameseed✓✓停止✓✓✓✓✓✓✓风格4 a和4 b风格化✓默认0 - 1000 = 100 0 - 1000默认= 100 625 - 60000默认= 2500)1250 - 5000默认= 2500)瓷砖✓✓✓✓视频✓✓网格的数量图片- - 4 4 4 2(1时宽高比≠1:1)但等一下,我有更多的信息提供。
第五步
好了,现在我将给你一些在《Midjourney V5》中使用的提示的例子。行吗?
第六步
Prompt 1: 超广角,20世纪70年代夏威夷美女的现代照片。这张照片是由玛丽·雪莱用尼康D5100相机拍摄的,使用光圈off/2.8, ISO 800,快门速度为1/100秒。UHD dtm HDR 8k --ar 2:3 --v 5
Prompt 2:一个蒸汽朋克的灵感,未来的战斗准备摩托艇掠过水面与激烈的存在。复杂的齿轮和黄铜配件装饰着它的船体,展示了先进技术和维多利亚美学的完美结合。这个现实主义的杰作在阳光下闪闪发光,准备行动。 --ar 16:10 --s 50 --v 5 --q 2
Prompt 3:史诗般的背景艺术,简单的黑客主题,神圣的配色方案,神秘的代码,字母数字序列,魔术,高质量的4k,渲染值-v 5 -ar 9:16
Prompt 5:全身金发美女,穿着棕色夹克,摄影,佳能EOS 5D Mark IV单反相机,EF 50mm f/1.8 STM镜头,分辨率3040万像素,ISO感光度:32000,快门速度8000秒-- - 9:16 – -放大-- -v 5。
Prompt 6::哈苏24mm全身摄影,华丽满意的非洲女性,细致自然的皮肤,素颜,细致的眼睛,长长的辫子–ar2:3–q5–v5–v4。
Prompt 7:美丽的暗红色日落在海边的夜晚,复杂的,惊人的,美丽的,逼真的,超高分辨率,广角,景深,π动态照明-ar 1:2 -v 5
你现在能理解《Midjourney》提示词是怎么构成的吗?是或否
第七步
太好了。以下是更多关于《Midjourney》提示的例子。
Prompt 1:哈苏24mm全身摄影,华丽满意的非洲女性,细致自然的皮肤,素颜,细致的眼睛,长长的辫子–ar 2:3 --q 5 --v 5 --v 4.
Prompt 2:美丽的暗红色日落在海边的夜晚,复杂的,惊人的,美丽的,逼真的,超高分辨率,广角,景深,动态照明-ar 1:2 -v 5
Prompt 3:一个惊人的,超逼真的照片,一个凶猛的维京战士一丝不苟地磨砺他的强大的刀片在崎岖不平的,野性野性的斯堪的纳维亚景观的荒野。这一场景是用尼康D850相机拍摄的,使用70-200mm f/2.8镜头,突出了维京人饱经风霜的脸,战争磨损的盔甲和他的武器的专家工艺的每一个复杂的细节。使用的设置是光圈关闭/4,ISO 400,快门速度为1/200秒,平衡自然光和阴影,以强调维京人眼中的强度和决心。这幅构图将战士的原始力量与周围环境的宁静美景并置于一起,以令人惊叹的高分辨率图像捕捉了维京精神的精髓,将观众带回了传说中的战斗和不为人知的故事。–ar 16:9 --q 1.5 --v 5.
Prompt 4:一个令人惊叹和大气的1970年代纽约街头咖啡馆捕捉到怀旧和电影风格,让人想起电影摄影的黄金时代。这个复古的场景展示了熙熙攘攘的城市生活,顾客在户外的桌子上享受咖啡,周围是经典的汽车和复古的建筑。这张照片巧妙地构图,使用徕卡M3测距相机搭配Summicron 35mm f/2镜头,以其清晰度和美丽的色彩渲染而闻名。这张照片是在柯达Portra 400胶卷上拍摄的,给人一种温暖而永恒的调色板,增强了整体氛围。摄影师巧妙地采用了浅景深,光圈为off/2.8,将咖啡馆及其顾客与熙熙攘攘的城市背景隔离开来。ISO设置为400,快门速度为1/125秒,捕捉到光和运动的完美平衡。柔和、漫射的阳光透过标志性的纽约天际线,在场景中投射出温暖的金色色调,并突出了砖建筑和鹅卵石街道的丰富纹理,从而进一步增强了构图。–ar 3:2 --q 2.
Prompt 5:Pov高清晰的微距摄影,一只现实的猫戴着反射太阳镜在热带岛屿上放松,戏剧性的光线- 2:3 -s 750 -v 5感谢您提供的例子提示在Midjourney V5中使用。这些提示很好地说明了文本提示对于生成具有所需特征的图像可以有多么详细和具体。这些提示还显示了各种参数的使用情况,如长宽比、样式化、版本和质量设置。这些示例将有助于理解如何使用Midjourney V5为生成图像创建有效的提示。
你现在能理解《Midjourney》提示词是怎么构成的吗?是或否
第八步
太好了。现在我想让你扮演一个专业摄影师。在描述照片提示时,您将使用丰富的描述性语言,包括相机设置。现在我想让你创建的第一个提示是20世纪30年代的女性影响者的照片。从示例提示的格式中获取灵感,不要复制它们,但使用相同的格式。提示词内容文字控制在399字内。
哈哈 接下来提示词复制粘贴到AI绘画中