尝鲜 midjourney 体验生成 csdn logo
起因 准备 无目的的尝试经历 第一次尝试 注意到字母总是缺失 先跳过字母的问题,尝试一下其他提示 扩大提示范围 开始收束场景 和门较劲 再次去掉一些干扰 第一阶段尝试复盘 再次尝试得到精确结果 其他乱七八糟的结果展示起因
起因是在问答里,邹大佬发了个提问,怎么让 midjourney 生成一个带有 csdn 字样的图片,问答内容见:https://ask.csdn.net/questions/7908499
老顾是自己么有玩过任何人工智能产品的,什么 gpt 什么 openai 之类的,完全没用过,所以老顾一开始的回答,现在看起来贼拉天真:
用“csdn” 四个字母,生成一个印章图
用“csdn”四个字母,生成一个橘黄色的,花体字母印章,最后生成 icon 格式
估计是被邹大佬暗地里鄙视了,彻底无视我的回答了。嗯,正好闲着也是闲着,就看看这个 ai 产品到底是个啥。于是老顾自己就翻墙头出去转了转。
准备
直接百度了一下 midjourney ,就会有这个域名网站出现,嗯应该也不会有冒充的了吧,直接过去,然后就是登录或注册一个账号。老顾都不记得自己啥时候注册过这个账号了。。。一注册,提示信箱被占用?行吧,那就直接登录,然后体验一下 ai 绘画是个啥高科技。
点这个 join the beta 就可以提前尝鲜了,有时候进去的时候,还有个机器人验证,自己处理就好。
无目的的尝试经历
第一次尝试
因为是第一次尝试吗,完全是无目的的,就奔着有 csdn 四个字母生成了就好,于是第一个提示词就冒出来非常简单的描述:
write the letters CSDN
draw a rainbow with title CSDN
注意到字母总是缺失
write the word ‘c.s.d.n’
然后就尝试了输出一个单字母,离离原上谱的事发生了,能被认可为字母D的图片居然只有四分之一的结果反馈
write the letter ‘D’
先跳过字母的问题,尝试一下其他提示
write the characters ‘C.S.D.N’ in order, use orange color,use stone materail
老顾这个时候还是很乐观的,还没注意到单词 character 还有形容演员的意思。。。
show me a diamond with the title ‘C.S.D.N’
直接被教育了,这个 ai 会按照自己的逻辑给你写字母。。。老顾已经开始挠头了,还在群里被当面嘲笑了。。。
这个时候,老顾对ai已经有了一个简单的认识了
我的感觉就是,肢体控制非常好的婴儿
带孩子搭积木就有这种心累的感觉
在老顾尝试生成 csdn 四个字母的时候,还有几个人也在各种和字母顺序较劲的,总之都不能得到满意的结果,老顾自己继续尝试,看看到底什么东西的影响最大,什么提示能最接近,先尝试扩大范围吧
扩大提示范围
write the charactors C.S.D.N,over a iron door
draw a black iron door,then write the letters ‘C.S’ at left,and write the letters ‘D.N’ at right
carve the title above a black iron door with letters ‘C.S.D.N’
carve the charactors C.S.D.N on a stone by orange color
算了,也许是老顾英语人没理解呢?换个写法看看
on a big stone,carve C at left ,carve S.D at above,carve N at right
然后突然想到,用 json 试试?
{background:moon,title:CSDN,color:orange,size:cover}
font color is orange,the caractors is C and S and D and N
background is earth,write the charactors C S at left and write the Charactors D N at right
coding the charactors C S D N,and render it by orange color
到了这里,老顾终于明白了,如果无目的的尝试,那么永远不会得到结果了,那就进入到下一阶段的尝试,收束尝试方向
开始收束场景
老顾开始琢磨,在一个固定的场景里,生成的结果应该是相对可控的,于是老顾就固定了一个 black iron door 的场景
和门较劲
这里出现了一次 CSDIN,我当时差点以为成功了,虽然位置不对,信息干扰也很多,但总算接近了
再次去掉一些干扰
然后老顾开始尝试,仅仅写字母,看看能否实现,于是继续尝试
draw a black iron door with the designer’s name ‘C.S.D.N’,and with the title ‘C.S.D.N’ in order,the title is four letters,and only use the letters ‘C.S.D.N’,without all of other letters
the designer’s name ‘C.S.D.N’,and with the title ‘C.S.D.N’ in order,the title is four letters,and only use the letters ‘C.S.D.N’,without all of other letters
又一次以为成功了,发现 CD 在下边,SN 在上边,就很郁闷,但是,老顾就不换提示词了,就按这个多生成几次看看如何
一个很像 CSDN 的图出现了,结果问哥说这个是 CSDV。。。。算了,继续
同样的指令,在多次尝试后,终于出现了一次合适的结果
至此,第一阶段尝试结束
第一阶段尝试复盘
在使用了一段时间,现在可以总结一下经验了
1、ai 绘图,是根据提示词触发
2、个人感觉,提示词在被 ai 接收后,会对提示词进行语法、词汇验证纠错
3、纠错是一个复杂的过程,这个绘图 ai 不认识 csdn 这个机构,所以他会认为 csdn 是一个错误的词汇,然后修正成词库中频率较高的相似词,比如 cdn,cnn,csn 之类的
4、这不是真正意义上的创造,这是一个基于算法生成的 ai ,语义分析结果并不是它执行生成的唯一依据
5、在单一场景,干扰较少的情况下,才可能出现预期结果,如果场景复杂,却又需要某些精确内容,则很难实现
6、对于不确定性的结果接受力较高的需求,可以使用这个,但比如带特定文字logo的部分确定性结果的需求,暂时还无法在预期时间或次数中得到
7、即使输入的单词是正确的,他也不会完全按照单词进行拼写,这是这个 ai 可以进行所谓创造的根源性条件,以期可以得到更多的不同内容
再次尝试得到精确结果
由于修正机制的存在,对不再词库的短语,很难得到一个确定的结果,一番尝试都没能再得到第二次符合预期的内容
一个 rolling 就将这个机制解释的八九不离十了。。。。。
在老顾尝试的期间,不少人都在尝试确定字母的内容,成功者寥寥无几,老顾能撞大运的成功一次,也不知道是什么道理
由于筛子机制的存在,修正机制的存在,知识库更新机制的限制,语言理解的偏差等等方面的影响,即使是同一个结果,也很难再次复现出来了。