最近两个最流行的AI图像生成器,Midjourney和Stable Diffusion,都发布了重大更新。Midjourney v5.2引入了许多新功能,包括“缩小”功能、“/缩短”命令、改进的图像质量等。
Stable Diffusion XL (SDXL) 0.9则专注于改善图像质量和构图。新模型使用更大的数据集和更强大的算法,生成的图像更清晰、更真实、更有凝聚力。
那么哪个AI图像生成器更好呢?今天我将比较SDXL 0.9和MidJourney v5.2。
1、肖像
A beautiful young and cute attractive girl with ginger braided hair in a bun wearing glamorous makeup, watching the sunset at Santorini, Greece. Looking at the camera, half body, photorealistic
虽然这一直是SDXL的弱项。但这两模型都超出了我的预期,提供了惊人的结果。但是SDX脸颊上精致的雀斑和还有脖子后反射的光线,这可是以前从来没见到的
2、动物
Shot of Vaporwave fashion dog in miami
MidJourney照片更清晰,狗狗的衣服和太阳镜真正体现了迈阿密的氛围。
3、自然景观
Traversing A Frozen landscape, Snowing, Fog, Volumetric Lighting, dramatic, Long-shot, Cinematic, Dramatic, Intricate detail, Rocky, Minimalistic, hyperrealism
这两张图片看起来非常相似。但MidJourney细节更多
4、动漫
1990s anime low resolution screengrab couple walking away in street at night
SDXL更像90年代的风格。但MidJourney更现代
在MidJourney中添加了“- niji”参数,让AI使用niji模型,这个模型官方说是专门用于生成动画插图的,所以可能是这个原因有关。
5、插图
a silly smiling happy cat, impressionist abstract cubism tiny smooth wavy segments made of silk fabric, intricate details, harmonious waves
都不错
6、商业产品
Minimalism, product photo of bottle of coca-cola
右边的图像明显更好。但是这里“Coca-Cola”这个词的拼写准确,这又是一个进步。
7、食物
A cinematic still of a close-up shot of a japanese ramen
SDXL还继续使用动漫风格,这个很奇怪
8、生物
Detailed photo of a creature with the body of a lion and the wings of an eagle cinematic still
两种模型生成的图像很相似。但是MidJourney的细节和表情很到位。
9、时尚
a colorful fashion design with lots of things in it, in the style of surrealistic fashion, candypunk, chaoscore, in style of glamour, endless photo, real life
两种结果都很惊人!
10、3D
A 3d cube shaped hamburger
MidJourney胜出。汉堡看起来很好吃!
总结
两个AI图像生成器的构图和整体美学的匹配程度都非常的高,而SDXL是开源的,而且还在迭代。根据Stable Diffusion团队的说法,v0.9只是一个研究预览版,他们很快就会公布最终版本1.0,这应该是个好消息。
https://avoid.overfit.cn/post/0ee84ee5f8ed49c6b834db706f4c910e
作者:Jim Clyde Monge