theme: smartblue
点赞 + 关注 + 收藏 = 学会了
前两天,快手开源了一个AI绘画模型 Kolors,中文名叫“可图”。该模型基于数十亿图文对进行训练,支持256的上下文 token 数,支持中英双语,还支持在图片中生成中文???。
专家对 Kolors 的评分也很高,反正 Kolors 就是非常能打。
⚡️ 仓库地址放这:https://github.com/Kwai-Kolors/Kolors
有兴趣的工友可以先自行了解一下。
但本文先不讲怎么在本地运行这个模型,这个留到下一篇再讲。
考虑到有些工友的电脑配置不支持运行这个模型,本文先介绍一下 Kolors 官网提供的绘画功能。
⚡️ Kolors 官网地址:https://kolors.kuaishou.com/
打开 Kolors 官网用手机号注册一下就可以了。
从 Kolors 官网顶部可以看到它支持常见的文生图之外,还提供了AI形象定制。
先试试生成含有文字的图片。之前我体验过 Meta ai ,它能生成含有英文的图片,但让它生成中文会出现乱码。
让它生成含有中文的图片,只能用来骗不懂中文的老外~
前段时间 Stability AI 发布的 SD3 模型也同样存在这个情况,对中文不友好。
作为国产之光,Kolors在生成含有中文的图片还是有一手的。
我用官方提供的提示词试了一下。
咒语:街边的路牌,上面写着“天道酬勤”
试试英文,用 SD3 提供的咒语。
咒语:教室里桌子上一个红苹果的电影照片,黑板上用粉笔写着“go big or go home”。
这里需要说明一点,Kolors 官网好像不支持输入全英文提示词,所以我将 SD3 提供的那句 “cinematic photo of a red apple on a table in a classroom, on the blackboard are the words “go big or go home” written in chalk.” 改成中文了。
效果一般,这个提示词我抽了4次卡,每次抽4张,文字的精准度没有 SD3 的效果那么好。
我在之前介绍 SD3 的文章 里抽了一张卡,生成的文字相对来说还是比较准的。
那再测一下 Kolors 的中文,来个更复杂的文字。
同样拿 Kolors 官方给出的提示词,改了一下要生成的文字。
咒语:一张瓢虫的照片,微距,变焦,高质量,电影,瓢虫拿着一个木牌,上面写着“雷猴” 的文字
我抽了几次卡,拿了效果最好的一次出来展示。“雷”字出来的效果很准确,但“猴”字我就没抽到正确的卡。看来复杂的文字现阶段还是无法生成。
总体来说,在生成含有文字的图片这个环境中,Kolors 也属于第一梯队里的选手,相对来说更擅长生成中文。
接下来拿 Kolors 和 Midjourney 比较一下。
拿我之前在 MJ 中生成的乐高风格马里奥壁纸对比。
咒语:
(LEGO), a Mario, wearing a yellow takeaway costume, riding a motorcycle, street corners at night, pouncing to viewer, top view, anthropomorphic, classic composition, masterpiece, exquisite, color correction, photo real, photo real, amazing visual effects, crazy dletails, intricate details, sharp focus
中文版:
(乐高),一个穿着黄色外卖服装的马里奥,骑着摩托车,夜晚的街角,车辆朝着观众的方向前行,俯视图,拟人化,经典构图,杰作,精美,色彩校正,照片级真实,照片级真实,惊人的视觉效果,疯狂的细节,复杂的细节,焦点清晰。
下面这张是用 MJ 生成的。
再看看 Kolors 的效果。
从出图的风格上,我更喜欢 Midjourney,但由于 Midjourney 太清楚马里奥是谁了,生成的角色就是马里奥本身,忽略了“乐高”这个词,也忽略了“黄色外卖服装”。
而 Kolors 显然更听我话。
那如果我想让 Midjourney 生成的图和我的提示词融合一下有什么方法呢?
Kolors 提供了垫图功能。鼠标放在页面左侧的工具栏,往下滚动鼠标滚轮就能看到“上传参考图”,把 Midjourney 生成的那张图传上去,调整一下“参考强度”的值,这个值越大,生成的图就越偏向参考图。
在这个例子里我将“参考强度”设置为0.4,再此点击生成。
衣服和帽子是黄色的,人物身体和摩托车更偏向“乐高”风格,而人物的脸以及场景更像参考图。
接下来我要试试胡言乱语,我将提示词输入框的“试试这些主题”的词语都输入进去再生成图片。
看得出来它已经尽力了,除了“新娘”没出现,其他元素都融合得不错。
上点难度,生成手!
之前写了一篇 《推荐十几款AI绘画应用》 的文字,里面用到的提示词是“1 girl, full body, hand”。
看看 Kolors 能做到什么效果。
好家伙,玩坏了。
经过我不懈努力终于生成到几张带有手部到图。
右上方的图片我觉得挺完美的。右下方的图片粗略看还行,但仔细看就会发现她有6根手指。
最后玩一下“AI形象定制”。
我将 Kolors 首页的示例图传到“AI形象定制”里,选了“粘土世界”风格。
出来的效果还是挺不错的,而且也没有复杂的配置,可以拿自己的照片去试试,用来生成个头像还是挺好玩的。
点赞 + 关注 + 收藏 = 学会了
总结
### 文章总结:快手开源AI绘画模型Kolors(可图)**主题**: smartblue
**核心内容**:
- **快手开源AI绘画模型Kolors(可图)**:Kolors基于数十亿图文对进行训练,支持256的上下文token数和中英双语,尤其擅长在图片中生成中文内容。
- **专家评分高**:Kolors在AI绘画领域表现出色,得到了专家的高度评价。
- **仓库地址**:[https://github.com/Kwai-Kolors/Kolors](https://github.com/Kwai-Kolors/Kolors)
- **官网体验**:无需在本地运行,可通过Kolors官网([https://kolors.kuaishou.com/](https://kolors.kuaishou.com/))直接体验其主要功能。
**主要功能介绍**:
1. **图文生成**:
- **中文支持**:相比其他国际模型,Kolors在生成含有中文的图片上具有明显优势。
- **测试案例**:通过输入“街边的路牌,上面写着‘天道酬勤’”等提示词,成功生成含中文字符的高质量图片。
2. **英文对比测试**:
- 使用类似SD3模型的英文提示词,发现Kolors在处理全英文输入时效果一般,但对中文的精准度更高。
3. **复杂文字测试**:
- 尝试生成“瓢虫拿着一个木牌,上面写着‘雷猴’”的图片,结果显示“雷”字准确,但“猴”字生成不够准确。
4. **与Midjourney的比较**:
- Kolors更忠实于用户的提示词,如在生成乐高风格马里奥时,比Midjourney更贴近用户描述的“乐高”和“黄色外卖服装”。
- **垫图功能**:可以上传Midjourney等模型的生成图作为参考,通过调整“参考强度”来融合不同的绘画风格。
5. **AI形象定制**:
- 支持用户自定义形象并生成不同风格的头像,如“粘土世界”风格,效果令人满意。
**总结感受**:
- Kolors在AI绘画领域展现了强大的中文处理能力和对用户提示的高忠诚度,特别是在生成中文图片方面表现优异。
- 提供了便捷的官网体验和实用的功能,如垫图功能和AI形象定制,适合广大AI绘画爱好者尝试使用。