最近晓薇的AI群都在晒Flux的图片,因此今天我打算分享一下Flux工具的使用体验,用过的都惊叹抽卡效率大大提升了!
概述
近期,黑森林实验室(Black Forest Lab)重磅推出了全新图像生成模型FLUX.1。
三种版本满足不同需求:性能强劲的专业版、开发者版,以及轻巧高效的快速版。
官网Flux模型样张
黑森林实验室由Stable Diffusion原班人马和StabilityAI前研究员联手打造。
团队的核心信念是开发广泛可访问的模型,促进研究界和学术界的创新和协作,并提高模型透明度。
公司刚完成3100万美元的种子轮融资,并计划不久之后发布SOTA视频模型,这将为市场带来新波澜。
本期晓薇主要分享 FLUX.1 的文生图模型,主要体验官方提到的重大突破部分,如文字、手部细节处理等,还和常用的AI绘画模型进行了对比,感兴趣的小伙伴一起来看看呀!
FLUX 模型介绍
FLUX是Black Forest Labs推出的文本到图像合成模型,以其120亿参数的庞大规模,超越了DALL-E 2和Stable Diffusion等其他主流模型的10亿参数规模。
这一扩展使得FLUX在图像生成的质量和多样性上实现了显著提升。
FLUX包含三个版本:
性能领先的专业版(pro)、适合非商业应用的开发者版(dev),以及专为快速本地开发设计的快速版(schnell)。
这些模型不仅在视觉质量、提示遵循和输出多样性等方面设立了新的行业标准,而且部分模型的开源特性进一步推动了技术的普及和创新。
在ELO跑分评测对比中,可以看见Flux模型表现出色
官方提到,FLUX.1 [pro] 和 [dev] 在“视觉质量、提示跟随、大小/纵横比可变性、排版和输出多样性"均超越了 Midjourney v6.0、DALL·E 3 (HD) 和 SD3-Ultra
应用示例
晓薇针对部分能力做了输出测试,下面看看测试结果
超强的文字生成能力
一只胖胖的仓鼠,拿着一个我要减肥的牌子
从左至右:专业版、开发版、快速版
多人控制能力
经常抽卡的小伙伴肯定知道在多人情况下,会损失脸部细节,看看Flux的表现吧~
真的很惊艳!
手部细节处理
人手一直是多模态生成模型的重灾区。FLUX.1生成的人手表现也相当惊艳!比如握在一起的手,就能难道不少绘图模型
与MJV6.0的模型对比
2只胖仓鼠励志要减肥提示词:
Two fat hamsters, the black hamster on the left holding the “I want” sign, the white hamster on the right holding the “lose weight” sign. Real photo textures, imaginative images, outdoors, cinematic lighting
两只胖仓鼠,左边的黑仓鼠举着“我要”的牌子,右边的白色仓鼠举着“减肥”的牌子。真实的照片纹理,富有想象力的图像,户外,电影照明
这里测试了语义理解和位置指示;每个主体拿着字的具体文字信息,同样的提示词在Flux模型中效果都能理解正确,但是MJV6.0的文字理解能力不如Flux
Flux,专业版、开发版、快速版
Midjourney
手部油画交叠的手提示词:
eye level,classic oil painting, crossed woman’s hands, red jewel ring on ring finger, ornate frame, frame hanging on dark green wall, white slip of paper on right side of frame,“From Flux”
眼睛水平,经典的油画,交叉的女人的手,无名指上的红色珠宝戒指,华丽的框架,画框挂在黑暗的绿色墙上,框架右侧的白色纸条,“From Flux”
这里测试了手的处理细节,语义理解能力,还有文字处理能力,还挑选了MJ生成不错的图,但依然还是Flux略胜一筹
Flux,专业版、开发版、快速版
Midjourney
版本选择
版本介绍
FLUX.1共有专业版、开发版、快速版
FLUX.1 [pro]
FLUX.1[pro]是最先进的一个版本,这个版本提供最先进的性能图像生成,具有顶级的提示跟踪、视觉质量、图像细节和输出多样性。并且官方团队还在增加 API 中 FLUX.1 [pro] 的推理计算。
FLUX.1 [dev] 开发版
用于非商业应用。FLUX.1 [dev] 直接从 FLUX.1 [pro] 提炼而来,具有相似的质量和能力,同时比相同尺寸的标准模型效率更高。
FLUX.1 [schnell]
这是最快的模型是为本地开发和个人使用者量身定制的。FLUX.1 [schnell] 在 Apache2.0 许可下公开可用。
三款模型的价格依次为每张图片0.055美元、0.03美元、0.003美元(约合人民币0.4元、0.22元、0.022元)。
版本价格
Flux有2个合作伙伴, Replicate 和 fal.ai ,收费方式不一样(文末有不同价格的产品体验直达链接)
专业版:
Replicate:0.055 美元/张,按生成的图像数量定价
fal.ai:每百万像素 0.05 美元,1 美元,可运行此模型大约 20 次
开发版:
Replicate:0.03 美元/张
fal.ai:每百万像素 0.025 美元,1 美元,可以运行此模型大约 40 次
快速版:
Replicate:0.003 美元/张,
fal.ai:每百万像素 0.003 美元,1 美元,可以运行此模型大约 333 次
未来展望
上面晓薇测试了不少图了,质量真的很棒,这就更期待黑森林实验室的视频模型(SOTA)了~
未来将进一步拓展FLUX.1的应用场景和能力,该模型将建立在FLUX.1的基础上,以高清和前所未有的速度实现精确创作和编辑!
如何使用
使用很简单,直接打开网页输入提示词就可以了(其他默认就好了),上面提到有2个合作方,默认的操作界面稍微不一样,小伙伴们随意挑选就好,体验下来,3个版本的生成速度都超级快~
合作方 replicate 默认操作界面
合作方fal.ai 默认操作界面
写在最后
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
感兴趣的小伙伴,赠送全套AIGC学习资料和安装工具,包含AI绘画、AI人工智能等前沿科技教程,模型插件,具体看下方。
一、AIGC所有方向的学习路线
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
总结
**Flux工具使用体验总结**近期,AI社群热议的Flux模型源自黑森林实验室(Black Forest Lab),尤其是其推出的FLUX.1文本到图像合成模型,引发广泛关注。Flux以其120亿参数的规模,远超DALL-E 2和Stable Diffusion等主流模型,显著提升了图像生成的质量和多样性。
**核心亮点**:
- **版本多样**:Flux提供专业版、开发版和快速版,适合不同需求的用户群体,从性能追求到快捷体验,全面覆盖。
- **卓越性能**:在视觉质量、提示跟随、输出多样性等方面表现出色,特别是在文字生成、手部细节处理上,远远超越了当前诸多竞品,如Midjourney v6.0。
- **广泛应用**:不仅适用于艺术创作,还计划进一步拓展到高清视频模型,未来将在更多领域展现强大潜力。
**使用体验详述**:
- **文字生成能力**:通过具体例子如“胖胖仓鼠拿牌子”的测试,Flux各版本均展现出强大的理解力和精准度,图文对应准确无误。
- **多人控制能力**:即便在处理复杂场景如多人脸部细节时,Flux依然能保持高分辨率和高还原度,细节处理令人赞叹。
- **手部细节处理**:着手解决了多模态生成中的难题,生成的手部图像细腻自然,极大提升了图像的准确性和艺术美感。
**版本选择建议**:
- **专业版**:适合需要顶级性能的用户,支持最先进的图像生成能力,适合专业设计师和艺术家使用。
- **开发版**:面向非商业应用,性能接近专业版但价格更亲民,适合科研人员及爱好者使用。
- **快速版**:专为本地开发和个人使用设计,速度极快且成本极低,是学习研究和日常创作的理想选择。
**未来展望**:
随着Flux技术的不断进步,特别是即将推出的高清视频模型,其应用场景将进一步拓展。AI技术的深度融合,将推动游戏、计算乃至更广泛领域的革新与发展,为程序员和创造者提供更多可能。
**使用体验小贴士**:
Flux使用非常简单,直接通过网页输入提示词即可快速生成高质量图像。合作伙伴Replicate和fal.ai提供了不同的界面和操作方式,用户可根据个人喜好选择。
**福利分享**:
为了让更多对AIGC技术感兴趣的朋友快速入门,本文还精心准备了全套学习资料和工具,包含学习路线、必备工具、学习笔记、视频教程以及实战案例等,助力大家轻松掌握AIGC技术精髓。