大家好,我是程序员晓晓
最近,AI绘画界发生了大事,Stable Diffusion原班人马官宣创业新公司!
3月宣布从Stability AI出走的Robin Rombach,就是Stable Diffusion的两个主要作者之一,和十来个原公司小伙伴,正式宣布了组团创业的消息。
新公司名叫Black Forest Lab,黑森林实验室。一亮相就kuku发了一个系列、共3款图片生成模型,其中有2个开源。
而且支持中文输入。
效果怎么样?看过的网友称很狂野(wild)!
输入提示词,一次测试出了画面效果和人脸数据等安全措施:
一名十多岁戴着滑雪面罩的女孩在谷仓里做折纸手工。图片底部有指定的黄色文字。背景中有个相框,里面是奥巴马的照片。
单是看了这组图文对照,就有网友感慨,这是他看过最棒的图像生成效果。
要说这家公司的特色,就是主打一个不遮遮掩掩。
FLUX开源模型我已经打包好了,需要的小伙伴可以看文末扫描免费获取哦
今天官宣成立,今天发布系列模型,还宣布了融资进度——
已经完成3200万美元融资,由a16z领投, Oculus VR联创Brendan Iribe、YC前合伙人Garry Tan、NVIDIA Research领导计算机图形研究小组的Timo Aila、苹果杰出科学家(英特尔智能系统前首席科学家)Vladlen Koltun等人投资。
可以说,黑森林既得到了资本市场的押注,也得到了业界大佬们的青睐。
AI大牛卡帕西也在线发来贺电,还顺道称赞了一下黑森林的新模型:
歪瑞古德!开源的FLUX.1 image gen模型看起来非常强大。
而且注意了,开源协议是宽松的Apache2.0。
黑森林图像生成模型首秀
卡帕西都觉得exciting了,让咱来视觉感受下黑森林的模型效果。
这里,我挑选了五种类型的生成效果展示,图片均由官方提供,未标明具体使用了旗下哪款模型。
第一关,文字生成。
提示词:旧教室黑板的照片。黑板上用粉笔写着“let’s make some really pretty stuff
together”,词后有一个红色的粉笔心。阳光从窗户照进来。
第二关,非真实场景+文字生成。
提示词:水下场景中,两只猫头鹰坐在一张精美的餐桌旁,餐桌中央点燃了蜡烛,两只猫头鹰正在一起享用一顿美味的晚餐。左边的猫头鹰穿着燕尾服,右边的猫头鹰穿着漂亮的裙子。背景中有一艘潜艇驶过,其侧面画有“What a Hoot”字样。桌子下面的图像底部有小水母在游动,电影般美丽的数字艺术品。
第三关,现实世界真实场景。
提示词:弗莱堡一条美丽街道的照片,一辆有轨电车经过,人们有的散步有的骑自行车。
第四关,真实人物和动漫人物生成。
提示词:三位女士在市中心街道上拍摄的照片,她们把手伸向镜头。
提示词:美丽的动漫艺术品,一个可爱的猫娘,看起来很沮丧,手里拿着一张纸,上面画着微笑,她快要哭了。
第五关,动物形象生成。
提示词:森林里的一只山猫,由专业摄影在强光下拍摄。
提示词:近距离渲染一个神话生物,由详细的螺旋分形和卷须组成,详细的递归皮肤纹理
FLUX.1系列模型
此次,黑森林共发了FLUX.1系列的3个模型:pro、dev、schnell。
FLUX.1 [pro]:系列最强。
FLUX.1系列的精华,提供最优性能的图像生成,具有一流的指令遵循、视觉质量、图像细节和输出多样性。
黑森林团队正缓步提升API中FLUX.1 [pro]的推理计算能力。
此版本可以通过Replicate和fal.ai访问;提供专用和定制的企业解决方案。
FLUX.1 [dev]:系列中杯。
一个允许非商业途径使用的模型,开放权重、经过蒸馏。
[dev] 直接从[pro] 中蒸馏而来,具有相似的质量和迅速的遵守能力,同时比相同尺寸的标准模型更高效。
可在抱抱脸上试玩,或直接在Replicate或fal.ai上试用。
FLUX.1 [schnell]:速度小旋风。
系列最快模型,为本地开发和个人开发者量身制作。
FLUX.1 [schnell] 在Apache2.0许可证下公开可用,模型权重可以前往抱抱脸查询,推理代码可以在GitHub上找到。
目前该模型已经获得了ComfyUI的支持,可以直接使用。模型文件我已打包好了,需要的小伙伴可以直接扫描免费获取哦
来个直观感受!
这里放三张照片,是以上大杯、中杯、小杯在不同提示词下,围绕“蛋糕”这个主题的生成效果。
△从左至右,使用模型依次为大、中、小杯
黑森林称,所有FLUX.1模型都基于多模态和并行扩散Transformer块的混合架构,并扩展到12B参数。
3款模型中,FLUX.1 [pro] 和 [dev] 在视觉质量、提示响应度、尺寸/长宽高比列灵活性、排版和输出多样性这些方面,超过了Midjourney v6.0、DALL·E 3 (HD) 和 Stable Diffusion 3-Ultra。
而FLUX.1 [schnell] ,被团队称为“迄今为止最先进的少步骤模型(few-step model)”。
它不仅在同类竞争对手中脱颖而出,还超越了更强大的非压缩模型,如Midjourney v6.0和DALL·E 3 (HD)。
整个FLUX.1系列都经过了专门的微调,以求保留预训练阶段的全部输出多样性。
有人免不了要问了,你们是Stability AI的OG元老,是核心成员。
So,你们这新模型,跟人家旗下的Stable Diffusion有啥区别?
创始团队成员在Reddit上进行了回应:
即使是我们的最弱型号schnell,生成质量也更好,生成速度也更快。
主打一个我成立新公司超越我自己
感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
一、AIGC所有方向的学习路线
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
总结
### 文章总结:黑森林实验室携FLUX模型强势来袭**摘要**:
- **创业背景**:Stable Diffusion核心成员Robin Rombach携团队成员成立新公司Black Forest Lab(黑森林实验室),推出三款图片生成模型,其中两款开源,并支持中文输入。
- **模型发布与融资**:新公司一经成立即发布FLUX.1系列三款模型(pro、dev、schnell),同时宣布完成3200万美元融资,由多家知名投资机构领投。
- **模型特色与效果**:FLUX模型在视觉质量、图像细节及生成速度上均表现出色,获得业界及网友好评。模型支持多种类型图像生成,包括文字描述场景、非现实场景、现实景色、人物及动漫风格、动物与神话生物等。
- **模型对比**:与Stable Diffusion相比,即使FLUX系列中的 speediest 模型 schnell 也展现出更高的生成质量和速度。
- **开源与社区支持**:开源协议为Apache2.0,部分模型开放免费获取,展示了对社区的友好态度和开放精神。
- **未来展望**:随着AIGC技术的不断发展,黑森林实验室的技术将在更多领域得到应用,对程序员及AI技术从业者具有重要影响。
**亮点与影响**:
1. **创业速度与效率**:团队成员从稳定性AI离职后迅速成立新公司并发布产品,展现了高效率和创新精神。
2. **技术实力**:新模型FLUX在性能及图像质量上实现超越,预示着更强大的AI图像生成能力。
3. **社区与开源**:支持和推动开源文化,为AI技术研究者和爱好者提供学习与实验平台。
4. **融资与资本认可**:高额融资和多家知名投资机构的支持,显示了市场和资本对黑森林实验室及AI技术发展的信心。
**对从业者及学习者的建议**:
- **关注前沿技术**:保持对AIGC等前沿技术的关注,了解行业动态。
- **动手实践**:除了理论学习外,应结合实战案例进行操作,提升实战能力。
- **利用资源**:充分利用提供的学习资料和开源工具,加速个人成长和技术进步。