当前位置:AIGC资讯 > AIGC > 正文

比肩Midjourney-v6!没有GPU也能跑可图Kolors

比肩Midjourney-v6,快手的文生图开源模型可图Kolors一发布,开源社区就炸开了锅。短短几天,可图在Github上收获2k Star,Huggingface模型下载热榜第一。

7月6日,快手宣布开源数十亿参数的文生图模型可图Kolors,可图支持中英文双语,支持长达256 token的上下文长度,最重要的是可以渲染中文,生成效果上实现了质的飞跃。

值得一提的是,可图采用了智谱的开源大模型ChatGLM3作为文本编码器,对中文的理解能力远超很多竞品。

国产文生图模型的强势崛起让人振奋,不过,由于硬件等客观条件限制,大多数跃跃欲试的用户却很难在本地部署并体验可图。

首先,可图模型完整下载有28G,下载模型、存放模型比较不方便;其次,可图采用的ChatGLM3代替了传统的CLIP模型做文本提示词嵌入,语义能力增强的同时显存消耗也从原来的几百MB变成十几G,这样,本地显存少于20G的用户,需要用有损量化或者损失推理速度的办法运行可图。

为了让用户无痛使用可图,硅基流动团队开源了BizyAir节点,这是一个专用于ComfyUI的节点仓库,首批节点就有可图Kolors。

现在,没有显卡,不用下载模型,你也能用可图极速生成图片。

BizyAir还同步上线了一个小惊喜。考虑到写提示词的环节也很费劲,我们开源了SiliconCloud LLM节点,让GLM4、DeepSeek V2 Chat这类顶尖大语言模型接入ComfyUI,帮助你在工作流中生成、提炼提示词。

以DeepSeek V2 Chat为例,如果用它提炼提示词,需要500G左右的硬盘空间和8张A100以上的显卡才能部署这个模型,而SiliconCloud LLM节点直接提供了这个能力。

除了免去了用户搭配环境、模型下载与模型部署的门槛与烦恼。硅基流动还对Kolors节点提供基于专用的图片生成推理引擎OneDiff优化,节约图片生成时间与成本。

当然,你也可以一键无缝接入已有ComfyUI工作流,并可自由与本地节点做平替或组合。
 

一键直达传送门:

代码:github.com/siliconflow/BizyAir

文档:bizyair.siliconflow.cn

那么,如何在ComfyUI中使用可图Kolors?

只需两大步。

一、安装BizyAir

在ComfyUI Manager中搜索“BizyAir”即可完成安装。

此外,你还可以通过源码、Comfy-cli安装。Windows新手可以下载独立的压缩包,具体可见:siliconflow.github.io/BizyAir/getting-started/

二、快速开始

设置API密钥
 

首次使用,你需要通过“Set SiliconCloud API Key(设置SiliconCloud API密钥)”来生成API密钥(https://cloud.siliconflow.cn/account/ak)。之后,这个节点就可以删除了。之后重启程序,也不需要重新输入。

使用BizyAir节点
 

所有BizyAir节点都在“☁️BizyAir”目录下。其中“☁️BizyAir SiliconCloud LLM API”节点可以利用大型语言模型帮你精炼提示词、翻译或执行任何其他任务。

现在,你也可以添加“Kolors”节点快速进行文生图了。目前,BizyAir提供了与Kolors相关的节点,包括Kolors Sampler、Text encoding、VAE decoding、VAE encoding。

当然,图生图也不在话下。


快试试吧:
github.com/siliconflow/BizyAir
 

其他人都在看

800+页免费“大模型”电子书

文生图王者登场:SD3 Medium正式开源

大模型产品化第一年:战术、运营与战略

国产大模型新标杆!DeepSeek V2重磅升级

最强开源代码模型DeepSeek-Coder-V2问世

20+公司AI产品分析;工程师的LLM使用痛点

国产大模型免费用!开发者Token自由实现了
 


开发生成式AI应用,减少响应时间
就用SiliconCloud

总结

**标题**:快手推出文生图开源模型 可图Kolors引爆社区并打开用户新体验
**摘要**:
快手近日宣布开源了其数十亿参数的文生图模型——可图Kolors,这一进展迅速在开源社区引起热议。可图支持中英文,超长文本渲染,并具有出色的中文理解能力。针对用户本地化部署的困难,硅基流动团队特地推出了BizyAir节点,使得即便没有专用显卡或大量资源,用户也能轻松使用可图生出高清图片。此外,引入的SiliconCloud LLM节点更是简化了工作流程中提示词的自动生成和精炼。如今,开发者社区中的用户已经可以通过简单的两步设置享受到可图Kolors的强大功能。
**关键问题解析**:
- **技术革新**:可图Kolors和智谱的ChatGLM3模型的结合,大大提高了对中文语境下的理解和图像生成能力。
- **部署困难**:受制于硬件限制,普通用户难以本地化部署和运行如此庞大的模型。
- **解决方案**:硅基流动团队开源BizyAir平台和SiliconCloud LLM节点,降低用户门槛,提供无障碍的体验和便捷的工作流程。
**使用指南**:
- **步骤一**:在ComfyUI Manager或通过源码、Comfy-cli安装BizyAir。
- **步骤二**:设置API密钥,并使用BizyAir平台提供的Kolors及相应节点进行文本到图像的快速转换。
**背景资料**:文章中还提及了其他相关的开源进展和大模型的热门应用,如SD3 Medium、DeepSeek V2、DeepSeek-Coder-V2等,表明了国内在大模型和生成式AI技术领域的持续投资和竞争态势。

更新时间 2024-07-21