3月16日下午,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰出席,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
从现场展示来看,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异。
我们本次用到的就是百度的ERNIE-ViLG AI 作画大模型,通过申请官网api权限,使用Python生成画作。
官网:https://wenxin.baidu.com/ernie-vilg
咱们先看下生成的图,都是通过输入文字,然后文心作画大模型理解,最后作画。
看完图,我们说下本次尝鲜的感受,最后我们讲解怎么申请api权限,在使用过程,可能是文档还未完善完全,导致踩得坑还是很多,大家要注意。
1、【文本生图】睡莲,油画(1024*1024)
2、【文本生图】森林中的别墅,赛博朋克(1024*1024)
3、【文本生图】制造业数据大屏,像素风格(1024*1024)
4、【文本生图】炫酷的机甲,low poly(1024*1024)
5、【文本生图】地球到月球的电梯,low poly(1024*1024)
6、【文本生图】程序员忙碌工作,low poly(1024*1024)
7、感受
第一次作画不知道是什么原因,提示需要等待4分钟,但是最终25分钟才出画。后续的出画速度还是可以的。画出来的图,个人感觉很不错了,第三幅画可能是我描述的不清楚导致很失败。
和ChatGPT对比,就像百度创始人、董事长兼首席执行官李彦宏所说的和ChatGPT的差距还是比较大的,相信百度的文心一言能迎头赶上。
可以说百度这次是硬刚ChatGPT!文心一言能否为百度止颓?中国版ChatGPT“狂飙”的机会在哪儿。
通过本次调用问心大模型作画,感觉百度的优势还是很明显,能在短短一个月能实现这个功能,已经非常牛逼了,相信百度不说超越ChatGPT,但是和ChatGPT站在同一水平是没有问题的。大家觉得呢,欢迎留言沟通。
8、申请API流程和注意点
8.1、进入api
https://wenxin.baidu.com/ernie-vilg
8.2、进入个人中心
8.3、创建Api key
这里注意,刚开始您是没有ApiKey的,点击创建Api key可能还会没反应,可以看下请求日志,提示没有同意“服务协议”,这个就很坑,这个服务协议是在首页,等会就会弹出,然后勾选,再创建Api Key
8.4、使用代码创建画作
在本地Python环境调用接口
安装wenxin-api工具包
pip install --upgrade wenxin-api
*注意:建议python版本在python 3.7及以上版本
普通的文生图
# -*- coding: utf-8 -*
import wenxin_api # 可以通过"pip install wenxin-api"命令安装
from wenxin_api.tasks.text_to_image import TextToImage
wenxin_api.ak = "your_ak"
wenxin_api.sk = "your_sk"
num = 1
input_dict = {
"text": "睡莲",
"style": "油画",
"resolution":"1024*1024",
"num": num
}
rst = TextToImage.create(**input_dict)
print(rst)
执行代码,等待或者回报错
如果成功就会提示
/Users/liuchao/.pyenv/shims/python /Users/liuchao/java/tool/python/wenxin_test.py2023-03-16 19:13:01,353 - model is painting now!, taskId: 14743813, waiting: 6m
2023-03-16 19:13:22,152 - model is painting now!, taskId: 14743813, waiting: 1m
{'imgUrls': [' https://wenxin.baidu.com/younger/file/ERNIE-ViLG/6ec1c5ad0f53dcb9d15984fefced42abex']}
Process finished with exit code 0
如果失败,我遇到的就是风格错误,这里的风格一定要选择首页有的,但是首页有的也可能报错