想和文心一言来一把你画我猜吗?
ChatGPT的爆火,让AI对话模型再次走入大众视野。大家在感叹ChatGPT的智能程度时,总会忍不住想:如果我们也有自己的AI对话模型就好了。在社会的压力下,国内的厂商和研究机构也纷纷做出尝试。最早是复旦的MOSS,随后百度也加入了战场,于3月16日(也就是ChatGPT4推出后不久),文心一言语言模型在新闻发布会上亮相。
据百度相关人士透露,文心一言除了有类似ChatGPT的记忆机制、检索机制、语义学习等能力外,还具备ChatGPT所未有的生成图片及音视频的功能。官方给出的演示效果是这样的,看上去还不错。
但网友们实际上手之后,却发现了许多槽点。这个AI的思维似乎有点不太“接地气”,
比如:
AI把胸有成竹理解成了胸前画了竹叶的男人。
把娃娃菜理解成了蔬菜头的小孩。
再比如:老太太头的老婆饼
真老虎头的虎头虎脑大胖小子(不得不说还挺可爱的)
有点惊悚的夫妻肺片
鉴于AI这种只理解字面意义的奇妙特性,以及其无与伦比的脑洞,网友纷纷玩起了“文心一言版”你画我猜。比如下面这几张图,谜底都是菜名,你能猜到是什么吗?
下面来公布正确答案:剁椒鱼头、红烧狮子头、叫花鸡和小鸡炖蘑菇。大家都猜到了吗?
就在大众用文心一言AI画画寻乐子的时候,有些细心的网友发现了其中的端倪,文心一言似乎是将国外的绘画模型直接套了一个中文的壳,以至于闹出了上述这些笑话。支持这一观点的网友列出了证据:
英文bus,既是总线也是公交车,但如果让文心一言去画总线,得到图是一辆公交车。
同理英文doctor,既是博士也是医生,但如果让文心一言去画博士,得到图是一位医生。
当然,关于这个说法,也有不少网友持反对态度。反对方认为,哪怕是纯用机器翻译,也不会得到像“胸有成竹”之类离谱的结果。
那么,文心一言的绘画模型到底是不是纯换皮呢?从目前的情况来看,大概率并非如此。上述问题完全可以用“没有足够的中文语料”来解释。在AI模型训练上,除了算力,靠谱的数据集也是其中重要的一环。
有人猜测,因为国内缺乏原创免费的公用素材库,许多素材库都是直接爬的外网数据再机翻回来,这些素材进入AI的数据集后,就会导致AI“读不懂中文”的尴尬情况。也有人认为,由于中文语料匮乏,文心一言选择使用更为成熟的开源英语数据库,再用机翻进行补足,画图模型也是受此影响。此前,MOSS也是出于类似的原因导致中文对话效果不理想。
但在写作本文时,文心一言的AI绘画已经进行了大规模的升级,部分错误已修改。比如,鼠标和总线:
比如:夫妻肺片
正如百度张全文所说:“文心一言目前还是一个‘新生儿’,嗷嗷待哺,正在快速学习和成长中。希望大家给予时间和空间,帮助它、与它一起,取得突破。”经过这几天的测试,我们也能看出,文心一言一直在进步,虽然距离ChatGPT4还比较远,但既然已经迈出了第一步,剩下的或许只需要多一些耐心,相信文心一言会给出满意的答卷。