在文心一言超越ChatGPT3.5后，我们做了大模型对比测试。

IDC发布的AI大模型评估报告中，文心一言拿下12个指标中的7个满分，综合评分第一。百度副总裁吴甜表示，新版文心一言已超越ChatGPT3.5。这是令人振奋的新闻。不过，我们还没能体验到文心一言。

除了文心一言，号称超过ChatGPT3.5大模型，还有google的bard，Meta的LlaMA2和claude2。我们来一一对比测试下。

将本文第一段，发给他们改写成震惊体。（点击图片，放大查看）

google的bard

claude2

LlaMA2

ChatGPT3.5(ppword提供)

ChatGPT-4(ppword提供)

Llama2不能直接输出中文，后续要求输出中文，直接断开了。可能是第三方网站本身的问题。

可以看出，google的bard和claude2表现都非常不错。和chatGPT3.5确实接近了。体验过早期ChatGPT3.5的同学会知道，ChatGPT3.5之前也和bard和claude一样，废话很多。最近明显收敛了很多。

但是，他们所有人，都没法和ChatGPT-4相比。GPT-4是真的很强。我们尝试用GPT-4代替人工去各大内容平台（微信公众号，微博，小红书，知乎，bilibili等）发布内容。都获得非常不错的流量。把内容里明显的：‘虽然，但是，首先，其次’之类的固定格式去掉就可以了。