GPT-4懒癌爆发!代码比较任务中完成率降低近1/4

近期，GPT-4的“懒惰”现象再度成为热议话题。网友们通过实际测试发现，GPT-4在代码比较任务中的表现下降显著，完成率降低了近四分之一。一些用户反馈称，完成度不仅不高，而且生成的文本还会被分割成小块，使用时需要逐一复制，给用户带来不便。

尽管有博主表示在尝试给一年级孩子做学习用的小游戏时效果不错，但仍有人质疑ChatGPT的实际应用价值。有网友指出，尽管回复长度增加，但很多内容都是车轱辘话，干正事依旧摆烂。有用户甚至让ChatGPT进行文本翻译测试，结果却叽里呱啦说了一堆却不翻译。

针对这一发现，有人使用GitHub上开源的“lazy benchmark”对比了GPT-4的新旧版本，结果显示新版的完成率较旧版降低了近四分之一。具体而言，在代码比较任务中，旧版能完成的比例为57%，而新版仅为44%。

对于GPT-4变懒的原因，奥特曼并未做进一步说明，仅表示新的一年应该有所改进。之前的研究表明，GPT-4的惰性可能与时间相关，但这并不能完全解释表现不升反降的现象。

不过，网友们总结了一些“土办法”以降低ChatGPT的惰性。例如，告诉它“我没有手指”就能得到相对完整的代码，而不是一段段碎片。另外，告诉ChatGPT自己会“给小费”也能激发其工作动力，其中10美元的小费金额被发现是最能提高性价比的。

GPT-4的“懒惰”问题引起了广泛关注。虽然奥特曼表态在新的一年应该有所改进，但网友们仍对其实际表现及优化策略感到困扰。这一现象或许会在新年伊始有所缓解，但具体的改进措施仍有待进一步揭示。

​GPT-4懒癌爆发!代码比较任务中完成率降低近1/4