当前位置:AIGC资讯 > AIGC > 正文

号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大

快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。

按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI o1的更多演示视频。比如使用OpenAI o1来编写一个找松鼠的网页游戏。

这个游戏的目标是控制一只考拉躲避不断增加的草莓,并在3秒后找到出现的松鼠。这类游戏的逻辑相对复杂,更考验OpenAI o1的逻辑推理能力。

官方还表示,相较于GPT-4o等现有的大模型,OpenAI o1能够解决更加困难的推理问题,同时改善过往模型中存在的机制性缺陷。

比如在解答编程问题时也会更有条理,在着手写代码前,把整个回答的流程全部思考完一遍,再动手输出代码。

不过,经过实测,OpenAI o1依然无法解决9.11和9.8哪个大”的经典难题,严重扣分。

因为9.11和9.8哪个大这个问题,之前AI大模型集体失智,所以....

总结

**OpenAI推出推理能力强大的o1预览模型**
快科技消息,OpenAI近期隆重推出了OpenAI o1预览模型,该模型在官方宣传中以其卓越的推理能力脱颖而出,声称已接近于理科博士生的智力水平。这一里程碑式的进步在AI界引发广泛关注。
根据OpenAI官方技术博客的介绍,o1模型在推理领域的表现代表了目前人工智能领域的顶尖水平。为了进一步展示其能力,官方还发布了一系列演示视频,其中一项演示尤为引人注目:OpenAI o1被用来设计并实现了一个富含逻辑挑战的找松鼠网页游戏。在这个游戏中,用户需控制一只考拉躲避不断增多的草莓,并在限定时间内找到突然现身的松鼠,这一复杂设定充分考验了o1模型的逻辑推理与即时反应能力。
官方进一步强调,相较于包括GPT-4o在内的现行大模型,OpenAI o1能够独当一面地解决更为棘手的推理难题,并且在系统机制上弥补了过往模型存在的诸多不足。特别是在编程问题解决上,o1模型展现出前所未有的条理性,它会在编写代码之前,先全面构思整个解题过程,确保思路清晰、逻辑连贯,再付诸实践。
然而,尽管如此强大,OpenAI o1模型也在特定情况下遭遇了尴尬——“9.11和9.8哪个大”这一经典问题依然没有给出准确答案,这一瑕疵不禁让人扼腕叹息。此前,多款AI大模型均在此类简单数值比较问题上“马失前蹄”,显然,即便是最先进的o1模型,在应对一些看似简单的常识性问题时,仍需进一步优化与完善。

更新时间 2024-09-14