快科技9月13日消息,今日凌晨,OpenAI正式推出了OpenAI o1预览模型。
对于复杂推理任务而言,新模型代表着人工智能能力的崭新水平,其特点就是会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样。
OpenAI曾解释过,2023年发布的GPT-4类似于高中生的智能水平,而GPT-5则是完成AI从高中生跃升至博士”的成长,o1模型就是其中关键的一步。
根据测试,o1模型在国际数学奥林匹克的资格考试中,能够拿到83%的分数,而GPT-4o只能正确解决13%的问题。
而在编程能力比赛Codeforces中,o1模型拿到89%百分位的成绩,而GPT-4o只有11%。
OpenAI表示,根据测试,在下一个更新的版本中,AI在物理、化学和生物学的挑战性基准测试中,表现能够与博士生水平类似。
相较于GPT-4o等现有的大模型,OpenAI o1能够解决更加困难的推理问题,同时改善过往模型中存在的机制性缺陷。
比如在解答编程问题时也会更有条理,在着手写代码前,把整个回答的流程全部思考完一遍,再动手输出代码。
o1会花更多时间思考
在o1模型中,AI会不断试错并打磨答案,从而显著提高生成结果的准确率和质量。
OpenAI 宣布,ChatGPT订阅用户从9月12日起可以访问这两个新模型,o1-preview每周消息数量限制为30条,o1-mini则为50条。
总结
**OpenAI推出o1预览模型:AI思考能力显著增强**OpenAI于9月13日凌晨正式揭开了o1预览模型的神秘面纱,该模型在复杂推理任务中展现出了前所未有的能力,标志着人工智能领域新的里程碑。o1模型最显著的特点是其在回答问题前会进行深度思考,这一过程与人类解决问题的方式不谋而合,展现了AI在模拟人类思维方面的重大进步。
在此之前的GPT-4模型被广泛认为类似于高中生的智能水平,而OpenAI的雄心在于通过o1等模型推动AI从高中生向博士生的智力飞跃。这一飞跃的初步成果在o1模型的测试中得到了验证:在国际数学奥林匹克资格考试中,o1模型取得了令人瞩目的83分高分,远超GPT-4o的13%;在编程能力竞赛Codeforces中,o1模型的表现同样出色,其成绩位于前89%的优秀选手之中,而GPT-4o则仅取得11%的排名。
OpenAI还透露,未来的版本将继续提升AI在物理、化学和生物学等领域的挑战性基准测试中的表现,预期将达到与博士生相媲美的水平。这一规划进一步彰显了OpenAI在推动AI技术全面升级,尤其是在解决复杂问题和高难度科学挑战方面的决心和信心。
除了智力水平的大幅提升外,o1模型还通过优化内部机制和完善解答流程,显著改善了以往模型在处理复杂推理问题时的不足。例如,在解答编程题目时,o1模型会先完成整个解题流程的构想,再有条理地输出代码,这一进步大大提升了答案的准确性和质量。
值得关注的是,为了保证用户能够充分体验到o1模型的强大功能,OpenAI特别为ChatGPT订阅用户开放了访问权限,并设定了o1-preview和o1-mini两种模型供用户选择,分别提供每周30条和50条消息的限制。这一举措不仅展现了OpenAI对用户体验的重视,也预示着AI技术将在更广泛的领域中发挥更加重要的作用。
综上所述,o1预览模型的推出标志着OpenAI在人工智能领域取得了重大突破。未来随着技术的不断迭代和升级,我们有理由期待AI将在更多领域展现其卓越的智慧和能力。