OpenAI推出新一代模型o1,推理能力大幅提升,超越人类专家

发布时间:2024-10-03 11:31:33 浏览量:130次

OpenAI推出全新大型语言模型o1,其推理能力大幅提升,在数学、程序设计等高难度科学问题测试中表现优异,大幅超越先前发布的模型。o1模型通过关联思考(Chain of Thought),在多数复杂推理任务中表现接近甚至超越人类专家。在最新的美国国际数学邀请赛(AIME)中取得出色成绩,o1是目前第一个在GPQA科学测试中超越人类博士的模型。

图片来源/OpenAI

OpenAI o1是一个针对复杂推理问题设计的新一代大型语言模型,相较于之前的模型,o1通过强化学习来增强其推理能力,能够对问题进行深度思考。o1关联思考(Chain of Thought)的能力模拟人类解题时逻辑推理过程,借由分步骤分析问题,再做出回应。这种能力大幅提升o1处理复杂任务的准确性和可靠性。

在数学以及程序设计领域,o1展现出解决高难度问题所需的强大推理能力。以AIME数学考试为例,o1单次尝试可解决74%的题目,通过共识决方法提高准确度至93%。在程序设计中,o1在Codeforces竞技程序测试表现出色,o1-ioi模型在IOI调校下Elo评分高达1807,超过93%的人类竞争者。

图片来源/OpenAI

o1具备逐步分析问题、拆解复杂步骤并自动修正错误的能力,通过强化学习从每次尝试中学习改进,持续优化解题技巧,让o1模型在解决需要深度推理问题时具备更高准确性、效率和稳定性。

目前OpenAI已发布o1早期版本OpenAI o1-preview,用户可在ChatGPT中进行测试,并开放给部分受信任的API用户。GitHub展示了o1模型在程序设计的能力,包括o1-preview协助开发者优化复杂算法,解决应用程序性能低落问题。GitHub官方预计将o1-preview和轻量级o1-mini加入可选模型,开发者需通过Azure AI申请早期访问。

除了OpenAI o1在程序设计和数学问题上的发展,其他组织也在推进类似技术进步。DeepMind展示了AlphaGeometry 2,解决数学难题模型,达到国际数学奥林匹亚竞赛水平。AlphaGeometry 2基于Gemini语言模型的神经符号混合系统,专注于解决复杂数学问题。

想要了解更多关于数字艺术类培训课程,欢迎点击点击咨询

热门课程推荐

热门资讯

请绑定手机号

x
确定