找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 42|回复: 1

[人工智能] 大语言模型懂数学?OpenAI发o1模型 解题高手如何炼成的

[复制链接]

15

主题

15

回帖

77

积分

注册会员

积分
77
发表于 2024-9-14 10:12:01 | 显示全部楼层 |阅读模式
北京时间9月13日,OpenAI发布了新一代o1系列模型。其首席执行官山姆奥特曼表示,o1是“迄今为止功能最强大,最具有一致性的模型。”“这是一个新范式的开始,人工智能可以进行复杂推理了。”

  新京报贝壳财经记者浏览OpenAI公开的技术文档、演示视频及该公司员工的发声内容发现,本次OpenAI更新的方向旨在加固此前大模型的“短板”:数学推理。这种具备更强推理能力的o1系列模型共有三种:o1、o1-mini以及抢先版o1-preview。从今天开始,o1-preview已在ChatGPT中向所有Plus和Team用户推出。

  补数学运算“短板” 未来AI或许能在数学问题上超越人类

  大语言模型之所以是“语言模型”,就是因为其胜在对语言的解析以及流畅的回答,但一旦涉及数学问题,大语言模型往往会现出真面目,因此数学推理也成为了大语言模型的短板。

  而在本次更新中,OpenAI表示,o1系列模型可以推理复杂的任务并解决比以前的科学、编码和数学模型更难的问题。在OpenAI官方展示的视频里,量子物理学家使用GPT-4进行数学运算,可以发现在对话界面,大模型展示出了数学运算细节。
 在具体的能力对比上,山姆奥特曼晒出了o1与GPT-4o的数值差异:在数学竞赛中GPT-4o得分为13.4,o1得分高达83.3;编程竞赛中,GPT-4o得分为11.0,o1得分高达89;差异较为不明显的则是博士级别科研问题,GPT-4o得分为56.1,o1得分为78.0,相比之下科研人员的得分是69.7。


10

主题

10

回帖

52

积分

注册会员

积分
52
发表于 2024-9-14 13:39:55 | 显示全部楼层
补数学运算“短板” 未来AI或许能在数学问题上超越人类。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|金边论坛

GMT+8, 2024-11-23 17:47 , Processed in 0.032407 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表