GPT-5 Pro 独立做数学研究:读论文后给出更精确边界,OpenAI 总裁称这是生命迹象

时间:2025-08-21 17:18:01来源:互联网

下面小编就为大家分享一篇GPT-5 Pro 独立做数学研究:读论文后给出更精确边界,OpenAI 总裁称这是生命迹象,具有很好的参考价值,希望对大家有所帮助。

AI 已经能够自主思考并证明新的数学规律了?OpenAI 研究人员表示,自己喂给 GPT-5 Pro 一篇论文,结果模型读完之后得到了新的结论。

在凸优化问题当中,GPT-5 Pro 针对一个边界问题,给出了比原文更加精确的阈值和相应证明。消息立即引发全网热议,不到半天推文就有 230 多万次阅读。

不过这位研究人员并没有将 GPT-5 Pro 的研究成果发表成论文,理由是被人类抢先了 —— 这篇论文后来又更新了一个版本,给出了新的边界,这个新的边界又把 GPT-5 Pro 反超了。

但是,GPT-5 Pro 的证明思路与此并不相同,说明它已经具备了独立探索的能力,所以人类的反攻也不影响这是 GPT-5 Pro 的一个新突破。OpenAI 总裁 Brockman 甚至将这一成果称之为“生命迹象”。

凸优化曲线是凸的吗?

喂给 GPT-5 Pro 的这篇论文,研究的是凸优化(convex optimization)问题,凸优化是数学最优化的一个子领域,研究定义于凸集中的凸函数最小化的问题。

具体来说,这篇论文题目为《凸优化曲线是凸的吗?》,研究了这样的一个问题:

当使用梯度下降算法优化光滑凸函数时,其产生的优化曲线(optimization curve)是否是凸的?

这里的“优化曲线”指的是函数值 f (x_n) 随迭代次数 n 变化的曲线。如果这条曲线是凸的,意味着优化速率(即相邻两次迭代的函数值下降量)是单调递减的。

关于这个问题,论文的结论是优化曲线凸不凸,关键取决于步长(step size)的选择,具体包括如下几个关键点:

凸性保证区间:当步长 η ∈ (0, 1 / L] 时(L 为平滑度),优化曲线保证是凸的;

非凸可能区间:当步长 η ∈ (1.75 / L, 2 / L) 时,即使梯度下降仍单调收敛,优化曲线可能不是凸的;

梯度范数性质:对于整个收敛区间 η ∈ (0, 2 / L],梯度范数序列 ||∇f (x_n)|| 总是单调递减的;

二阶可导凸函数的梯度流凸性:对于凸且二阶连续可导的函数,梯度流的优化曲线总是凸的;

光滑凸函数的梯度流凸性:对于凸 L-光滑函数(不要求二阶可导),梯度流的优化曲线总是凸的;

梯度流的梯度范数单调性:对于连续时间的梯度流,优化曲线总是凸的;

关于第一个结论,证明的核心是证明序列 {f (x_n) - f [(x_(n+1)]} 非递增。

论文作者巧妙地引入辅助函数 g_k (t),将离散的迭代过程转化为连续函数的积分,利用凸函数的性质证明辅助函数的单调性,通过比较相邻两个辅助函数的大小关系,最终证明优化曲线的凸性。

非凸可能区间部分则是构造一个分段函数(二次函数和线性函数的组合)作为反例实现证明。

作者选择特定的初始点 x_0 = -1.8,通过直接计算前三步迭代的函数值下降量,验证在该步长范围内,后面的下降量反而比前面大,违反了凸性要求。

由于 GPT-5 Pro 的证明主要针对的是边界问题,后面四个结论的证明过程在这里就不详细介绍了,感兴趣的话可以阅读原论文。

GPT-5 Pro 给出新边界

在论文的第一版中,作者分别证明了步长不大于 1 / L 和大于 1.75 / L 时的情况,但在 (1 / L, 1.75 / L] 范围内则未有定论。

GPT-5 Pro 则是通过更精细的不等式技巧,用 17 分半的时间把 1 / L 这个边界移动到了 1.5 / L。

而人类检查证明过程的时间,是 25 分钟,GPT-5 Pro 读论文并进行证明的时间还要长。

其核心思路与原论文相似,均是将优化曲线凸性问题转化为证明函数值下降量递减。

但 GPT-5 Pro 巧妙运用了凸 L-光滑函数的两个基本不等式 ——Bregman 散度不等式(提供更紧的下界)和标准的共强制性(cocoercivity)不等式。

通过这种巧妙的代数操作,GPT-5 Pro 成功将凸性条件进一步细化。

再之后,GPT-5 Pro 的发现还未来得及发表,论文原作者就对论文进行了更新,作者新增了一名,关键是证明了 1.75 / L 就是一个精确界限,之前未探索的区间实现了闭合。

其思路是利用凸 L-光滑函数的 Bregman 散度不等式,对三个点对 (x_0,x_1)、(x_1,x_2) 和 (x_0,x_2) 分别建立不等式,之后将三个不等式分别乘以不同权重后求和,并通过恒等式将复杂的梯度项组合化简。

虽然 GPT-5 Pro 给出的证明最后被人类扳回一城,但是,其思路和过程与新版论文不同。

也就是说,GPT-5 Pro 并不是发现了新论文才实现边界的精确化,而是确实具备了自主发现并证明数学规律的能力。

参考链接:

[1]https://x.com/SebastienBubeck/status/1958198661139009862

[2]https://arxiv.org/abs/2503.10138v1

[3]https://arxiv.org/abs/2503.10138v2

本文来自微信公众号:量子位(ID:QbitAI),作者:克雷西

本站部分内容转载自互联网,如果有网站内容侵犯了您的权益,可直接联系我们删除,感谢支持!