
GPT-5.5 Pro 攻克加性数论开放难题 数学研究范式迎来深刻变革
长期以来,人们对 AI 做数学存在一种根深蒂固的误解:认为它无非是将人类已有的知识从记忆中 "重组" 出来。直到菲尔兹奖得主蒂莫西・高尔斯(Timothy Gowers)将梅尔文・内桑森(Melvyn Nathanson)的未解开放问题交给 GPT-5.5 Pro,让它在没有任何数学引导的情况下,仅用 17 分 05 秒就打破了一道困扰学界多年的指数级壁垒 —— 数学家们才猛然意识到:AI 正在做的事,远比 "重组人类智慧" 更深刻,也更具颠覆性。
一、从指数到二次:这不是优化,是维度级跃迁
在这次实验中,高尔斯没有用那些被反复研究的教科书习题来测试模型 —— 那种情况下 AI 更像是在 "背答案"。他选择了加性数论领域一批相当新颖且极具挑战性的开放问题,这些问题出自数论学家内桑森的论文,核心是探讨整数集合的和集(即集合中任意两个元素相加得到的所有元素构成的集合)大小与集合自身直径(最大元素减最小元素)之间的边界关系。
内桑森本人已经证明了一个指数级上界 2^k−1,但他一直怀疑这个结果可以进一步收紧。高尔斯没有给 AI 任何数学提示,只是将问题原封不动地输入模型。
GPT-5.5 Pro 经过 17 分 05 秒的 "思考",给出了一套全新的构造方法,直接将上界从指数级大幅压缩至二次方级 O (k²),而高尔斯当场确认这就是最优解。
在加性数论领域,指数级结果意味着 "几乎无法实际应用",而多项式级结果则意味着 "具备实用价值"。两者之间的差距不是 "优化了一点点",而是物理意义上的降维打击。
AI 是如何做到的?它将内桑森原始证明中的一个关键组件 —— 原本用 2 的幂构造的西顿集(一种特殊的整数集合,其中任意两个不同元素对的和都不相同),替换成了一个效率更高、但从未被人类应用到这个具体问题的西顿集构造路线。也就是说,GPT 识别出了一个已知的数学工具,但它将这个工具适配到当前问题的方式,是人类从未考虑过的。它扮演的不是 "题库检索器",而是跨问题记忆识别器 —— 把人类遗漏的连接点重新焊接在了一起。
随后,高尔斯让 AI 将论证过程整理成标准的 LaTeX 预印本格式,模型仅用 2 分 23 秒就完成了全部工作。而贯穿整个实验过程,高尔斯反复强调了一个令人不安的事实:他给出的提示词 "不包含任何数学输入",他的角色仅仅是 "情绪价值提供者" 和 "排版助手",偶尔说一句 "嗯这个方向不错,可以试试"。
二、从指数到多项式:原创性突破获同行认可
解决了内桑森的直径问题后,高尔斯将挑战升级:推广到 h 重求和集的一般情形。这个问题比前一个难得多,麻省理工学院博士生艾萨克・拉贾戈帕尔(Isaac Rajagopal)在此方向已有开创性工作,但他的构造结果仍然带有指数依赖。
高尔斯让 GPT 阅读了拉贾戈帕尔的论文,询问能否进一步收紧边界。整个过程的时间线清晰展现了 AI 的研究能力:
表格
| 轮次 | 事件 | 用时 |
|---|---|---|
| 1 | 第一轮改进,将指数上界推至亚指数级 | 约 16 分 41 秒 |
| 2 | 整理成预印本笔记 | 约 47 分 39 秒(含交互) |
| 3 | 追问能否进一步推至多项式界 | - |
| 4 | 模型提出新研究方向,指出待验证的技术命题 | 约 13 分 33 秒 |
| 5 | 模型自行验证技术卡点 | 约 9 分 12 秒 |
| 6 | 生成包含完整推导的最终 LaTeX 预印本 | 约 31 分 40 秒 |
最终,AI 将结果推进到了 N (h,k) ≤ O (k^{10h³}) 量级的多项式上界 —— 从指数级到多项式级,这是一次质的飞跃。
拉贾戈帕尔本人的评价,最能体现这项成果的分量:"第一层改进算是 ' 常规操作 ',但把指数压到多项式的那招 —— 那个 h²- 解离集控制手法 —— 据我所知完全原创。这是一个非常巧妙的想法。我自己得花一两周才能想出来,GPT 不到一小时就找到了。"
一个此前从未在数学文献中出现过的概念,就这样从 AI 的 "思考" 中诞生了。
三、博士生培养体系面临前所未有的挑战
看完这些实验结果,高尔斯最担心的不是 AI 会不会取代数学家,而是:未来的数学博士生还能做什么?
在组合学与数论领域,年轻研究者历来是靠解决 "低垂的开放题" 起步的。这些问题定义清晰、难度适中、数量充足,是博士生练手、撰写第一篇学术论文的标准起跑器。可如今 GPT-5.5 Pro 两小时就能完成的,恰恰是过去一个博士生需要花几个月甚至接近一年才能攻克的那类题目。
高尔斯的判断虽然令人不安却十分直接:2026 年入学的数学博士生,最早 2029 年毕业 —— 到那时,数学研究的意义可能已经面目全非。数学的门槛被 AI 抬高了,未来的底线将是 "证明大语言模型还证明不了的东西"。
著名数学家陶哲轩也给出了互补的观点:不同数学问题之间的难度差距可能达到好几个数量级,"AI 解决了一个 50 年未决的问题" 并不等于 "它超越了人类半世纪的努力"—— 很多时候只是因为这些问题之前没有被人系统地研究过。但他也不否认:那些有明确目标、可以机械推进的问题,正在被 AI 逐步接管。
而人类不可替代的价值,可能不再是 "证明定理",而是 "消化成果"—— 理解、筛选、整合、深化 AI 产出的海量数学结果,然后在全新的问题域中重新定位自己的研究方向。
四、数学研究的底层范式正在改写
高尔斯在博客中写下的那句开场白,至今仍在全球数学界回响:"如果你是数学家,继续读之前,也许该先坐下。"
这句话的重量,远超高尔斯个人的震惊。GPT-5.5 Pro 在内桑森问题上的表现,告诉我们的不是 "AI 跑得有多快",而是数学本身的底层训练模型可能需要重写。当一个 MIT 博士生说 "我会为这个想法骄傲",而这个想法的出处是一串代码的输出时,我们就不得不承认一个事实:
AI 已经不再是帮你算算术的工具了。它正在帮你找问题、想解法,然后用你从未想过的方式,把数学概念的碎片重新拼接起来。
对于广大科研工作者而言,无论是否愿意承认,AI 已经成为学术研究中不可或缺的重要工具。如何安全、高效地使用前沿 AI 模型辅助科研工作,是当下每一位研究者都需要面对的课题。UseAIAPI作为专业的全球 AI 大模型接入平台,全面覆盖包括最新发布的 ChatGPT 全系列、Claude 全系列、Gemini 全系列、DeepSeek 在内的全球热门 AI 大模型,提供一站式无缝接入服务,无需复杂配置即可快速上手使用。平台同时支持企业级定制化服务,可根据不同科研场景和业务需求量身打造专属解决方案。在成本方面,UseAIAPI 长期为用户提供极具竞争力的优惠政策,最低可达官方价格的 50%,能够大幅降低高强度科研计算、大规模数据分析和学术写作带来的成本压力,让更多科研工作者能够轻松享受到前沿 AI 技术带来的生产力红利。
技术的浪潮不可阻挡。GPT-5.5 Pro 在数学领域的突破,只是一个开始。它向整个学术界提出了一个根本性的问题:当 AI 能够独立完成博士级别的研究工作时,人类学者的价值究竟在哪里?这个问题的答案,或许将决定未来几十年人类科学发展的方向。