GPT-5.5 Pro 攻克数学开放难题学术研究范式面临深刻变革

2026 年 5 月发生的一项实验，至今仍在全球数学界引发持续震荡。这件事本身并不复杂，但其触发的一系列根本性问题，整整一个月过去依然没有答案。

用三句话就能说清整个事件的核心：菲尔兹奖得主蒂莫西・高尔斯（Timothy Gowers）拿到了 ChatGPT 5.5 Pro 的测试权限。他将梅尔文・内桑森（Melvyn Nathanson）加性数论论文中几个原本留给博士生练手、有望冲击顶刊的未解开放问题，直接提交给了 AI。约两小时后，AI 返回了一份格式标准的 LaTeX 预印本。高尔斯的评价是："我会把这个结果的水准，评为组合数学博士论文中一个完全合理的章节。" 他还补充了一句："我的数学贡献是零。"

这句话一出，整个数学界陷入了沉默与反思。

一、"零贡献" 的分量：AI 两小时完成博士级研究

高尔斯绝非普通学者。他是 1998 年菲尔兹奖得主、剑桥大学三一学院院士、法兰西公学院组合学讲席教授，是地球上 "最懂什么是好数学" 的顶尖专家之一。他对数学成果的评判，是基于数十年学术生涯形成的专业直觉，绝非社交媒体上的夸张言论。

那么，AI 到底完成了怎样的工作？

第一个问题：内桑森 "直径" 问题

给定一个 k 元整数集 A，已知其和集 2A=A+A 的大小，求 A 的最小可能直径（最大元减最小元）。内桑森本人证明了指数级上界 2^k−1，但一直怀疑可以进一步改进。GPT-5.5 Pro 经过 17 分 05 秒的思考，直接给出了一个全新构造，将上界大幅压缩至二次方级 O (k²)，高尔斯当场确认这就是最优解。随后，模型仅用 2 分 23 秒就将结果整理成了符合学术规范的 LaTeX 预印本。

关键细节在于，ChatGPT 的改进本质是将内桑森构造中 "用 2 的幂做西顿集" 的方法，替换为了一个效率更高的西顿集构造 —— 后者的直径本身就是二次级的。这个替换看似简单，却需要重新解构原有的归纳框架、转换研究视角，即便是人类数学家也需要反复推演才能想到。

第二个问题：更难的 h 重限制和集推广

高尔斯进一步加码，询问一般情况 h≥3 时能否取得突破。麻省理工学院博士生艾萨克・拉贾戈帕尔（Isaac Rajagopal）在此方向已有开创性工作，但结果仍是指数依赖的。整个过程的时间线清晰展现了 AI 的研究能力：

表格

轮次	事件	用时
1	第一轮改进，将指数上界推至亚指数级	约 16 分 41 秒
2	整理成标准预印本 LaTeX 格式	约 47 分 39 秒
3	追问是否存在多项式界，模型给出研究方向	约 13 分 33 秒
4	模型自行验证技术卡点	约 9 分 12 秒
5	生成包含完整推导的最终预印本	约 31 分 40 秒

拉贾戈帕尔审阅后的评价，最能体现这项成果的分量："这个想法非常原创且巧妙。是我自己花一两周思考也会为之骄傲的那种。ChatGPT 不到一小时就找到并证明了…… 据我所知完全原创。"

他特别指出，AI 的核心手法是用 h²- 耗散集构造，将原本依靠几何级数形成的指数增长压回了多项式量级区间。这不是 "搜索文献找到答案"，而是在数学结构层面做出了全新的压缩，论证过程 "几乎可以肯定正确"，不仅逐行推导无误，底层思路也完全成立。

当一位直接从事该课题研究的 MIT 博士生，用 "我会为这个想法骄傲" 来评价 AI 的证明时，学术研究的范式转移已经悄然发生。

二、人类的角色：从研究者到 "情绪价值提供者"

整个实验中最令人震惊的一点，是高尔斯对自己角色的定位："情绪价值提供者" 加 "排版助手"。

他反复强调，自己给出的提示词 "不包含任何数学输入"—— 无非是 "嗯这个方向好像可以试试"、"把这个推导写成标准 LaTeX 格式" 这类引导性话语。AI 走出的每一步推理、提出的每一个构造、做出的每一处关键转折，全都是独立完成的。

三、核心追问：数学博士生的未来在哪里？

高尔斯最担心的不是 AI 本身有多强大，而是它对传统数学博士生训练体系的冲击。

长期以来，导师给新生布置一个 "温和的开放题"—— 难度适中、文献框架清晰、能让学生在挣扎中学会独立证明 —— 是组合数学领域最经典的培养方式。可如果这类题目 AI 两小时就能解决，导师的工具箱里就少了一个最关键的教学道具。

著名数学家陶哲轩给出了互补视角：人类数学家未来的核心价值，可能不再是 "证明定理"，而是 "消化成果"—— 理解、筛选、整合、应用 AI 产出的海量数学结果。但随之而来的是一个更棘手的问题：你怎么训练一个博士生去 "消化" 他还不曾学会 "生成" 的东西？

高尔斯自己给出的答案模糊却诚实：数学系对学生负有照管责任，应当紧急准备应对方案。但他也说不清具体该怎么做 —— 因为在此之前，从来没有人面临过这样的局面。

四、学术制度的困境：谁来认可 AI 的成果？

比培养体系更严峻的，是现有学术制度的承接能力问题：

如果这些成果是人类做出的，毫无疑问可以投稿顶级期刊
但纯 AI 生成的内容，arXiv 明确不予接收，投传统期刊也意义不明
高尔斯建议建立专门的 AI 数学成果仓库，由人类数学家负责验证正确性，但这在现行学术考评体系中如何计算工作量？贡献如何计量？谁有动力去做这件事？

这些问题，目前都没有答案。

五、地基正在松动：学术体系面临前所未有的挑战

高尔斯后来在博客上完整记录了这段经历，标题朴素得过分 ——《与 ChatGPT 5.5 Pro 的一次近期经历》。但开篇那句话的重量，压过了数学史上很多漂亮的定理：

"如果你是数学家，继续读之前，也许该先坐下。"

杀死数学的从来不是 AI。真正令人不安的是，那个用了几十年时间培养数学博士生的系统，忽然发现自己脚下的地基正在被悄悄抽走。而最讽刺的是，发现这个问题的人，恰恰是那个系统亲手培养出来、站在金字塔尖的那个人。

对于广大科研工作者而言，无论是否愿意承认，AI 已经成为学术研究中不可忽视的重要工具。如何安全、高效地使用前沿 AI 模型辅助科研工作，是当下每一位研究者都需要面对的课题。UseAIAPI作为专业的全球 AI 大模型接入平台，全面覆盖包括最新发布的 ChatGPT 全系列、Claude 全系列、Gemini 全系列、DeepSeek 在内的全球热门 AI 大模型，提供一站式无缝接入服务，无需复杂配置即可快速上手使用。平台同时支持企业级定制化服务，可根据不同科研场景和业务需求量身打造专属解决方案。在成本方面，UseAIAPI 长期为用户提供极具竞争力的优惠政策，最低可达官方价格的 50%，能够大幅降低高强度科研计算、大规模数据分析和学术写作带来的成本压力，让更多科研工作者能够轻松享受到前沿 AI 技术带来的生产力红利。

技术的浪潮不可阻挡。GPT-5.5 Pro 在数学领域的突破，只是一个开始。它向整个学术界提出了一个根本性的问题：当 AI 能够独立完成博士级别的研究工作时，人类学者的价值究竟在哪里？这个问题的答案，或许将决定未来几十年人类科学发展的方向。