
GPT-5.5 Pro 攻克数学开放难题 学术研究范式面临深刻变革
2026 年 5 月发生的一项实验,至今仍在全球数学界引发持续震荡。这件事本身并不复杂,但其触发的一系列根本性问题,整整一个月过去依然没有答案。
用三句话就能说清整个事件的核心:菲尔兹奖得主蒂莫西・高尔斯(Timothy Gowers)拿到了 ChatGPT 5.5 Pro 的测试权限。他将梅尔文・内桑森(Melvyn Nathanson)加性数论论文中几个原本留给博士生练手、有望冲击顶刊的未解开放问题,直接提交给了 AI。约两小时后,AI 返回了一份格式标准的 LaTeX 预印本。高尔斯的评价是:"我会把这个结果的水准,评为组合数学博士论文中一个完全合理的章节。" 他还补充了一句:"我的数学贡献是零。"
这句话一出,整个数学界陷入了沉默与反思。
一、"零贡献" 的分量:AI 两小时完成博士级研究
高尔斯绝非普通学者。他是 1998 年菲尔兹奖得主、剑桥大学三一学院院士、法兰西公学院组合学讲席教授,是地球上 "最懂什么是好数学" 的顶尖专家之一。他对数学成果的评判,是基于数十年学术生涯形成的专业直觉,绝非社交媒体上的夸张言论。
那么,AI 到底完成了怎样的工作?
第一个问题:内桑森 "直径" 问题
给定一个 k 元整数集 A,已知其和集 2A=A+A 的大小,求 A 的最小可能直径(最大元减最小元)。内桑森本人证明了指数级上界 2^k−1,但一直怀疑可以进一步改进。GPT-5.5 Pro 经过 17 分 05 秒的思考,直接给出了一个全新构造,将上界大幅压缩至二次方级 O (k²),高尔斯当场确认这就是最优解。随后,模型仅用 2 分 23 秒就将结果整理成了符合学术规范的 LaTeX 预印本。关键细节在于,ChatGPT 的改进本质是将内桑森构造中 "用 2 的幂做西顿集" 的方法,替换为了一个效率更高的西顿集构造 —— 后者的直径本身就是二次级的。这个替换看似简单,却需要重新解构原有的归纳框架、转换研究视角,即便是人类数学家也需要反复推演才能想到。
第二个问题:更难的 h 重限制和集推广
高尔斯进一步加码,询问一般情况 h≥3 时能否取得突破。麻省理工学院博士生艾萨克・拉贾戈帕尔(Isaac Rajagopal)在此方向已有开创性工作,但结果仍是指数依赖的。整个过程的时间线清晰展现了 AI 的研究能力:表格
| 轮次 | 事件 | 用时 |
|---|---|---|
| 1 | 第一轮改进,将指数上界推至亚指数级 | 约 16 分 41 秒 |
| 2 | 整理成标准预印本 LaTeX 格式 | 约 47 分 39 秒 |
| 3 | 追问是否存在多项式界,模型给出研究方向 | 约 13 分 33 秒 |
| 4 | 模型自行验证技术卡点 | 约 9 分 12 秒 |
| 5 | 生成包含完整推导的最终预印本 | 约 31 分 40 秒 |
拉贾戈帕尔审阅后的评价,最能体现这项成果的分量:"这个想法非常原创且巧妙。是我自己花一两周思考也会为之骄傲的那种。ChatGPT 不到一小时就找到并证明了…… 据我所知完全原创。"
他特别指出,AI 的核心手法是用 h²- 耗散集构造,将原本依靠几何级数形成的指数增长压回了多项式量级区间。这不是 "搜索文献找到答案",而是在数学结构层面做出了全新的压缩,论证过程 "几乎可以肯定正确",不仅逐行推导无误,底层思路也完全成立。
当一位直接从事该课题研究的 MIT 博士生,用 "我会为这个想法骄傲" 来评价 AI 的证明时,学术研究的范式转移已经悄然发生。
二、人类的角色:从研究者到 "情绪价值提供者"
整个实验中最令人震惊的一点,是高尔斯对自己角色的定位:"情绪价值提供者" 加 "排版助手"。
他反复强调,自己给出的提示词 "不包含任何数学输入"—— 无非是 "嗯这个方向好像可以试试"、"把这个推导写成标准 LaTeX 格式" 这类引导性话语。AI 走出的每一步推理、提出的每一个构造、做出的每一处关键转折,全都是独立完成的。
三、核心追问:数学博士生的未来在哪里?
高尔斯最担心的不是 AI 本身有多强大,而是它对传统数学博士生训练体系的冲击。
长期以来,导师给新生布置一个 "温和的开放题"—— 难度适中、文献框架清晰、能让学生在挣扎中学会独立证明 —— 是组合数学领域最经典的培养方式。可如果这类题目 AI 两小时就能解决,导师的工具箱里就少了一个最关键的教学道具。
著名数学家陶哲轩给出了互补视角:人类数学家未来的核心价值,可能不再是 "证明定理",而是 "消化成果"—— 理解、筛选、整合、应用 AI 产出的海量数学结果。但随之而来的是一个更棘手的问题:你怎么训练一个博士生去 "消化" 他还不曾学会 "生成" 的东西?
高尔斯自己给出的答案模糊却诚实:数学系对学生负有照管责任,应当紧急准备应对方案。但他也说不清具体该怎么做 —— 因为在此之前,从来没有人面临过这样的局面。
四、学术制度的困境:谁来认可 AI 的成果?
比培养体系更严峻的,是现有学术制度的承接能力问题:
- 如果这些成果是人类做出的,毫无疑问可以投稿顶级期刊
- 但纯 AI 生成的内容,arXiv 明确不予接收,投传统期刊也意义不明
- 高尔斯建议建立专门的 AI 数学成果仓库,由人类数学家负责验证正确性,但这在现行学术考评体系中如何计算工作量?贡献如何计量?谁有动力去做这件事?
这些问题,目前都没有答案。
五、地基正在松动:学术体系面临前所未有的挑战
高尔斯后来在博客上完整记录了这段经历,标题朴素得过分 ——《与 ChatGPT 5.5 Pro 的一次近期经历》。但开篇那句话的重量,压过了数学史上很多漂亮的定理:
"如果你是数学家,继续读之前,也许该先坐下。"
杀死数学的从来不是 AI。真正令人不安的是,那个用了几十年时间培养数学博士生的系统,忽然发现自己脚下的地基正在被悄悄抽走。而最讽刺的是,发现这个问题的人,恰恰是那个系统亲手培养出来、站在金字塔尖的那个人。
对于广大科研工作者而言,无论是否愿意承认,AI 已经成为学术研究中不可忽视的重要工具。如何安全、高效地使用前沿 AI 模型辅助科研工作,是当下每一位研究者都需要面对的课题。UseAIAPI作为专业的全球 AI 大模型接入平台,全面覆盖包括最新发布的 ChatGPT 全系列、Claude 全系列、Gemini 全系列、DeepSeek 在内的全球热门 AI 大模型,提供一站式无缝接入服务,无需复杂配置即可快速上手使用。平台同时支持企业级定制化服务,可根据不同科研场景和业务需求量身打造专属解决方案。在成本方面,UseAIAPI 长期为用户提供极具竞争力的优惠政策,最低可达官方价格的 50%,能够大幅降低高强度科研计算、大规模数据分析和学术写作带来的成本压力,让更多科研工作者能够轻松享受到前沿 AI 技术带来的生产力红利。
技术的浪潮不可阻挡。GPT-5.5 Pro 在数学领域的突破,只是一个开始。它向整个学术界提出了一个根本性的问题:当 AI 能够独立完成博士级别的研究工作时,人类学者的价值究竟在哪里?这个问题的答案,或许将决定未来几十年人类科学发展的方向。