当数学家陶哲轩把一道几何难题交给GPT-5 Pro,几分钟后,屏幕亮起——推理完美、逻辑无瑕,却依然没有答案。就在同一周,它又在全球最难的数学测试上夺冠。 分数耀眼得几乎刺眼,却掩不住那一瞬的空白:它真的理解了什么吗?
十年前,数学家陶哲轩还在黑板前,与学生们手推每一道几何公式。
十年后,他把同样的问题丢给一台机器——GPT-5 Pro。
他想知道:AI只是更快的计算者,还是正在接近真正的理解?
几分钟后,屏幕亮起:Minkowski公式、Willmore不等式、体积积分……它把整个推理写成了完美的论文草稿。
陶哲轩看着那串结果,既震撼,又有点心凉:问题依然无解,只是被粉饰得更漂亮了。
就在那一周,另一场数字化的「数学登山」也在进行。
GPT-5 Pro在全球最难的测试集FrontierMath上拿下13%的最高分。
分数耀眼,直觉却失灵。它像一个擅长计算的神童,但在真正的研究面前,依然停下了笔。
于是问题不再是「AI能不能解题」,而是:它到底理解了多少世界?
陶哲轩的实测
AI在科研中的「三层表现」
十年前,陶哲轩还在黑板前与学生推演几何。
这位被誉为「天才中的天才」的数学家,21岁就成了最年轻的菲尔兹奖得主。
十年后,他决定亲自验证这台「拿下13%纪录」的AI究竟能做什么。
他没有选择标准题库,而是把它带进真正的科研现场——那里没有标准答案,只有开放问题。

「我想看看AI能否在我不擅长的领域提出新思路。」于是,他在MathOverflow上贴出了这道问题:
若一个光滑嵌入在R³中的球面,其主曲率都不超过1,它所包围的体积是否至少和单位球一样大?——这并非我擅长的领域(微分几何),但我想看看AI能否给出新思路。
这是一个微分几何难题。二维情况早有定理(Pestov–Ionin theorem)支撑,但三维版本至今悬而未解。
这道难题三年前曾被提出,至今无人能解。

陶哲轩不是在考AI,而是把它推向了没有标准答案的科研地带。
在与ChatGPT持续互动约40分钟,他总结道:AI辅助在微观、宏观层面有帮助,但在中观层面有限。