首页 > 百姓社区 > 百姓社区 > 陶哲轩亲测!GPT-5 Pro 40分钟破解3年难题,登顶最难数学考试

陶哲轩亲测!GPT-5 Pro 40分钟破解3年难题,登顶最难数学考试

发布时间:2025-10-12 09:36:10来源: 13899775532

当数学家陶哲轩把一道几何难题交给GPT-5 Pro,几分钟后,屏幕亮起——推理完美、逻辑无瑕,却依然没有答案。就在同一周,它又在全球最难的数学测试上夺冠。 分数耀眼得几乎刺眼,却掩不住那一瞬的空白:它真的理解了什么吗?

十年前,数学家陶哲轩还在黑板前,与学生们手推每一道几何公式。

十年后,他把同样的问题丢给一台机器——GPT-5 Pro。

他想知道:AI只是更快的计算者,还是正在接近真正的理解?

几分钟后,屏幕亮起:Minkowski公式、Willmore不等式、体积积分……它把整个推理写成了完美的论文草稿。

陶哲轩看着那串结果,既震撼,又有点心凉:问题依然无解,只是被粉饰得更漂亮了。

就在那一周,另一场数字化的「数学登山」也在进行。

GPT-5 Pro在全球最难的测试集FrontierMath上拿下13%的最高分。

分数耀眼,直觉却失灵。它像一个擅长计算的神童,但在真正的研究面前,依然停下了笔。

于是问题不再是「AI能不能解题」,而是:它到底理解了多少世界?

陶哲轩的实测

AI在科研中的「三层表现」

十年前,陶哲轩还在黑板前与学生推演几何。

这位被誉为「天才中的天才」的数学家,21岁就成了最年轻的菲尔兹奖得主。

十年后,他决定亲自验证这台「拿下13%纪录」的AI究竟能做什么。

他没有选择标准题库,而是把它带进真正的科研现场——那里没有标准答案,只有开放问题。

「我想看看AI能否在我不擅长的领域提出新思路。」于是,他在MathOverflow上贴出了这道问题:

若一个光滑嵌入在R³中的球面,其主曲率都不超过1,它所包围的体积是否至少和单位球一样大?——这并非我擅长的领域(微分几何),但我想看看AI能否给出新思路。

这是一个微分几何难题。二维情况早有定理(Pestov–Ionin theorem)支撑,但三维版本至今悬而未解。

这道难题三年前曾被提出,至今无人能解。

陶哲轩不是在考AI,而是把它推向了没有标准答案的科研地带。

在与ChatGPT持续互动约40分钟,他总结道:AI辅助在微观、宏观层面有帮助,但在中观层面有限。

百姓社区更多>>

Meta超轻薄头显渲染图流出:高端市场的新挑战者 iPhone 18标准版外观曝光:晃眼一看iPhone17Pro iOS26.3正式版即将发布!这3类情况适合升级! 2026 年第一台新 iPhone:国补后不到 4000,但不推荐买 “爱马仕橙”iPhone 17 Pro助苹果终结三年销售颓势,中国市场猛增38% 华为Pura X2最新爆料:电池容量预计达5500mAh! 鸿蒙手机不会用?试试负一屏的“玩机助手” 2025年中国手机市场出货量3.07亿部,同比下降2.4% iQOO 15 Ultra图赏 硬核科技风格蜂窝能量矩阵 硅谷甘愿“裸奔”,中国大厂连夜“铺路”:Moltbot凭什么横扫中美? 高并发业务如何兼顾稳定与弹性?华为云TaurusDB给出“存算分离”新解 姚顺雨现场颁奖,吉嘉铭、董冠霆等15位青年人才获腾讯青云奖学金 抖音:“年货节”期间品牌礼盒成交额同比增长22% 大模型听懂语音却变笨?港中深与微软联合解决语音大模型降智问题 Anthropic一夜震撼升级:Claude获得「永久记忆」!全球打工人变天 每经热评|1200亿元大单不可戏言 容百科技董事长从头到尾真不知情? “深山林下灵芝第一品牌”,什么来路?有哪些疑点? 北京将迎空中花园!副中心六环高线公园启动段预计今年五一开放 巨人网络:《超自然行动组》推出AI大模型玩法,AI与真人玩家对局数超2500万次 华西证券:首予八马茶业“买入”评级 高端茶企的发展现状与增长密码 Laraki Borac:摩洛哥超跑梦想的未竟之作 XSKY发布AIMesh,想帮AI工厂打通数据“任督二脉” 2026款睿蓝8焕新,续航、动力、舒适、安全全维升级 既有传统,也有NK风格?全新宝马5系长这样,你会喜欢吗? 智谱成为全球大模型第一股,外国人这么看 三大指数开盘涨跌不一 AI概念多股高开 追觅电视斩获CES媒体大奖,Aura Mini LED与AI技术实力获国际认可 微言 | “死了么” APP爆火,戳中独居群体最痛的安全感缺口 全员Pro Max?多款旗舰手机阵容要变! 小米17 Pro系列背屏支持查看股票行情:需升级至澎湃OS 3.0.40.0