人工智能数学突破:GPT-5.2破解传奇埃尔德什问题令专家震惊
在一个令数学界震惊的安静周末实验中,软件工程师兼研究员尼尔·索马尼见证了一个关键转折。他目睹了OpenAI的最新模型GPT-5.2在十五分钟内,为一个高阶数学问题自主生成了一份完整且可验证的证明。这一发生在2024年末的事件,标志着人工智能真正开始推动人类知识前沿的重要里程碑,尤其是在备受尊崇且极具挑战性的纯数学领域。
GPT-5.2推动人工智能数学迈入新前沿
尼尔·索马尼最初的目标很简单:为大型语言模型的能力建立一个基准。他想了解这些系统在开放性数学问题上仍存在哪些困难。然而,结果却完全出乎意料。在将一个复杂问题粘贴到ChatGPT并让其进行了一刻钟的思维链推理后,索马尼返回时发现了一个完整的解决方案。他使用验证工具Harmonic对证明进行了严格评估和形式化,结果完美无误。
这不仅仅是模式识别。模型的推理过程调用了勒让德公式和贝特朗猜想等高等数学概念。它甚至定位并综合了哈佛大学数学家诺姆·埃尔基斯于2013年在Math Overflow上发布的信息。关键在于,GPT-5.2的最终证明与埃尔基斯的工作不同并有所拓展,为传奇人物保罗·埃尔德什提出的某个问题版本提供了更完整的解决方案。这标志着人工智能超越了数据检索,进入了真正具有适应性的问题解决阶段。
埃尔德什问题:人工智能的试金石
多产的匈牙利数学家保罗·埃尔德什的问题,长期以来一直是人类智力的基准。他提出的一千多个猜想被在线保存,主题和难度差异极大。多年来,它们代表了抽象推理的顶峰。如今,它们已成为人工智能驱动数学发现的主要试验场。
自GPT-5.2发布以来,进展速度急剧加快,索马尼和其他人形容其“据传闻更擅长数学推理”。自2024年12月下旬以来,埃尔德什问题网站出现了显著变化:有15个问题从“开放”状态转为“已解决”,其中11个解决方案明确将人工智能模型列为发现过程中的关键工具。首批自主解决方案于去年11月由一个名为AlphaEvolve的Gemini驱动模型完成,但GPT-5.2最近表现出非凡的熟练度。
菲尔兹奖得主陶哲轩在其GitHub上细致地跟踪了这一进展。他指出,在八个不同的埃尔德什问题中,人工智能模型取得了有意义的自主进展,另有六个案例中,人工智能通过定位并建立在先前不为人知的研究基础上,加速了进展。这些数据强调了人工智能在高级研究中即使尚未完全独立,也已扮演了协作角色。
人工智能在“长尾”问题中的可扩展优势
在Mastodon上,陶哲轩对人工智能在此领域特别有效的原因提出了关键见解。他推测,人工智能系统的可扩展性使其“更适合系统地应用于那些晦涩的埃尔德什问题的‘长尾’”。这些问题中有许多虽未解决,但可能拥有相对简单的解决方案,只是未能吸引人类持续关注。“因此,”陶哲轩继续写道,“这些较简单的埃尔德什问题现在更有可能通过纯粹基于人工智能的方法解决,而不是通过人类或混合手段。”这代表了数学研究模式的一个根本性转变。
形式化验证工具的关键作用
促成这一进展的并行革命是形式化方法的兴起。形式化验证涉及用精确的逻辑语言表达数学证明,计算机可以检查其绝对正确性。这个劳动密集型的过程消除了模糊性和错误。
像微软研究院开发的开源证明辅助工具Lean这样的工具,已成为行业标准。如今,人工智能正在使形式化过程本身自动化。索马尼使用的工具Harmonic Aristotle承诺处理将人类或人工智能生成的推理转化为可验证格式的大部分繁琐工作。这创造了一种强大的协同效应:人工智能提出创造性的解决方案,自动化工具则对其进行严格验证。
对于Harmonic创始人图多尔·阿奇姆而言,解决的问题本身不如专家们观念的改变重要。“我更关心的是数学和计算机科学教授正在使用这些人工智能工具这一事实,”阿奇姆说,“这些人需要维护声誉,所以当他们说自己在使用亚里士多德或ChatGPT时,那是真实的证据。”这种采用标志着人工智能从新奇事物转变为可信赖的研究工具。
对未来数学研究的影响
这一趋势的影响是深远的。人工智能并非取代数学家,而是在特定且强大的方面增强他们的能力。它充当了一个不知疲倦的研究助手,能够扫描数百年的文献,生成新的猜想,并在瞬间探索数千条算法路径。
该领域正朝着混合模式发展。在这种模式下,人类的直觉指导人工智能探索,而人工智能的生产力则放大人类的洞察力。这种合作可以显著加速数论、组合数学以及其他富含定义明确但未解决问题的领域的进展。
结论
以GPT-5.2解决埃尔德什问题为例的人工智能数学突破,是一个分水岭时刻。它将人工智能从计算和模式识别的工具,转变为在基础发现中的潜在合作伙伴。虽然完全自主、具有创造性的人工智能研究仍然遥远,但目前其在增强、形式化和系统化问题解决方面的能力已经重塑了数学实践。来自尼尔·索马尼等研究者的证据以及领先数学家的采纳证实,人工智能已在高级研究的舞台上赢得了一席永久之地。知识的前沿如今正被一种新型的合成智能所推动。

交易所
交易所排行榜
24小时成交排行榜
人气排行榜
交易所比特币余额
交易所资产透明度证明
资金费率
资金费率热力图
爆仓数据
清算最大痛点
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
ETF追踪
比特币持币公司
加密资产反转
以太坊储备
HyperLiquid钱包分析
Hyperliquid鲸鱼监控
索拉纳ETF
大额转账
链上异动
比特币回报率
稳定币市值
期权分析
新闻
文章
财经日历
专题
钱包
合约计算器
账号安全
资讯收藏
自选币种
我的关注