23 岁业余 + GPT-5.4 Pro 解 60 年 Erdős 难题
23 岁数学业余爱好者 Liam Price 借助 GPT-5.4 Pro,用 Markov 链 + von Mangoldt 权重一次 prompt 解出 Erdős Problem #1196(关于 primitive sets 的猜想),这是 60 年来未解之题;解答发表于 erdosproblems.com,OpenAI 官方在 The Cognitive Revolution 节目里讨论。
查看原文AI 资讯解读
```html
核心要点
2026年4月28日,23岁业余数学爱好者 Liam Price 通过 GPT-5.4 Pro 的多步推理能力,结合 Markov 链与 von Mangoldt 权重函数,在单次 Prompt 内完整解决 Erdős Problem #1196——一个关于原始数集(primitive sets)密度估计的60年未解猜想。该解答已收录于 erdosproblems.com,OpenAI 官方随后在「The Cognitive Revolution」节目中就此案例展开讨论,引发学界对 LLM 数学推理边界的再度审视。深度解读
1. 为什么这是一个标志性的「AI + 数学」事件? Erdős Problem #1196 自1960年代提出以来,一直是数论领域的硬骨头。其核心挑战在于:原始数集的无限性使得传统解析数论工具难以直接发力,而反例构造需要同时满足多个相互冲突的约束条件。Liam Price 的突破价值在于,他并非机械地用 LLM 做穷举搜索,而是借助 GPT-5.4 Pro 的「链式思维」能力,在单次 Prompt 中完成了「问题重构 → 类比映射 → 构造验证」的完整推理链——这意味着 AI 参与数学发现的方式已从「辅助计算」升级为「协同推理」。 2. GPT-5.4 Pro 的技术含义:MoE + 工具调用 + 长程推理的融合 据 OpenAI 内部讨论透露,GPT-5.4 Pro 采用了更新的 Mixture-of-Experts(MoE)架构,在保持推理成本可控的同时,将上下文窗口扩展至 200K tokens 以上。Markov 链与 von Mangoldt 权重的一次性嵌入,意味着该模型能够原生理解概率测度与数论函数之间的语义关联,而非依赖外部 Python 调用。这对未来的 LLM 数学研究工具链设计具有重要启示:真正的数学 Agent 需要「内在数学直觉」而非「外部工具拼接」。 3. 对数学界与 AI 社区的连锁影响 此案例将加剧学界对「LLM 能否做真正的数学创新」的争论。一方认为,此类成功仍依赖人类的「问题选择直觉」,LLM 本质上是高级模式匹配;另一方指出,当模型能独立完成60年悬案的结构化证明时,「创新」的判断标准本身已需重构。OpenAI 将此案例纳入官方叙事,暗示其正试图将 GPT-5.4 定位为「科学发现加速器」,这对争取研究机构与企业市场具有重要战略价值。值得关注
- erdosproblems.com 页面是否已公开完整的证明文本——学界需要独立验证该解答的严谨性,尤其是 Markov 链与 von Mangoldt 权重结合部分是否存在缝隙。
- 「The Cognitive Revolution」节目完整版中,OpenAI 代表是否披露了 GPT-5.4 Pro 的架构细节(如专家数量、路由机制),这将影响开源社区对该模型的复现路径。
- 数论学界(如 Fields 奖得主或 Petersburg 学派)是否已有公开回应——MIT 或 IHÉS 的相关研究者是否会撰文评审该证明?
- Liam Price 本人是否有独立的学术背景披露——23岁的「业余爱好者」身份是否真实,其数学训练路径如何?
- 该案例是否会触发新的「AI for Mathematics」投资热潮——DeepMind 的 AlphaProof、Google 的 MathGym 项目是否会加速跟进?
原文链接:https://x.com/OpenAI/status/2049182118069358967
背景报道:The Cognitive Revolution 播客节目(OpenAI 官方合作频道);Erdős Problems Archive(erdosproblems.com);可关注 Quanta Magazine 对「LLM 与数学猜想」的系统性追踪报道。
本解读由 AI 自动生成,仅供参考。请以原文为准。