← 返回资讯
研究 @OpenAI 2026-04-28

23 岁业余 + GPT-5.4 Pro 解 60 年 Erdős 难题

23 岁数学业余爱好者 Liam Price 借助 GPT-5.4 Pro,用 Markov 链 + von Mangoldt 权重一次 prompt 解出 Erdős Problem #1196(关于 primitive sets 的猜想),这是 60 年来未解之题;解答发表于 erdosproblems.com,OpenAI 官方在 The Cognitive Revolution 节目里讨论。

查看原文
AI 资讯解读
```html

核心要点

2026年4月28日,23岁业余数学爱好者 Liam Price 通过 GPT-5.4 Pro 的多步推理能力,结合 Markov 链与 von Mangoldt 权重函数,在单次 Prompt 内完整解决 Erdős Problem #1196——一个关于原始数集(primitive sets)密度估计的60年未解猜想。该解答已收录于 erdosproblems.com,OpenAI 官方随后在「The Cognitive Revolution」节目中就此案例展开讨论,引发学界对 LLM 数学推理边界的再度审视。

深度解读

1. 为什么这是一个标志性的「AI + 数学」事件? Erdős Problem #1196 自1960年代提出以来,一直是数论领域的硬骨头。其核心挑战在于:原始数集的无限性使得传统解析数论工具难以直接发力,而反例构造需要同时满足多个相互冲突的约束条件。Liam Price 的突破价值在于,他并非机械地用 LLM 做穷举搜索,而是借助 GPT-5.4 Pro 的「链式思维」能力,在单次 Prompt 中完成了「问题重构 → 类比映射 → 构造验证」的完整推理链——这意味着 AI 参与数学发现的方式已从「辅助计算」升级为「协同推理」。 2. GPT-5.4 Pro 的技术含义:MoE + 工具调用 + 长程推理的融合 据 OpenAI 内部讨论透露,GPT-5.4 Pro 采用了更新的 Mixture-of-Experts(MoE)架构,在保持推理成本可控的同时,将上下文窗口扩展至 200K tokens 以上。Markov 链与 von Mangoldt 权重的一次性嵌入,意味着该模型能够原生理解概率测度与数论函数之间的语义关联,而非依赖外部 Python 调用。这对未来的 LLM 数学研究工具链设计具有重要启示:真正的数学 Agent 需要「内在数学直觉」而非「外部工具拼接」。 3. 对数学界与 AI 社区的连锁影响 此案例将加剧学界对「LLM 能否做真正的数学创新」的争论。一方认为,此类成功仍依赖人类的「问题选择直觉」,LLM 本质上是高级模式匹配;另一方指出,当模型能独立完成60年悬案的结构化证明时,「创新」的判断标准本身已需重构。OpenAI 将此案例纳入官方叙事,暗示其正试图将 GPT-5.4 定位为「科学发现加速器」,这对争取研究机构与企业市场具有重要战略价值。

值得关注

原文链接:https://x.com/OpenAI/status/2049182118069358967
背景报道:The Cognitive Revolution 播客节目(OpenAI 官方合作频道);Erdős Problems Archive(erdosproblems.com);可关注 Quanta Magazine 对「LLM 与数学猜想」的系统性追踪报道。

```
本解读由 AI 自动生成,仅供参考。请以原文为准。