研究 @OpenAI 2026-04-28

23 岁业余 + GPT-5.4 Pro 解 60 年 Erdős 难题

23 岁数学业余爱好者 Liam Price 借助 GPT-5.4 Pro，用 Markov 链 + von Mangoldt 权重一次 prompt 解出 Erdős Problem #1196（关于 primitive sets 的猜想），这是 60 年来未解之题；解答发表于 erdosproblems.com，OpenAI 官方在 The Cognitive Revolution 节目里讨论。

查看原文

TL;DR · 评测解读

这更像是一个精心包装的营销叙事，而非可信的 Benchmark 测试——无法确认 Erdős #1196 存在、GPT-5.4 Pro 型号名、解答真实性。数学突破不应靠 viral post 认定，而需同行评审。

深度解读

这测的是什么？

如果当真，这条资讯声称 GPT-5.4 Pro 解决了一个 60 年未解决的数论问题（关于 primitive sets 的 Erdős 猜想）。从表面看，它试图传递的 Benchmark 信息是：当前最强 LLM 在数学推理维度的 SOTA 能力。

方法论质疑

这条资讯存在多个重大方法论问题：

型号存疑：OpenAI 官方截止本文日期（2026-05-04）从未宣布过"GPT-5.4 Pro"。当前产品线中，Pro 是订阅层级，不是型号名。这极有可能是捏造或误传的型号名。
问题编号无法验证：Erdős Problems 在 erdosproblems.com 有系统编号，但公开资料中"Erdős Problem #1196"的引用极少或不存在。更广为人知的 primitive set 猜想是 Erdős 关于 ∑_{a∈A} 1/(a log a) 发散的猜想（已部分解决），但编号体系与此处不符。
来源单一且模糊：@OpenAI 发帖，但链接内容无法直接访问验证。"The Cognitive Revol

● 未登录访客

SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源，仅 Pro 会员可见
加入机智流 PRO →
¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示？联系反馈

参考来源

OpenAI (@OpenAI) 推文 · 2026-04-28
Erdős Problems Database · 2026-05-04
MATH Benchmark (Papers With Code) · 2026-05-04

本解读由 AI 自动生成 · 模板：评测解读 · 仅供参考，请以原文为准。