← 返回资讯
研究 @karpathy 2026-03-09

autoresearch 自动调参 3 天,GPT-2 训练时间缩短 11%

Karpathy 分享 autoresearch 自动调优实验,让 AI 自主寻找改进方案 2 天,发现约 20 项改进均可叠加迁移到更大模型,GPT-2 训练时间从 2.02 小时降至 1.80 小时。

查看原文
TL;DR · 评测解读

Karpathy 用 AI 自动搜索优化方案,在 GPT-2 上实现 11% 训练时间缩减,但这是一个受控条件有限的单点实验,且 GPT-2 本身已是高度优化过的基线,实际生产意义需要打折扣。

深度解读

测了什么?

这不是传统意义上的 Benchmark,而是一个内部优化实验。Karpathy 的 autoresearch 系统充当"自动研究员":给定训练 pipeline,用 2 天时间自主探索约 20 项改进,最终叠加后 GPT-2(1.24B 参数)的训练时间从 2.02 小时降至 1.80 小时。核心测量指标是 wall-clock training time。

方法论质疑

这里有若干需要追问的地方:

参考来源
  1. Karpathy 推文原文 · 2026-03-09
  2. AutoML 综述(OpenReview) · 2020-01-01
  3. FlashAttention 论文 · 2022-05-01
本解读由 AI 自动生成 · 模板:评测解读 · 仅供参考,请以原文为准。