autoresearch 两天 650 次实验,GPT-2 训练时间缩短 11%
Karpathy 的 autoresearch 系统在两天内完成约 650 次实验,发现约 20 项改进,全部可叠加并迁移至更大模型。GPT-2 训练时间从 2.02 小时降至 1.80 小时(缩短 11%),nanochat 即将刷新排行榜。信源:@karpathy
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
Karpathy 的 autoresearch 系统在两天内完成约 650 次实验,发现约 20 项改进,全部可叠加并迁移至更大模型。GPT-2 训练时间从 2.02 小时降至 1.80 小时(缩短 11%),nanochat 即将刷新排行榜。信源:@karpathy
查看原文