← 返回资讯
研究 @Kimi_Moonshot 2026-03-16

Kimi:提出 Attention Residuals 新方法,重新思考深度聚合机制

月之暗面发布 Attention Residuals 研究,用学习型、输入依赖的注意力机制替代传统固定残差连接,能选择性地检索先前层表征,有效缓解信息稀释和隐状态膨胀问题。

查看原文
本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。