← 返回资讯
研究 HuggingFace Daily Papers 2026-07-03

向混合注意力模型演进

向混合注意力模型演进

FlashMorph将混合层选择形式化为预算约束优化问题,通过可变形模型和线性化正则化提升Transformer的长上下文效率。

查看原文
解读生成中或暂时不可用,请稍后刷新重试,或直接查看原文。