← 返回资讯
研究 @_akhaliq 2026-03-13

IndexCache:跨层索引复用加速稀疏注意力计算

新论文提出 IndexCache 方法,通过跨层索引复用机制加速稀疏注意力计算,提升大模型推理效率。

查看原文
本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。