← 返回资讯
产品发布 HuggingFace Daily Papers 2026-07-01

TRIAGE:智能体强化学习的角色化信用分配

TRIAGE:智能体强化学习的角色化信用分配

TRIAGE引入了一种角色化信用分配框架,通过比标准GRPO方法更细粒度的信用分配来增强智能体强化学习。

查看原文
解读生成中或暂时不可用,请稍后刷新重试,或直接查看原文。