← 返回资讯
大模型 HuggingFace Daily Papers 2026-07-01

MOPD:LLM 后训练中用于能力集成的多教师在线蒸馏

MOPD:LLM 后训练中用于能力集成的多教师在线蒸馏

MOPD 通过专门的强化学习教师和在线蒸馏技术,实现大型语言模型多领域能力的高效整合,性能超越现有方法。

查看原文
解读生成中或暂时不可用,请稍后刷新重试,或直接查看原文。