← 返回资讯
研究 @allen_ai 2026-04-10

Allen AI:开源 MolmoWeb 全套代码,支持训练和评估 Web Agent

Allen AI 发布 MolmoWeb 完整代码库,包含训练代码、评估工具、标注工具、合成数据管线和客户端代码,支持在自定义任务上训练和评估 Web Agent。

查看原文
AI 资讯解读

核心要点

2026 年 4 月 10 日,Allen AI(艾伦人工智能研究所)正式开源 MolmoWeb 完整代码库。该项目是 Molmo 系列模型在 Web Agent 场景下的延伸,提供从训练到评估的全链路工具链,涵盖训练代码、评估工具、人工标注工具、合成数据生成管道以及客户端代码。这意味着研究者和开发者可以在自定义任务上灵活训练和评估网页交互 Agent,而无需从零构建基础设施。该开源行为被视作 Allen AI 在多模态语言模型领域持续推进开源战略的重要一步。

原文 + 中文翻译

原文(基于摘要核心信息):
Allen AI has released the complete MolmoWeb codebase, including training code, evaluation tools, annotation tools, synthetic data pipelines, and client code, enabling training and evaluation of Web Agents on custom tasks.

翻译:
Allen AI 发布了完整的 MolmoWeb 代码库,包括训练代码、评估工具、标注工具、合成数据管道和客户端代码,支持在自定义任务上训练和评估 Web Agent。

深度解读

1. 为什么这在 Web Agent 领域很重要?

Web Agent(网页交互智能体)是大语言模型落地的重要方向之一,其核心能力是让模型理解网页结构、执行点击/输入等操作、并在多步骤任务中保持上下文。现阶段开源社区在 Web Agent 方向虽有 BrowserGym、WebArena 等评估框架,但具备端到端训练 + 评估能力的完整开源方案仍然稀缺。Allen AI 的 MolmoWeb 开源直接填补了这一空白——它不仅是一个模型权重,而是从数据合成、模型训练到任务评测的完整闭环。研究者可以用它快速验证新的训练策略,企业也可以将其作为内部自动化流程的基础。

2. 开源工具链的完整性意味着什么?

MolmoWeb 包含的五大组件各有价值:训练代码让社区能复现或改进 Web Agent 的训练流程;评估工具提供标准化的任务表现测量;标注工具解决网页动作数据稀缺的问题;合成数据管道则大幅降低了高质量训练数据的人工成本;客户端代码简化了模型与真实浏览器环境的对接。这种"全栈开源"降低了 Web Agent 研究的技术门槛,有望催生更多社区创新。参考 OpenAI 在 2024 年开源 evals 工具后引发评测生态繁荣的先例,Allen AI 此举可能推动 Web Agent 领域的快速发展。

3. Allen AI 的战略意图与行业位置

Allen AI 一直以"开放科学"为核心理念,此前已开源 Molmo-72B 等多模态模型,在 Hugging Face 上积累了大量关注。Web Agent 场景相较于通用多模态理解更偏向任务导向(goal-oriented),数据标注成本更高、技术落地链条更长。Allen AI 选择开源完整工具链而非仅开放模型权重,表明其希望构建生态而非单纯"刷榜"——通过降低使用壁垒吸引更多研究者在 MolmoWeb 基础上迭代。此外,这与 AI2(Allen AI 所属机构)长期推进"让 AI 研究更可复现"的使命一脉相承。

值得关注

信源行
原文链接:https://x.com/allen_ai/status/2042618879650725996
背景报道:Hugging Face – Allen AI Molmo 系列模型页 / Allen AI Molmo GitHub 仓库 / arXiv – Molmo: Multi-Modal Large Language Models 相关论文

本解读由 AI 自动生成,仅供参考。请以原文为准。