产品发布 @ycombinator 2026-06-01

BentoLabsAI获YC支持，推出长时运行代理监控和学习层

其学习层让代理实现模型跃升：Sonnet 4.5在TB2测试中从42.2%提升至52.4%。恭喜创始团队Abhinavv_soni和kacppian发布产品。

TL;DR · 产品解读

YC 支持的 BentoLabsAI 推出 Agent 监控和学习层，通过内置的 self-improvement 机制让 Sonnet 4.5 在 TB2 基准上提升 10.2%，标志着 AI Agent 从「一次性执行」向「持续自优化」范式的转变。

深度解读

BentoLabsAI 推出的是一套针对长时运行 Agent的监控与自我学习层（Monitoring & Learning Layer）。其核心创新在于：不是让开发者手动调优 Agent，而是让 Agent 在运行过程中自动捕获错误、分析失败模式并更新自身策略，形成闭环。

官方案例显示，其学习层使 Sonnet 4.5 在 TB2 测试中从 42.2% 跃升至 52.4%——这意味着基础模型无需更换，仅通过外部学习机制即可获得接近 Sonnet 4.5 Ultra 的表现。

当前 Agent 开发的核心痛点是：部署后性能衰减（drift）和无法自适应纠错。传统方案依赖人工干预的评估（evaluation）和 prompt 调整，而 BentoLabsAI 的思路是让 Agent 在生产环境中持续学习，把每次执行的结果作为训练信号回流到决策层。

这与 OpenAI 的「Agent」方向（借助工具调用实现复杂任务）和 Anthropic 的「MCP」（Model Context Protocol）形成互补——后者解决「Agent 如何调用外部工具」，前者解决「Agent

● 未登录访客

SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源，仅 Pro 会员可见

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示？联系反馈

参考来源

本解读由 AI 自动生成 · 模板：产品解读 · 仅供参考，请以原文为准。