← 返回资讯
研究 @perplexity_ai 2026-06-08

Perplexity 联合哈佛:AI Agent 效率远超传统搜索

三个月研究表明,使用 Computer 类自主 Agent 的工作者完成任务时间减少 87%,成本降低 94%,满意度更高。

查看原文
TL;DR · 评测解读

Perplexity 联合哈佛发布 Agent vs 传统搜索对比研究,报告任务完成时间减少 87%、成本降低 94%。数字极为激进,但该研究由 Perplexity 参与资助、未经过同行评审,且「任务」定义模糊——高概率存在 cherry-picking 风险,结论需谨慎对待。

深度解读

测什么?

这是一项为期三个月的对照研究,比较「Computer 类自主 Agent」(可自主操作计算机界面完成任务的 AI 代理)vs 传统搜索在「工作者完成任务」场景下的效率差异。衡量指标包括:任务完成时间、成本消耗、用户满意度。

研究声称在三项指标上均有大幅提升,其中 87% 时间缩减和 94% 成本降低尤为激进——这类数字在 AI 领域属于极高置信度声明,通常也是 cherry-picking 的高风险信号。

方法论质疑

致命问题一:任务定义缺失。「完成任务」涵盖范围极广——从「帮我订一张机票」到「写一份市场分析报告」所需 AI 能力天差地别。87% 的时间节省极可能来自高度重复性、结构清晰的操作类任务(如数据录入、表格格式化),而这恰恰是当前 Agent 架构最擅长的场景。如果研究将「在浏览器中自动点击下单」与「深度行业研究」混为一谈,数据就没有可比性。

致命问题二:参与者背景不透明。研究对象是「工作者」——什么行业?什么岗位?他们的传统搜索技能 baseline 如何?如果 baseline 人群本身不擅长信息检索,效率提升自然会显著;反之,对熟练研究员而言,Agent 的「自主操作」反而可能引入额外噪音。

未登录访客
SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示?联系反馈

参考来源
  1. Perplexity AI 官方发布推文 · 2026-06-08
  2. AI Benchmark 数据可靠性指南(行业参考) · 2024-01-30
本解读由 AI 自动生成 · 模板:评测解读 · 仅供参考,请以原文为准。