研究 @perplexity_ai 2026-06-08

Perplexity 联合哈佛：AI Agent 效率远超传统搜索

三个月研究表明，使用 Computer 类自主 Agent 的工作者完成任务时间减少 87%，成本降低 94%，满意度更高。

TL;DR · 评测解读

Perplexity 联合哈佛发布 Agent vs 传统搜索对比研究，报告任务完成时间减少 87%、成本降低 94%。数字极为激进，但该研究由 Perplexity 参与资助、未经过同行评审，且「任务」定义模糊——高概率存在 cherry-picking 风险，结论需谨慎对待。

深度解读

测什么？

这是一项为期三个月的对照研究，比较「Computer 类自主 Agent」（可自主操作计算机界面完成任务的 AI 代理）vs 传统搜索在「工作者完成任务」场景下的效率差异。衡量指标包括：任务完成时间、成本消耗、用户满意度。

研究声称在三项指标上均有大幅提升，其中 87% 时间缩减和 94% 成本降低尤为激进——这类数字在 AI 领域属于极高置信度声明，通常也是 cherry-picking 的高风险信号。

方法论质疑

致命问题一：任务定义缺失。「完成任务」涵盖范围极广——从「帮我订一张机票」到「写一份市场分析报告」所需 AI 能力天差地别。87% 的时间节省极可能来自高度重复性、结构清晰的操作类任务（如数据录入、表格格式化），而这恰恰是当前 Agent 架构最擅长的场景。如果研究将「在浏览器中自动点击下单」与「深度行业研究」混为一谈，数据就没有可比性。

致命问题二：参与者背景不透明。研究对象是「工作者」——什么行业？什么岗位？他们的传统搜索技能 baseline 如何？如果 baseline 人群本身不擅长信息检索，效率提升自然会显著；反之，对熟练研究员而言，Agent 的「自主操作」反而可能引入额外噪音。

● 未登录访客

SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源，仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示？联系反馈

参考来源

Perplexity AI 官方发布推文 · 2026-06-08
AI Benchmark 数据可靠性指南（行业参考） · 2024-01-30

本解读由 AI 自动生成 · 模板：评测解读 · 仅供参考，请以原文为准。