大模型 @llama_index 2026-06-10

ParseBench：Fable 5在文档理解上领先，忠实度90%

相较Gemini 3 Flash和GPT‑5.5，Fable 5在内容忠实度和语义格式化分别提升至90%与72%，优势明显。

TL;DR · 评测解读

LlamaIndex 发布 ParseBench 评测榜单，Fable 5 在文档内容忠实度达 90%、语义格式化 72%，显著领先 Gemini 3 Flash 与 GPT-5.5，标志着 AI 文档理解能力进入新标杆阶段。

深度解读

事件维度：ParseBench 榜单正式出炉，Fable 5 横空出世

LlamaIndex 于 2026 年 6 月 10 日通过官方账号 @llama_index 发布了 ParseBench 基准测试的首批结果。该榜单聚焦 AI 模型对复杂文档的理解与还原能力，核心指标为「内容忠实度」和「语义格式化」两项。测试结果显示，Fable 5 以 90% 忠实度和 72% 语义格式化两项数据全面领先竞品——Gemini 3 Flash 与 GPT-5.5 在同等测试条件下表现明显落后。

「忠实度」衡量模型对原始文档信息的保留程度，「语义格式化」则评估模型对文档结构（表格、标题层级、列表等）的还原准确率。90% 的忠实度意味着 Fable 5 在十段落文本中仅丢失约一成的关键信息，这在企业级文档处理场景中具有实质性意义。

行业影响：文档 AI 从「能读」进化到「读懂并还原」

此次榜单发布的时间窗口恰逢 Q2 末各大厂商年中盘点期，具备明确的信号作用——LlamaIndex 意在抢在各大厂发布下一代模型之前，为开源社区和企业用户提供第三方客观参照。

从竞争格局看，Gemini 3 Flash（Google）和 GPT-5.5（OpenAI）均为当前

● 未登录访客

SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源，仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示？联系反馈

参考来源

ParseBench benchmark results - LlamaIndex official · 2026-06-10
LlamaIndex ParseBench 官方页面 · 2026-06-10

本解读由 AI 自动生成 · 模板：评测解读 · 仅供参考，请以原文为准。