AI 资讯 | AI Insight

JavaScript 已关闭 · 内容可正常浏览，但 PWA 安装 / 返回顶部 / 移动底部导航等增强功能不可用

.noscript-banner{position:relative;background:#fff8ed;border-bottom:2px solid #c4956a;padding:14px 20px;text-align:center;font:14px/1.6 -apple-system,system-ui,sans-serif;color:#1c1917;z-index:9999}.noscript-banner a{color:#c4956a;font-weight:600;text-decoration:underline;margin:0 8px} JavaScript 已关闭 · 部分交互功能（视频播放/付费墙/登录）需要开启 JS。基础内容可正常浏览 → 资讯研报播客/访谈活动登录

全部今日本周本月

2026-05-16

vLLM v0.21.0 发布：KV Offload、Blackwell TOKENSPEED_MLA、DeepSeek V4 流水并行

vLLM v0.21.0 发布：367 commits 来自 202 位贡献者。亮点包括 KV Offload + HMA、推理模型 thinking budget 投机解码、Blackwell 上的 TOKENSPEED_MLA（DSR1 / Kimi K2.5）、Mooncake 分布式 KV、DeepSeek V4 流水并行；基线升级到 C++20 + Transformers v5。

观点 · 观点/主张 AI 摘要 · 单一来源

@vllm_project 阅读 →

新加坡官员用自建 AI 栈处理外事/议会事务

swyx 转发：新加坡官员 @Gavriel_Cohen 公开他在 WhatsApp 上 hack、并基于 SQLite 做 graph memory 的技术栈，用于外交与议会工作流，被调侃为「vibecoded country」。

行业 AI 摘要 · 单一来源

@swyx 阅读 →

GarryTan：开源 GBrain，为 Agent 提供 8 层记忆架构

Garry Tan 介绍其开源项目 GBrain：不是普通 RAG，而是为 Agent 提供 8 层协同记忆，让 OpenClaw / Hermes Agent 等具备个性化长期记忆能力。

行业 AI 摘要 · 单一来源

@garrytan 阅读 →

Figure AI：F.03 人形机器人进入第 4 天不间断自主运行

Figure 公布 F.03 人形机器人正进行连续 24/7 自主作业，已进入第 4 天，目标是测试运行到失效为止以衡量可靠性极限。

机器人 AI 摘要 · 单一来源

@Figure_robot 阅读 →

xAI：Hermes Agent 接入 X Premium，新增帖子搜索能力

xAI 宣布 Hermes Agent 已支持调用用户的 X Premium 订阅权益，并新增对 X 平台帖子的搜索能力。

行业 AI 摘要 · 单一来源

@xai 阅读 →

chamath：Anthropic 若不解决算力问题将沦为 AI 时代的 Friendster

Chamath 用同一道股票筛选 prompt 对比 Grok、Gemini、ChatGPT、Claude，前三家都给出可比结果，唯独 Claude 拒绝执行。他警告 Anthropic 不解决算力/电力瓶颈就会被边缘化。

大模型 AI 摘要 · 单一来源

@chamath 阅读 →