来自 Twitter · Hacker News · GitHub 的 AI 行业动态
vLLM v0.21.0 发布:367 commits 来自 202 位贡献者。亮点包括 KV Offload + HMA、推理模型 thinking budget 投机解码、Blackwell 上的 TOKENSPEED_MLA(DSR1 / Kimi K2.5)、Mooncake 分布式 KV、DeepSeek V4 流水并行;基线升级到 C++20 + Transformers v5。
swyx 转发:新加坡官员 @Gavriel_Cohen 公开他在 WhatsApp 上 hack、并基于 SQLite 做 graph memory 的技术栈,用于外交与议会工作流,被调侃为「vibecoded country」。
Garry Tan 介绍其开源项目 GBrain:不是普通 RAG,而是为 Agent 提供 8 层协同记忆,让 OpenClaw / Hermes Agent 等具备个性化长期记忆能力。
Figure 公布 F.03 人形机器人正进行连续 24/7 自主作业,已进入第 4 天,目标是测试运行到失效为止以衡量可靠性极限。
xAI 宣布 Hermes Agent 已支持调用用户的 X Premium 订阅权益,并新增对 X 平台帖子的搜索能力。
Chamath 用同一道股票筛选 prompt 对比 Grok、Gemini、ChatGPT、Claude,前三家都给出可比结果,唯独 Claude 拒绝执行。他警告 Anthropic 不解决算力/电力瓶颈就会被边缘化。