全部 今日 本周 本月
2026-05-16

vLLM v0.21.0 发布:KV Offload、Blackwell TOKENSPEED_MLA、DeepSeek V4 流水并行

vLLM v0.21.0 发布:367 commits 来自 202 位贡献者。亮点包括 KV Offload + HMA、推理模型 thinking budget 投机解码、Blackwell 上的 TOKENSPEED_MLA(DSR1 / Kimi K2.5)、Mooncake 分布式 KV、DeepSeek V4 流水并行;基线升级到 C++20 + Transformers v5。

观点 · 观点/主张 AI 摘要 · 单一来源
@vllm_project 阅读 →

新加坡官员用自建 AI 栈处理外事/议会事务

swyx 转发:新加坡官员 @Gavriel_Cohen 公开他在 WhatsApp 上 hack、并基于 SQLite 做 graph memory 的技术栈,用于外交与议会工作流,被调侃为「vibecoded country」。

行业 AI 摘要 · 单一来源
@swyx 阅读 →

GarryTan:开源 GBrain,为 Agent 提供 8 层记忆架构

Garry Tan 介绍其开源项目 GBrain:不是普通 RAG,而是为 Agent 提供 8 层协同记忆,让 OpenClaw / Hermes Agent 等具备个性化长期记忆能力。

行业 AI 摘要 · 单一来源
@garrytan 阅读 →

Figure AI:F.03 人形机器人进入第 4 天不间断自主运行

Figure 公布 F.03 人形机器人正进行连续 24/7 自主作业,已进入第 4 天,目标是测试运行到失效为止以衡量可靠性极限。

机器人 AI 摘要 · 单一来源
@Figure_robot 阅读 →

xAI:Hermes Agent 接入 X Premium,新增帖子搜索能力

xAI 宣布 Hermes Agent 已支持调用用户的 X Premium 订阅权益,并新增对 X 平台帖子的搜索能力。

行业 AI 摘要 · 单一来源
@xai 阅读 →

chamath:Anthropic 若不解决算力问题将沦为 AI 时代的 Friendster

Chamath 用同一道股票筛选 prompt 对比 Grok、Gemini、ChatGPT、Claude,前三家都给出可比结果,唯独 Claude 拒绝执行。他警告 Anthropic 不解决算力/电力瓶颈就会被边缘化。

大模型 AI 摘要 · 单一来源
@chamath 阅读 →