来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Sam Altman 表示 ChatGPT 在最新更新后体验大幅提升,向团队成果表示自豪。
Anthropic 宣布 Claude Design 能力升级,所有套餐的 token 上限统一翻倍,用户可基于 Claude 创作更多内容。
马斯克称法官从未真正就 OpenAI 案件实体作出裁决,仅基于日历技术问题驳回;他将上诉至第九巡回法庭,认为为掠夺慈善机构开创先例对美国慈善事业极具破坏性。
LlamaIndex 总结 AI Engineer 新加坡站行程:workshop、keynote 与高管晚宴均已完成,下一站为数周后在旧金山举办的 World's Fair。
swyx 指出 AI Engineer 大会原始视频因不打"脑腐式"标题,被"影响力运营"账号近乎每日翻播且不署原讲者出处,呼吁观众转发时主动 @ 原账号补署名。
宝玉分享自己的模型选型经验:写作场景下 Claude Opus 4.6 表现最佳,翻译场景下 Gemini 3.1 Pro 最强。
GarryTan 宣布 GBrain 已将 ZeroEntropy 设为推荐默认 embedding 与 reranker,取代 OpenAI 与 Voyage AI 的方案。
Garry Tan 总结编程范式演进:过去是写代码去调用 LLM,今天是写 prompt 与 skill 文件让 LLM 来执行代码,明天的形态尚未可知。
YC CEO Garry Tan 观察旧金山现状:AI 已接近"勉强可用的 AGI",目前仍昂贵且为少数"祭司阶层"掌握,但正从精英技术走向普惠工具,个人 AI 即将爆发。
Chamath 警告 PwC、Accenture:OpenAI 与 Anthropic 一边公开扶持咨询业的竞争者,一边用客户用量反哺自己,咨询公司应当采用控制平面去仲裁多模型,而非把外部 LLM 直接塞进组织。
Elon Musk 在 X 上表示 xAI 旗下 Grok Build 正以"闪电般速度"迭代,编码与构建能力持续加速。
马斯克透露:0.5T Grok V8 基础模型(对应公开版 4.3)仍在数日级迭代;1.5T 参数的 V9 已完成预训练,接下来将进行 Cursor 数据补充训练、SFT 和 RL,预计 3-4 周内发布。
Figure 宣布其人形机器人车队累计处理超过 10 万件包裹,全程联网协作、24/7 自主运行。
YC 宣布:Elyra 为餐厅提供 AI 预订系统,自动应答所有来电和邮件,帮餐厅把闲置桌位填满;头部餐厅上线数周即观察到入座率创新高。
a16z 本周图表:多个 AI 使用密度较高的行业出现可量化的生产力提升证据,被列为本周值得关注的趋势。
vLLM v0.21.0 发布:367 commits 来自 202 位贡献者。亮点包括 KV Offload + HMA、推理模型 thinking budget 投机解码、Blackwell 上的 TOKENSPEED_MLA(DSR1 / Kimi K2.5)、Mooncake 分布式 KV、DeepSeek V4 流水并行;基线升级到 C++20 + Transformers v5。
swyx 转发:新加坡官员 @Gavriel_Cohen 公开他在 WhatsApp 上 hack、并基于 SQLite 做 graph memory 的技术栈,用于外交与议会工作流,被调侃为「vibecoded country」。
Garry Tan 介绍其开源项目 GBrain:不是普通 RAG,而是为 Agent 提供 8 层协同记忆,让 OpenClaw / Hermes Agent 等具备个性化长期记忆能力。
Figure 公布 F.03 人形机器人正进行连续 24/7 自主作业,已进入第 4 天,目标是测试运行到失效为止以衡量可靠性极限。
xAI 宣布 Hermes Agent 已支持调用用户的 X Premium 订阅权益,并新增对 X 平台帖子的搜索能力。
Chamath 用同一道股票筛选 prompt 对比 Grok、Gemini、ChatGPT、Claude,前三家都给出可比结果,唯独 Claude 拒绝执行。他警告 Anthropic 不解决算力/电力瓶颈就会被边缘化。
Vercel 旗下 v0 发布 Browser Use 功能:v0 可以打开自己构建的应用、使用并评审设计、调试复杂流程,并在工作过程中实时把所见截图发回给用户。
Ollama 宣布在云端新增大量 Blackwell GPU 来服务 GLM-5.1 模型,并支持通过 ollama launch 启动 Claude Code、Codex App、Hermes Agent 等客户端。
OpenAI CEO 回应内部模型行为报告时承认:用户(包括他自己)对当前 AI 能力的预期被拉高得极快,「我已经习惯了现在的 magic,希望再多一点」——一句话讲清 LLM 行业的 hedonic treadmill 难题:感知红利远跑不过认知折旧。
Google 官号点名 5 月 19 日 10:00 PT 的 Google I/O 主舞台直播,明示将首发产品更新与 AI 突破。结合此前传闻的 Gemini 3.1 / Gemma 4 / Agent Builder 全家桶,本周下半段开发者关注焦点已经锁定。
Chamath 公开吐槽 Claude 的 PPT 上传交互:「先开新对话、删一些页、不要超过最大图片数⋯⋯就像我自己脑子一样」,开发者共鸣点直接戳到 Claude 长上下文 + 多模态 UX 的痛点,2470 点赞下方挤满 Anthropic Pro 用户跟帖。
Social Capital 创始人 Chamath 发布 AI 价值累积框架,按基础设施(土地/电网/冷却/矿物/晶圆)→ 模型 → 应用 → 工具 四层拆解,逐层指出价值如何沉淀、又如何向上层让渡——给一级市场投资人提供「下注哪一层」的判断脚手架。
Figure AI 公开了第三天的耐久测试:人形机器人连续 24 小时全自主作业,公司直播「跑到出故障为止」,把人形机器人能否稳定承担工厂级长时任务,从 demo 演示推到 endurance test 公开化阶段。
xAI 官宣 Grok 订阅用户可在 Nous Research 的 Hermes Agent 框架里直接接入,闭源 KOL 套餐第一次跟开源 Agent 生态打通——意味着 Grok-5 现在能被任意开发者塞进 Hermes 推理链做工具调用。
YC 总裁 Garry Tan 抛出 2026 投资圈最大反共识断言:现在用 OpenClaw 写代码 + Nous Hermes 推理 + GBrain 一站式入口(按 token 计费可冲到 $10k/月)的开发者,已经在用 2028 年才会普及的 AI 能力,每月只需 100 美元起步,这是相对竞争对手最大的单点解锁。