来自 Twitter · Hacker News · GitHub 的 AI 行业动态
a16z 合伙人 Seema Amble 分析 Salesforce 开放 API、推出无头产品的战略——在 Agentic 世界里价值押注在数据层而非 UI,并探讨剥离 UI 后企业的真正壁垒。
Cursor 上线新功能,云端 Agent 可在预先配置好的开发环境中运行——像给工程师配笔记本一样克隆仓库、安装依赖、配置工具链凭证。
Altman 表示用不上最聪明的模型会让他焦虑,但有时也不介意速度慢;他在思考 AI 产品是否该把重心更多放在价格 / 速度的权衡上。
Figure 直播展示 Figure 03 机器人运行 Helix-02 系统、连续 8 小时零人工干预完成物流分拣,Figure 称吞吐量达人类水平(公司自评,未经第三方验证);这是公开演示,非客户部署。
Sam Altman 宣布未来 30 天内,想试用 Codex 的企业可获得两个月免费使用额度,他称 Codex 是目前最好的 AI 编码产品,希望降低企业切换门槛。
阿里 Qwen3.6-Plus 上线 Nous Research 的 Hermes Agent 平台,限时免费开放体验。
Garry Tan 自述其开源的 GBrain 项目 72 小时内合并 14 个 PR、净增近 2.8 万行代码,新增热记忆层、实时事实抽取、5 套 embedding 配方等能力(数字为其本人通报)。
YC 项目 Aseon Labs 打造盒装机器人维护站,可在运营区域内为自动驾驶车队完成充电、清洗与检测。
YC 项目 InstaAgent 帮 B2C 公司把营销活动规模化到数百个细分人群、跨数百个社交账号定制投放并持续优化,10 个月内 ARR 突破 100 万美元。
Long Lake 达成协议、以约 63 亿美元收购百年美企 American Express Global Business Travel(Amex GBT),计划用 AI 改造业务;Elad Gil 称这是首例 AI 驱动的上市公司私有化,交易预计今年下半年交割。
Anthropic 推出 Claude for Legal:12 个细分法律领域插件 + 20 多个 MCP 连接器,集成 Thomson Reuters CoCounsel、LexisNexis 等工具,Freshfields 等律所已在实际案件中使用。
Hugging Face Hub 的交互式 demo 应用 Spaces 数量突破 100 万;平台同时托管超 200 万公开模型与 50 万+ 公开数据集。
Claude 应用推出 Magic Wand 小彩蛋,用户只需摇晃设备即可在亮色与暗色模式之间切换。
Runway 首届「Shows That Do not Exist Yet」Big Pitch 创意大赛公布 20 位获奖者,展示 AI 视频时代的原创剧集提案。
在卡内基梅隆大学 2026 毕业典礼上,黄仁勋呼吁面对 AI 时保持乐观、责任与雄心,指引而非畏惧未来。
Perplexity 公布在 GB200 NVL72 Blackwell 机柜上部署后训练 Qwen3 235B 的研究,证明 GB200 在大 MoE 高吞吐推理上对 Hopper 实现重大跨越,而非仅是训练平台。
Cursor 推出 Claude Opus 4.7 Fast 模式,输出速度提升 2.5 倍但成本是标准的 6 倍,建议大多数场景仍用标准速度。
Android Auto 全面升级视觉适配各类车机屏,新增高级娱乐功能,并接入更强 Gemini 辅助驾驶体验。
Anthropic 在 Code with Claude 活动上向参与者发放小型计算机,展示用户用 Claude 创造的轻巧而精妙的项目。
Paul Graham 评论 Musk vs Altman 案揭示 AI 远比所有人 2015 年预期更有前景,Sam 当年没意识到 AI 价值远超捐款规模。
Gemini Intelligence 将最强 Gemini 能力带入旗舰设备,融合高端硬件与创新软件,主动帮用户完成日常任务。
Googlebook 以 Gemini 为核心,主打重度负载性能并与 Android 手机深度同步,将于今年秋季上市。
DeepMind 发布实验性 demo,让用户通过动作、语音和自然简写直接在屏幕上指挥 Gemini,重新定义人机交互。
Musk 表示要让用户相信 X 没有暗中操纵推荐算法,任何影响内容展示的代码都必须开源。
Garry Tan 认为 AI 的关键不在让代码写得更快,而是把过去贵到难以承受的 90% 测试覆盖率变得几乎免费——验证成本被打到地板上,这才是真正的范式变化。
宇树推出首款量产载人机甲 GD01,整机含驾驶员约 500 公斤,可形态变换,定位民用车辆,起售价 65 万美元,呼吁用户友善与安全使用。
YC 宣布 Scope 启动,可观测 Claude Code、Codex、Cursor 等真实 AI Agent 工作流——记录 Agent 何时选择某产品、何时卡住、何时转向竞品,并指出该改什么。
Red Hat AI 团队在稳定的 vLLM 0.20.2 上系统评测 TurboQuant 量化方案,覆盖 30B–200B+ 的 4 个解码与 MoE 模型、5 个长上下文与推理基准,并以 FP8 和 BF16 为参照。
Replit 推出 Parallel Agents 功能,最多可同时运行 10 个 Agent,每个 Agent 在独立的应用副本和“自己的电脑”上工作,最后再以 Agent 化方式合并结果。
宝玉观察到 Codex App、Claude 桌面版、Cursor 3.0、TRAE SOLO 等顶级 Agent 在没有相互商量的情况下,几乎同时收敛到“左侧会话、中间对话、右侧工作区”的三栏布局,正成为当前 Agent 交互的最优解。