来自 Twitter · Hacker News · GitHub 的 AI 行业动态
NLA 将不透明的 AI 激活转译为可理解的文本说明,研究显示 Claude 在续写对句时会提前规划可能的押韵词。
Cursor 3 内置 PR 审查工作流,可在同一界面查看评论、diff、提交记录与审查状态,并通过文件树和变更选择器快速浏览大型 PR。
新 Chrome 扩展让 Codex 通过编写并运行代码,自动完成结构化页面导航和复杂数据录入等浏览器重复操作。
Anthropic 把开源对齐工具 Petri 移交给 Meridian Labs 独立开发,并联合发布更新,提升 Petri 测试的适应性、真实性与深度。
Gemini 驱动的编码 Agent AlphaEvolve 过去一年在量子、生物科技、物流以及 Google AI 基础设施等场景持续推动算法优化。
Sam Altman 观察到年轻用户倾向通过语音与 AI 互动,中年和年长用户更偏好键盘输入,他好奇这一习惯未来是否会改变。
GPT-Realtime-2 可构建生产级语音 Agent;Translate 版支持 70+ 输入语言、13 输出语言流式翻译;Whisper 版用于实时音频转写。
Personal Computer 作为 Perplexity Computer 进阶版现已对所有用户开放,可跨本地文件、原生 Mac 应用、Web 与 Perplexity 安全服务器执行任务。
Grok Voice Think Fast 1.0 面向真实场景客服需求,可处理多步排障与高频工具调用,在嘈杂环境下仍保持速度与准确性。
Fitbit Air 主打轻量化、无屏幕设计,舒适到可 24/7 全天候佩戴,电池续航最长可达一周。
Cursor 推出新技能 /orchestrate,基于 Cursor SDK 递归派生子 Agent 来分摊大型任务;内部用它做自调研 skill 评测,token 消耗减少 20%,后端冷启动时间缩减 80%。
Anthropic 把内部小范围运行多年的安全漏洞悬赏项目正式上线 HackerOne,向所有研究者开放申报,对发现的漏洞给予奖励。
Paul Graham 在讨论支付时表示,加上信用卡手续费就等于把 Visa 这种软件病毒一并拖进未来,应该寻找绕过传统卡组织的方案。
在 GPT-Realtime-2 进入 API 后,OpenAI 安抚等待 ChatGPT 端语音升级的用户:相关更新正在路上,但暂未公布时间。
Anthropic 公布 The Anthropic Institute(TAI)研究议程,方向包括:1)经济扩散;2)威胁与韧性;3)真实世界中的 AI 系统;4)AI 驱动的 R&D。
Sam Altman 重申 OpenAI 对开发者的态度:让一个真正优秀的工程师在 AI 加持下迸发出疯狂的产能,比把他们替换掉更酷。
Y Combinator 联合创始人 Paul Graham 表示,过去 20 年他都在教人怎么赚十亿美元——核心方法是创办一家高速增长的公司,而你只需要造出别人真心想要的产品。
马斯克为 xAI 的 Grok Voice 摇旗,建议企业把它接入客服场景,进一步加码语音 AI 在 toB 客户支持上的争夺。
Sam Altman 称用户在需要倾倒大量上下文时已习惯用语音与 AI 互动,GPT-Realtime-2 在 API 上线是相当大的一步,ChatGPT 内的语音体验也在改进中。
OpenAI 宣布 Codex 直接进入 Chrome 浏览器,能更好地与网页与应用协作,并在后台跨多个标签页并行执行任务而不接管浏览器。
Anthropic 发布新研究 Natural Language Autoencoders,训练 Claude 将自身的激活向量解码为人类可读文本,朝可解释性又迈一步。
Chamath Palihapitiya 称 Spencer Pratt 表达条理清晰、观点合理,认为其若当选 LA 市长可让城市重回安全与繁荣,呼吁公众完整观看辩论后自行判断。
OpenAI 在 API 推出最新语音模型 GPT-Realtime-2,主打 GPT-5 级推理与实时协作;同时上线流式翻译模型 GPT-Realtime-Translate 与转写模型 GPT-Realtime-Whisper。
Anthropic 宣布 Claude for Excel、PowerPoint、Word 全面 GA,Claude for Outlook 进入公开测试,Claude 在不同微软应用间流转时可携带完整对话上下文。
马斯克再度为 Cybertruck 棱角设计辩护,称其超硬不锈钢车身板厚到普通薄钢冲压机会被直接压坏,因此只能采用折面造型,并强调它兼具防弹坦克与百万美元跑车操控。
xAI 在 API 推出图像生成 Quality 模式,该模型已在 Grok 端累计生成超 3 亿张图,主打更高真实感、更强文字渲染和更可控的创意。
马斯克透露 xAI 正在 Colossus 2 超算集群中同时训练多个 Grok 模型,并称 Grok Built 工具调用框架进展顺利。
马斯克在 X 简短表态,xAI 旗下大模型 Grok 仍在持续迭代演进。
ServiceNow 在 Knowledge 2026 大会发布基于开源模型 + 英伟达 OpenShell 的长时运行桌面 Agent Project Arc,主打治理、可审计与安全执行的企业级 AI Agent。
Dreaming 功能可回顾 Agent 过往会话、提取模式并整理为长期记忆,使 Agent 在多轮使用中持续积累经验,目前开放申请试用。