来自 Twitter · Hacker News · GitHub 的 AI 行业动态
GPT-5.5 在编码与调试、在线研究、数据分析、文档表格生成、软件操作等任务上表现突出,在代理式编码、计算机使用、知识工作和早期科研方向收益最明显。
Altman 盛赞推理团队高效部署 GPT-5.5 的工程能力,并表示 OpenAI 必须在相当程度上成为一家 AI 推理公司。
Claude Managed Agents 新增记忆能力并开放公测,Agent 可从每次会话中学习,底层记忆层在性能与灵活性之间取得平衡。
OpenAI 表示 GPT-5.5 在真实部署中保持与 GPT-5.4 相同的 per-token 延迟,但在几乎所有评测中表现更好,并在 Codex 任务中使用明显更少的 token。
OpenAI 与 NVIDIA 试点将 Codex 部署到整个公司,效果良好,Altman 邀请更多企业参与类似合作。
Altman 阐述 OpenAI 将继续坚持迭代部署作为安全策略核心,并通过最高效的模型、推理栈与算力让更多用户用上顶级 AI。
Claude 扩展第三方应用连接器,覆盖 Tripadvisor、Booking.com、Resy、Instacart、Spotify、Audible、AllTrails、Thumbtack 以及 Intuit TurboTax 等日常服务。
OpenAI CEO Sam Altman 宣布 GPT-5.5 正式上线,表示希望它能帮到用户,并分享了个人使用体验。
OpenAI 正式推出 GPT-5.5,定位于真实工作与代理场景,能理解复杂目标、调用工具、自我检查并将任务执行到底,已在 ChatGPT 和 Codex 上线。
Perplexity 宣布最新开源权重 SOTA 模型 Kimi K2.6(Moonshot)已在 Pro 与 Max 订阅中开放使用,用户可直接选用该模型进行搜索和问答。
宇树科技展示加装轮子的人形机器人方案,回应用户对轮式设计的偏好,强调人形机器人是通用 AI 与人类数据训练的理想形态,可按需选择是否加装轮子。
Moonshot 发布 Kimi K2.6 Agent Swarm:单次运行支持 300 个并行子 Agent × 4000 步(K2.5 为 100/1500),可输出 100+ 文件、10 万字文献综述或 2 万行数据集,覆盖搜索、分析、编码、长文写作与视觉生成。
OpenAI 发文讨论 Agent 的定位:擅长跨工具协调、跟踪进度并推动任务前进,无需持续监督,适合处理需要时间、上下文和后续跟进的复杂工作。
Google 在 Cloud Next 推出 Gemini Enterprise Agent Platform,帮助企业构建、扩展、治理和优化数千个 AI Agent,整合 Vertex AI 的模型与服务,并新增 Agent Studio 处理复杂工作流。
Cursor 推出 Slack 集成,用户在频道中 @Cursor 即可启动任务,Cursor 基于线程及频道上下文工作,实时流式展示进度,并自动创建 PR 供审查合并。
Ollama 宣布 Qwen 3.6 27B 模型上线,支持 ollama run qwen3.6:27b 直接对话,并可通过 ollama launch 命令接入 OpenClaw 或 Claude Code 等代码助手本地使用。
Google Cloud Next 上,NVIDIA 与 Google Cloud 宣布扩大合作:推出 Vera Rubin 驱动的 A5X 实例(可扩展至近 100 万 Rubin GPU),Gemini 登陆 Google Distributed Cloud,首个云端机密计算 Blackwell GPU,Nemotron/NeMo 接入 Gemini Enterprise Agent Platform。
Perplexity 发布搜索增强回答的后训练研究,采用 SFT + RL 管线提升搜索、引用质量、指令跟随与效率,搭配 Qwen 模型在事实性上以更低成本匹配或超越 GPT 模型。
Chamath 认为 AI 博弈逻辑已变:已获审批并通电的土地加上硅片访问权才是真正的瓶颈,未来几年 OpenAI、Anthropic 将被迫签下更多此类深度绑定协议。
马斯克称若年度算力达到 100TW,将相当于美国全年经济规模的 200 倍,届时美元将不再被使用。
马斯克回复谷歌 CEO Sundar Pichai,表示 Google 的 TPU 芯片被外界低估。
Anthropic 基于此前收集的 8.1 万条用户反馈,发布新研究,聚焦受访者对 AI 的经济期望与担忧。
Moonshot 宣布 Kimi K2.6 在 OpenRouter 的编程能力排行榜上排名第一。
Anthropic 在 Claude Cowork 中上线交互式图表与图示功能,以 beta 形式对所有付费计划开放。
Google DeepMind 联合 Google Cloud 发布 Gemini Enterprise Agent Platform,由 Vertex AI 进化而来,提供模型选型、Agent 构建、集成与安全管控能力。
Google 推出第八代 TPU,采用双芯片方案:训练用 TPU 8t 单 pod 算力达上代 Ironwood 近 3 倍;推理用 TPU 8i 单 pod 可连接 1152 颗芯片,低延迟并发运行数百万 Agent。
OpenAI 宣布在 ChatGPT 中上线 workspace agents——可跨工具与团队共享的 Agent,用于处理复杂任务和长时间运行的工作流。
阿里通义千问发布开源稠密模型Qwen3.6-27B,主打旗舰级Agentic编码能力,在所有主要编码基准上超过Qwen3.5-397B-A17B,支持思考/非思考双模式,Apache 2.0协议。
Sam Altman 表态 OpenAI 将继续为用户提供更多 AI 资源,呼应 Codex 速率限制重置消息。