来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Cursor 新增功能:云端 Agent 在提交 PR 时可自动附带工作演示和截图,团队成员可直接在 GitHub 中审查 Agent 生成的工件,提升代码审查效率。
Google DeepMind 宣布 Gemma 4 发布首周下载量超 1000 万次,Gemma 系列总下载量突破 5 亿。Gemma 4 在不需大量算力的情况下,性能超越体量 10 倍的模型,开源社区参与度持续走高。
OpenAI 推出新的 $100/月 Pro 层级,Codex 用量为 Plus 的 5 倍,适合长时间高强度编码。原 $200 Pro 保留为最高用量选项,Plus 则重新平衡 Codex 配额以支持更均匀的周用量分布。限时至 5 月 31 日提升所有用户 Codex 使用额度。
Claude Cowork 现已面向所有付费计划正式开放。企业版新增基于角色的访问控制、团队支出限制、用量分析和扩展的 OpenTelemetry 功能,方便管理员在组织内全面部署。
Anthropic 将 Advisor 策略引入 Claude Platform:以 Opus 作为顾问、Sonnet 或 Haiku 作为执行者,在 SWE-bench Multilingual 上比单独 Sonnet 高 2.7 个百分点,同时每任务成本降低 11.9%。开发者只需在 Messages API 中添加 advisor 工具即可启用。
Latent Space 创始人 swyx 宣布 AI Engineer 大会将首次在欧洲举办,与前 JSConf EU 组织者合作,致力于在全球范围内推动 AI 工程师社区发展。
Y Combinator 校友公司 Luminai 完成 3800 万美元 B 轮融资,专注为大型医疗系统将传真等非结构化数据转化为结构化数据,并用 AI Agent 自动化关键流程。
微软研究院公布 2026 年全球 Research Fellowship 入选名单,研究方向涵盖 AI 社会影响、可扩展推理、模型适配与评估、生物科学建模及 AI 基础设施。
Mistral AI 宣布 AI Now Summit 将于 5 月 28 日在巴黎举行,内容包括技术深度讲座、创始人分享公司战略和即将推出的产品,门票已开售。
vLLM 旗下 llm-compressor 项目达到 3000 Star 里程碑,已支持 Gemma 4 和 Qwen 3.5 的 NVFP4 和 FP8 量化检查点,实现一次量化、vLLM 直接部署。
Runway AI Festival 将于今年 6 月在纽约和洛杉矶举办,涵盖电影、设计、新媒体、时尚、广告和游戏领域的 AI 创作,投稿截止 4 月 20 日。
Musk 在推文中披露当前 Grok 模型总参数量为 0.5 万亿,体积仅为 Sonnet 的一半和 Opus 的十分之一,强调其在同等规模下表现出色。
Perplexity 的 Computer 功能现已支持通过 Plaid 连接银行账户、信用卡和贷款,用户可详细追踪消费、构建自定义预算工具,并可视化净资产和投资组合。
Garry Tan 分享 markdown 驱动的 Agent 体验,Agent 能自行判断何时调用 GStack skill 辅助用户完成任务。
宝玉分享 baoyu-slide-deck 技能,可通过 Claude Code 直接从 PDF 或素材生成手绘风格演示幻灯片。
Musk 表态 Grok 不会接受心理治疗式的价值观对齐,暗示其对 AI 安全限制的立场。
Musk 发推调侃称如果只用两本书训练 Grok,AI 就大功告成了,配图引发社区热议。
NVIDIA 首次在 MLPerf 视觉语言模型性能基准测试中使用 vLLM,展示双方工程协作成果,证明 vLLM 在 NVIDIA 硬件上的卓越性能。
YC CEO Garry Tan 分享让 AI Agent 自动学习技能的方法:首次手动执行后将流程编码为 SKILL.md,并添加定时任务实现自动化。
Musk 透露特斯拉自动驾驶小模型的进步速度已超过大模型的迭代节奏,V15 版本将正式采用大模型。
特斯拉 FSD V14.3 发布评测,Musk 称后续小版本将持续打磨,V15 将在完全无人监督的复杂场景中远超人类安全水平。
Meta AI 发布 Muse Spark,这是一个从零构建的多模态视觉模型,支持视觉 STEM 问题解答、实体识别和定位,可实现如家电故障排查配动态标注等交互式应用场景。
Sentry 将其 Seer 根因分析能力与 Claude Managed Agents 打通,可自动生成修复代码并提交 PR,整个集成仅用数周完成。
日本乐天利用 Anthropic 的 Managed Agents 平台,分别为产品、销售、营销和财务部门部署了专属 AI Agent,每个仅用不到一周时间即完成上线。
n8n 推出实用指南和可下载模板,展示如何将确定性步骤与 AI 步骤混合,构建更快速、低成本、高可靠的自动化工作流。
AK 分享 Video-MME-v2 论文,该基准旨在推进视频理解评估进入下一阶段,涵盖更全面的视频分析能力测试。
Box CEO Aaron Levie 和前微软高管 Steven Sinofsky 讨论 AI 支出,认为企业工程计算预算中 token 占比可能从 1% 到 100%,CFO 们需要全新的预算框架。
LMSys 与 DeepLearning.AI 合作推出 SGLang 推理优化课程,核心技术 RadixAttention 可避免重复处理系统提示词,大幅提升推理效率。
Together AI 宣布上线智谱 GLM-5.1 模型,为 AI 开发者提供可靠推理服务,支持生产级 Agent 工程和长程编码工作流。
Replit 分享产品经理工作流观察——构建在功能完成时结束,但发布要等所有人理解才算完成,展示如何用同一环境完成两者。