来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Meta AI 发布线程展示社区使用 Muse Spark 的创意作品和玩法,展现该工具在实际场景中的多样化应用。
Anthropic 发布 advisor tool API,让 Sonnet/Haiku 作为执行者跑任务,遇到难题时请 Opus 出主意。Sonnet+Opus 在 SWE-bench 多语言测试上提升 2.7 个百分点且成本降 11.9%,Haiku+Opus 在 BrowseComp 从 19.7% 跳至 41.2%。
Replicate 平台宣布 Seedance 2.0 向所有用户开放,可通过文字、图片、视频和音频生成电影级画质视频,支持立体声同步和真实物理效果,生成时间不到 2 分钟。
Runway 宣布 Seedance 2.0 视频生成模型现已面向所有付费计划用户开放(包括美国),支持图片、视频、文字和音频输入。新用户可用 SEEDANCE 代码享 3 个月半价。
知名投资人 Chamath 认为 AI 正在重构企业,将公司简化为三个关键元素:行业专家知识、难以文档化的部落知识、以及连接两者的软硬件基础设施。如果前两者被充分记录,企业就能彻底重构运作方式。
LeCun 澄清自己是主动离开 Meta 而非被解雇,主要原因是 Meta 对大语言模型的过度侧重与他的研究方向不一致。
Anthropic 宣布 Advisor 功能正式进入 Beta 阶段,开发者可在 Claude Platform 上使用该功能,实现多模型协作的 Agent 开发。
OpenAI 宣布 Plus 订阅者的 Codex 推广期结束,同时重新平衡 Codex 用量分配,支持一周内更多次会话而非单日超长会话。Plus 仍是日常使用的最佳 20 美元选择,100 美元新 Pro 套餐适合重度用户。
开发者可在 Messages API 中添加 Advisor 工具,当 Sonnet 或 Haiku Agent 在执行中遇到复杂决策时,会自动咨询 Opus 获取计划方案,全程在单次 API 请求中完成。
LeCun 表示自己从未参与 Llama 技术开发,仅在 Llama-2 时推动了开源决定。此后项目由 Meta GenAI 部门负责,而他所在的 FAIR 专注于长期研究,与 Llama 团队无技术交集。
Anthropic 推出 Advisor 工具,Sonnet 在遇到困难决策时可调用 Opus 获取方案指导。评测显示 Sonnet+Opus 顾问在 SWE-bench 多语言上比纯 Sonnet 高 2.7 个百分点,且每任务成本降低 11.9%。
Karpathy 认为 OpenClaw 之所以引发如此大的反响,是因为这是大量非技术用户第一次亲身体验到最新的 Agent 模型能力,此前他们只知道 ChatGPT 网页版。
OpenAI 宣布现有 200 美元 Pro 套餐仍是最高用量选项,作为对现有 Pro 用户的回馈,Codex 2 倍用量推广延长至 5 月底,并再次重置 Codex 速率限制。
Musk 抨击 ChatGPT 的讨好型回复策略,认为这种通过认同用户危险观点来最大化收入的做法需要被制止。
Sam Altman 表示 Codex 获得了巨大反响,OpenAI 因此推出 100 美元/月的 Pro 套餐,为重度用户提供介于 Plus(20 美元)和 Pro(200 美元)之间的选择。
Karpathy 指出公众对 AI 能力的理解严重滞后,许多人只用过免费版 ChatGPT 就形成了对 AI 的固有印象,嘲笑各种瑕疵,但最新的 Agent 模型能力已远超他们的认知。
Andrej Karpathy 在测试 245 页 PDF 转换后表示结果严重错乱,认为 PDF 转换难度极高,需要作为 SOTA 大模型的一项技能而非普通程序来实现。
Cursor 新增功能:云端 Agent 在提交 PR 时可自动附带工作演示和截图,团队成员可直接在 GitHub 中审查 Agent 生成的工件,提升代码审查效率。
Google DeepMind 宣布 Gemma 4 发布首周下载量超 1000 万次,Gemma 系列总下载量突破 5 亿。Gemma 4 在不需大量算力的情况下,性能超越体量 10 倍的模型,开源社区参与度持续走高。
OpenAI 推出新的 $100/月 Pro 层级,Codex 用量为 Plus 的 5 倍,适合长时间高强度编码。原 $200 Pro 保留为最高用量选项,Plus 则重新平衡 Codex 配额以支持更均匀的周用量分布。限时至 5 月 31 日提升所有用户 Codex 使用额度。
Claude Cowork 现已面向所有付费计划正式开放。企业版新增基于角色的访问控制、团队支出限制、用量分析和扩展的 OpenTelemetry 功能,方便管理员在组织内全面部署。
Anthropic 将 Advisor 策略引入 Claude Platform:以 Opus 作为顾问、Sonnet 或 Haiku 作为执行者,在 SWE-bench Multilingual 上比单独 Sonnet 高 2.7 个百分点,同时每任务成本降低 11.9%。开发者只需在 Messages API 中添加 advisor 工具即可启用。
Latent Space 创始人 swyx 宣布 AI Engineer 大会将首次在欧洲举办,与前 JSConf EU 组织者合作,致力于在全球范围内推动 AI 工程师社区发展。
Y Combinator 校友公司 Luminai 完成 3800 万美元 B 轮融资,专注为大型医疗系统将传真等非结构化数据转化为结构化数据,并用 AI Agent 自动化关键流程。
微软研究院公布 2026 年全球 Research Fellowship 入选名单,研究方向涵盖 AI 社会影响、可扩展推理、模型适配与评估、生物科学建模及 AI 基础设施。
Mistral AI 宣布 AI Now Summit 将于 5 月 28 日在巴黎举行,内容包括技术深度讲座、创始人分享公司战略和即将推出的产品,门票已开售。
vLLM 旗下 llm-compressor 项目达到 3000 Star 里程碑,已支持 Gemma 4 和 Qwen 3.5 的 NVFP4 和 FP8 量化检查点,实现一次量化、vLLM 直接部署。
Runway AI Festival 将于今年 6 月在纽约和洛杉矶举办,涵盖电影、设计、新媒体、时尚、广告和游戏领域的 AI 创作,投稿截止 4 月 20 日。
Musk 在推文中披露当前 Grok 模型总参数量为 0.5 万亿,体积仅为 Sonnet 的一半和 Opus 的十分之一,强调其在同等规模下表现出色。
Perplexity 的 Computer 功能现已支持通过 Plaid 连接银行账户、信用卡和贷款,用户可详细追踪消费、构建自定义预算工具,并可视化净资产和投资组合。