来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Stability AI 推出面向艺术创作的开源权重模型家族 Stable Audio 3.0,支持最长 6 分钟的可变长度生成与完整歌曲创作,用户在社区许可下拥有作品版权(年收入 100 万美元以内可商用)。
vLLM 与 Novita Labs 合作发布生产级外部 KV 缓存服务 PegaFlow,以独立 Rust 守护进程运行,使 KV 缓存在引擎崩溃、升级和模型切换后依然保留,预热后可让 vLLM 启动速度提升 2.15 倍。
Perplexity 将查询感知的上下文压缩技术投入生产,系统在最多削减 70% 上下文 token 的同时提升答案质量,并强调「更好的上下文胜过更多的上下文」。
上周末多场美国大学毕业典礼上,演讲嘉宾称赞 AI 时频频被学生嘘场,前 Google CEO 施密特、地产高管、唱片公司 CEO 均遭遇抵触;Gallup 调查显示美国人对 AI 的期待正在降温、愤怒上升。
OpenAI 表示该数学证明来自一个通用推理模型,而非专为解数学题打造的专用系统,并称这对数学界与 AI 界都是一个重要里程碑。
Figure AI 的人形机器人自主分拣直播进入第 8 天,已连续运行 167 小时,累计自主分拣 20.9 万件包裹。
Marc Andreessen 形容 AI 如同把沙子变成思想的炼金术——芯片由硅(即沙子)制成,接入数据中心、通电并装上 AI 后便开始思考。他称这可能是人类历史上最具革命性的技术。
马斯克回应称,Grok 最初被训练为在聊天模式下快速给出答案,而非为完成任务长时间深入思考。他表示后者才是智能体(agentic)模式的关键,xAI 正在修复这一问题,并将其列为高优先级。
Cursor 宣布自动化(Automations)功能上线 Agents 窗口,用户可在与 Agent 相同的工作区内创建和管理自动化任务。未来 7 天内,新建自动化的所有 Agent 运行享 5 折优惠。
Paul Graham 表示,认为必须趁现在的热潮创业、否则好点子都会被别人做完是一种谬误。他称这种说法自己听了 20 年,从未成真。
OpenAI 称此次数学突破指向更大趋势——AI 系统正变得能够维持长而困难的推理链条、跨领域连接想法,并提出研究者未曾探索的路径。OpenAI 认为同样的能力将很快加速生物、物理、工程和医学研究,但这一前景仍取决于人类判断。
Sam Altman 称一个通用模型解决了数学领域的重大公开难题,是一个不小的里程碑,未来几年这类成果会越来越多。他表示对 AI 拓展人类对世界的理解感到兴奋,但当天的心情也颇为复杂。
Sam Altman 列出 OpenAI 当前最期待的三件事:AGI 加速科研、加速企业,以及个人 AGI 帮助每个人实现目标。他同时提到前一日宣布的计划——向每家 YC 公司投资 200 万美元的 OpenAI 额度。
OpenAI 称其模型在「平面单位距离问题」上取得突破——这是数学家保罗·埃尔德什 1946 年提出的著名公开难题。模型发现了一类全新构造,优于沿用近 80 年的方格网格方案。OpenAI 称这是 AI 首次自主解决一个数学领域的著名公开问题。
马斯克表示,SpaceX 正以可观规模对外提供 AI 算力服务,近期与 Anthropic 扩大的合作即是例证。他称正与其他公司洽谈类似合作,未来还计划借助轨道数据中心进一步扩大 AI 服务规模。
在 Google I/O 上,NVIDIA 与谷歌云宣布双方联合开发者社区成立一年内成员突破 10 万。今年新增面向 NVIDIA GPU 的 JAX 学习路径、NVIDIA Dynamo 等内容。
Google DeepMind 推广其 Gemini Omni,并发布演示视频,展示如何用它来创作故事内容。
YC 合伙人 Tom Blom 在最新一期路演分享中拆解了如何构建递归式自我改进的 AI 闭环。他认为「副驾驶」是错误的心智模型,真正用对方法的创业者能让公司在自己睡觉时也持续优化。
Altman 宣布 OpenAI 向 YC 当前批次的每家创业公司提供价值 200 万美元的 token 投资,期待 tokenmaxxing 创业公司在内部运作与产品上的表现。
马斯克宣布 xAI 的 Grok Build 产品将每天发布 release notes,保持高频迭代节奏。
Google DeepMind 展示 Gemini 3.5 Flash 与 Antigravity 协作,模型可调度多个子智能体协同设计并搭建出一整座城市。
Figure AI 公布其人形机器人 F.03 连续第 7 天全自主运行,全天候 24 小时不间断作业且零故障。
OpenAI 披露用户每周在 ChatGPT 中生成超过 15 亿张图片。研究员 Kenji Hata 与产品负责人 Adele Li 在播客中探讨了 Images 2.0 发布以来涌现的新用例与趋势。
Google DeepMind 发布 Gemini for Science,一套面向科学家的实验性工具,可帮助他们探索更多假设、大规模验证研究、更轻松地梳理文献,加速科学发现。
Anthropic 透露过去数月持续与学者、哲学家、神职人员和伦理学家对话,探讨 AI 引发的问题,并从「良好品格如何形成」入手,拓宽前沿 AI 的讨论范围。
Cursor 现已上线 Jira,用户可将 Cursor 指派给工作项或在评论中 @Cursor 启动云端 Agent,它会基于标题、描述、评论和团队仓库配置生成可合并的 PR。
OpenAI 发布 Guaranteed Capacity 新服务,让客户锁定对 OpenAI 算力的长期访问,在算力受限的环境下为关键业务提前规划产能。
Claude 官方介绍 Cognition CEO Scott Wu,其团队打造的 AI 软件工程师 Devin 基于 Claude 构建,目标是让每个工程团队的软件开发效率提升 10 倍。
宇树科技展示 G1 人形机器人通过外部语音指令实时生成多样动作,视频一镜到底现场收音,动作由 AI 实时自主生成,存在轻微延迟。
Google DeepMind 推出新一代模型家族 Gemini 3.5,结合前沿智能与现实世界行动能力,首个版本 3.5 Flash 是其面向 Agent 和编程的最强模型。