来自 Twitter · Hacker News · GitHub 的 AI 行业动态
NVIDIA 阐释从建议型 AI 到行动型 AI 的转变 —— 自主 Agent 24/7 在后台处理复杂工作,让用户专注于决策本身。
NVIDIA 黄仁勋向卡内基梅隆大学 2026 届毕业生表示,没有一代人拥有比你们更强的工具和更大的机遇,这是塑造未来的时刻。
Codex 移动预览版今日在所有支持地区的 iOS 与 Android 推出;连接手机与 Windows Codex App 的功能即将到来。
Figure 第二日直播显示,旗下人形机器人 Bob、Frank、Gary 在全自主模式下连续 24/7 运行 Helix-02 模型。
Anthropic 发表论文,阐述对中美 AI 竞争的立场,认为美国及民主盟友目前在前沿 AI 占据领先地位,并探讨保持领先所需举措。
OpenAI CEO Sam Altman 确认 Codex 已上线 ChatGPT 手机应用。
xAI 上线 Grok Build 早期 Beta —— 用于编码、构建应用和自动化工作流的 agentic 命令行工具,目前向 SuperGrok Heavy 订阅用户开放。
Codex 现可在 ChatGPT 手机应用中预览:手机端发起任务、审阅输出、引导执行并批准下一步,同时 Codex 仍在笔记本、Mac mini 或 devbox 上运行。
Elon Musk 邀请用户试用 xAI 新推出的 Grok Build 早期 Beta 版,并征集改进建议。
a16z 提出,未来十年的企业价值将由「智能系统」承载——它从记录系统中提取上下文并采取行动,成为用户的一站式入口,而数据库则退居 API 层。
Anthropic 发布 Claude for Small Business,把 AI 集成进 QuickBooks、PayPal、HubSpot、Canva、DocuSign 等小企业常用工具,含 15 个预设工作流 + 8 个连接器,覆盖工资核算、现金流预测、催款等场景,在 Claude Team / Enterprise 订阅之外不另收费。
宝玉在 baoyu-skills 中新增「微信群聊总结」Skill,依赖 wx-cli 读取数据,配合 Claude Code + Claude Opus 4.6 效果最佳。
月之暗面宣布 Kimi K2.6 在金融 Agent 基准测试 V2(Finance Agent Benchmark V2)上成为开源权重模型第一名。
Kimi 发布浏览器扩展 Web Bridge,Agent 可像人类一样搜索、滚动、点击、输入并完成任务,支持 Kimi Code CLI、Claude Code、Cursor、Codex 等,现已上架 Chrome 商店。
Anthropic 宣布与盖茨基金会合作,提供 2 亿美元的资助、Claude 额度和技术支持,用于全球健康、生命科学、教育、农业和经济流动等项目。
桑德斯和 AOC 提出法案要求暂停所有 AI 数据中心建设,全美已有 300+ 地方法案,半数 2026 年计划项目面临延期或取消。Garry Tan 批评此举阻碍重大就业机会。
Snap 工程平台负责人 Prudhvi Vatala 分享,其团队将每日 10 多 PB 的数据处理迁移到 Google Cloud 上的 GPU 加速管线,在零代码改动下将作业成本降低 76%、内存占用减少 80%。
YC 公司 Foresight 构建 AI 驱动的消费者模拟,让快消、零售和科技团队在几分钟内预测产品发布或营销活动的反响,在财富 500 强客户测试中相比传统调研达到 95% 准确率。
YC 公司 WithAI 正在构建一个指挥中心,让机构投资者与 AI 协作完成股票研究、组合监控等工作。
Anthropic 将 Claude Code 每周用量上限提升 50%,即刻生效至 7 月 13 日,覆盖 Pro、Max、Team 及企业版全部入口。此举叠加在上周 5 小时窗口翻倍之上,两个维度的限额同时放宽。
YC 公司 Rudus 发布 AI 工程量估算平台,将原本需 100 多小时人工描图的单次投标流程自动化,让团队无需扩招即可承接 3-5 倍的工作量。
swyx 提出 Agent 自主性的递进层级:skill 是预设提示词,plan 是人类精炼的输入,goal 则由 AI 自行评估输出,自主程度逐级提升。
NVIDIA 宣布与 IneffableLabs 合作,共同设计面向大规模强化学习 Agent 的基础设施,探索构建可让 Agent 在各知识领域实现突破的训练管线,加速科学与产业发现。
a16z 合伙人 Seema Amble 撰文指出,随着记录系统巨头转向无头 Agent,新一代系统正变得「代理化」——捕获上下文、发起工作并记录数据。创业公司将围绕专有数据、行动层所有权和真实世界执行展开竞争。
Perplexity 公布企业客户案例——PayPal 团队每周在 Perplexity Enterprise 上运行 7.4 万个任务,用于模型验证、渠道表现、市场趋势研究、竞品情报与产品分析。
Runway 推出 Runway Agent,定位 AI 创意搭档——通过简单对话帮用户构思并产出完整的、含音效与剪辑的视频,覆盖广告、短片到社交内容。
Perplexity 介绍其 Computer 产品的安全设计——每个任务运行在独立的硬件隔离沙箱,VPC 级存储与计算分离;Agent 用短时效代理令牌而非原始 API key 认证。
NVIDIA 与 SAP 合作,把安全、治理与执行控制内置进 SAP Business AI Platform;NVIDIA OpenShell 帮助团队将 Agent 从开发推进到金融、采购、供应链等场景的可信生产部署。
YC 公司 Adialante 推出移动 MRI,将扫描成本降至每次数百美元、等待时间缩短到数小时,目标是让年度癌症筛查成为常态。