来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Cursor 发布技术报告,详细描述 Composer 2 的训练方法和架构设计,公开其 AI 编程助手核心模型的技术细节。
OpenAI 宣布关停 AI 视频生成产品 Sora,包括独立 App 和 API 全部下线。去年上线后曾登顶 App Store,但因 IP 限制收紧后活跃度骤降,迪士尼刚签的三年合作协议也受影响。
Karpathy 披露 litellm 包遭供应链攻击,安装即可窃取 SSH 密钥、AWS/GCP/Azure 凭证、K8s 配置等敏感信息。该包月下载量达 9700 万次,且所有依赖 litellm 的项目均受波及。
Claude Code 新增 auto 模式,无需逐一审批文件写入和命令执行,也无需完全跳过权限检查。系统会在每个操作执行前自动进行安全检查,兼顾效率与安全。
Google 为 Google TV 推出 Gemini 功能:体育实时比分卡、视频食谱教程、健康/经济/科技等话题的深度学习探索。
专为 Apple Silicon 设计的 LLM 推理调度器,利用存储层级感知优化推理性能。HN 172 票。
Google Gemini 现在支持原生视频嵌入,开发者基于此构建了亚秒级视频语义搜索工具。HN 193 票。
OpenAI 宣布将关闭 AI 视频生成应用 Sora 及其 API,具体关闭日期尚未公布。迪士尼 10 亿美元投资计划同步终止。背景是成本控制和 IPO 准备。
ARM 发布 136 核 AGI CPU(面向 AI 数据中心,非通用 AGI)。ARM 设计、TSMC 3nm 代工。这是 ARM 35 年来首次推出自有品牌芯片(此前只授权 IP 给其他厂商),标志着商业模式重大转型。Meta 为首批客户。
YC CEO Garry Tan 宣布即将开源他构建的新项目,强调创业核心是做出人们想要的东西,而非代码量。
NVIDIA CEO Jensen Huang 做客 Lex Fridman 播客 #494,分享思维方式,并发表争议性声明:我认为我们已经实现了 AGI。
NVIDIA 宣布 CEO Jensen Huang 将在卡内基梅隆大学 2026 年毕业典礼发表演讲,并获授荣誉科学与技术博士学位。
Y Combinator 宣布 2026 冬季批次 Demo Day 开幕。数百家 AI/科技初创公司向投资人展示产品。
Claude 官方解释 Computer Use 的安全架构:每次工具调用前,分类器会审查是否为潜在破坏性操作。安全操作自动执行,风险操作被阻止并采取替代方案。仍建议在隔离环境中使用。
AI 开发者常用的 Python 库 litellm(4万Stars/月下载9500万次)在 PyPI 上被植入恶意代码。1.82.7 需 import 触发,1.82.8 通过 .pth 文件在任何 Python 进程启动时自动窃取 SSH 密钥、云凭证等。2000+ 包受影响。
NVIDIA Jim Fan 警告 AI Agent 时代整个文件系统都将成为攻击向量。
swyx 高度评价 Modular/Mojo 的内核基础设施,认为其开源策略既实用又极难被追赶。
Claude Code auto 模式已向 Team 计划用户开放,Enterprise 和 API 将陆续推出。
Google DeepMind 展示 Gemini 3.1 Flash-Lite 的极速网页生成能力。
长期用户更倾向与 Claude 精细迭代协作,较少完全交给 AI 自主执行,且尝试更高价值任务。
Anthropic 分享多智能体 harness 架构提升 Claude 在前端设计和自主软件工程任务中的表现。
Altman 表示 AI 将帮助发现新科学,同时也带来生物威胁等社会挑战,需要全社会协同应对。
Neuralink 脑机接口帮助 ALS 患者通过思维控制打字,结合 AI 克隆声音实现语音输出,并非自然恢复说话能力。
Y Combinator 总裁 Garry Tan 分享亲身体验:使用 AI 编程工具 Conductor 成功在 YC 内部 184 万行代码库中完成了一个 2400 行的 PR,展示了 AI 编程工具处理大型遗留代码库的能力。
Runway 宣布 2026 AI Festival 征集作品,截止日期为 4 月 20 日,涵盖利用 AI 创作的电影、设计、新媒体、时尚、广告和游戏六个方向。
vLLM 在 GTC 2026 分享最新技术方向:Model Runner V2 用 Triton 内核替代 CPU PyTorch 算子;混合内存分配器将内存浪费降至 0-12%;编码器预填充分离使多模态 P99 吞吐提升最高 2.5 倍。
AI 编程工具 Cursor 发布新功能,支持在 Figma 中直接使用团队的设计系统创建新组件和前端界面,进一步打通设计到代码的工作流。
Google DeepMind 宣布与敏捷机器人公司(Agile Robots)建立研究合作关系,将 Gemini 基础模型与其硬件平台整合,共同推动下一代实用型机器人的开发。
NeurIPS 2026 官方手册明确声明:作为美国法律管辖下的实体,NeurIPS 基金会必须遵守美国制裁与贸易限制,不能接受来自被制裁机构的论文投稿,也不能为被制裁实体提供同行评审、编辑和出版服务。摘要截止 5月4日,全文截止 5月6日。
宝玉建议技术学习应先明确目标,用 Deep Research 等工具调研所需技术栈,再针对性学习。从深度和广度两个维度入手,建立技术全景地图。