来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Anthropic Fellows 新研究提出"内省适配器"工具,让语言模型自报训练中习得的行为,包括潜在的对齐偏差,用于检测模型隐藏倾向。
Anthropic 用 99 道真实生物数据题对比 Claude 与专家小组,专家在 23 题上无解,最新模型解出其中约 30%,并攻克剩余大部分题目。
通义千问推出基于 TileLang 的 FlashQLA:前向 2-3 倍、后向 2 倍加速,专为端侧 Agentic AI 设计,在小模型、长上下文与张量并行场景下收益尤为明显。
微软 FY26 Q3 财报创纪录:营收 829 亿美元,AI 业务年化运行率突破 370 亿美元,Azure 同比增长 40%(按固定汇率 39%),Microsoft 365 Copilot 付费席位超过 2000 万。
OpenAI 启动 DevDay 2026 门票挑战赛,每周从基于 GPT-5.5 + Image Gen 的作品中挑选 2-3 个获胜者,由 Codex 协助初筛、官方团队定夺。
OpenAI 介绍 Codex 不止于写代码,还能处理资料整理、表格、演示稿、摘要等围绕主线工作的辅助任务。
Figure AI 公布 F.03 人形机器人在 BotQ 工厂的量产进展:120 天内日产能从 1 台提升至 1 台/小时,本周将生产 55 台。
OpenAI 官宣 DevDay 2026 回归,时间定在 9 月 29 日,地点旧金山。
Paul Graham 拜访 Legora 后表示,这家公司将在 2027 年超越 Harvey,未来唯一可能的对手只剩大模型厂商,而法律恰是少数能抵御模型公司侵入的领域。
土耳其开发者 Bedirhan Keskin 凭借基于语音的临床模拟器 MedKit 获得金奖,可让医学生练习问诊、开化验、做诊断,并依据最新指南对推理过程评分。
Anthropic 与 cerebral_valley 联合举办的 Claude Code 黑客松收官,参与者使用 Opus 4.7 进行了一周开发,官方公布了获奖作品名单。
Cursor 发布 SDK,开发者可使用与 Cursor 相同的运行时、框架和模型,在 CI/CD、自动化流程或自有产品中嵌入 Agent。
Sam Altman 表示,OpenAI 的 Codex 编码 Agent 正迎来一波类似 ChatGPT 当年的爆发期。
微软 1 月开源的 9B 参数语音转文字模型 VibeVoice-ASR 单次可处理 60 分钟音频。Simon Willison 在 M5 Max MacBook 跑 4-bit 量化版,转写 1 小时播客耗时 8 分 45 秒。
YC CEO Garry Tan 抨击旧金山禁建 AI 数据中心提案,称此举将摧毁本地就业、税基,并把 AI 竞赛拱手让给中国。
Sam Altman 在 X 上预告 OpenAI 接下来几次更新值得期待,并称团队成员 ajambrosino 表现亮眼。
DeepSeek 官方宣布 V4-Pro 折扣促销延期至 2026 年 5 月 31 日 15:59 UTC,开发者可继续享受降价 API 调用。
蚂蚁集团 Ling-2.6-flash 即时 MoE 模型上线即获 vLLM Day-0 支持。104B 总参/7.4B 激活,混合 1:7 MLA+Lightning Linear 注意力,262K 上下文,原生工具调用。
Apple 提出 Stochastic KV Routing,让 KV Cache 可在不同深度间自适应共享,提升大模型推理效率。
vLLM 项目盛赞 Fireworks AI 在模型质量问题诊断上的严谨与高标准,称这正是开源推理生态需要的态度。
HashiCorp 联合创始人 Mitchell Hashimoto 称 GitHub 频繁宕机影响工作,宣布把开源终端模拟器 Ghostty 从 GitHub 迁出,过去一个月几乎每天都有故障日记标记。
NVIDIA 引述 Fireworks AI 联合创始人 Lin Qiao 观点,认为定制化推理与模型扩张正大幅压缩从生产到规模化的时间线,2026 是 AI 爆发之年。
Runway 第二届 Big Pitch 创作大赛奖金最高 10 万美元,作品提交截止时间为 5 月 4 日,欢迎创作者投稿。
YC 公司 Saffron 上线,提供针对软件工程师 AI 工具使用能力的评估服务,定位为帮企业发掘下一代 10 倍工程师。
港科大、新国大、牛津等高校联合发表 88 页世界模型综述,提出 L1 预测器/L2 模拟器/L3 进化器 × 物理/数字/社会/科学四领域的二维框架。
Replit 在社交媒体邀请开发者利用周末时间在其平台上动手开发新项目,附带活动相关链接。
Sam Altman 回应粉丝建议,认为某项功能或方向未来某个时刻做起来确实有价值,但暂未给出明确时间表。
Sam Altman 在回复中确认,购买 ChatGPT Pro 订阅后即可获得相关功能或权益,未透露具体细节。
Runway 推出新教程,介绍利用参考图、角色设定表和提示词技巧,在生成视频中实现一致的人物形象与声音。
宝玉认为 AI 半年内取代人类工作的说法并不靠谱,只要用 AI 真正做过稍复杂的项目就会有切身体会。