来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Anthropic 用 99 道真实生物数据题对比 Claude 与专家小组,专家在 23 题上无解,最新模型解出其中约 30%,并攻克剩余大部分题目。
通义千问推出基于 TileLang 的 FlashQLA:前向 2-3 倍、后向 2 倍加速,专为端侧 Agentic AI 设计,在小模型、长上下文与张量并行场景下收益尤为明显。
微软 FY26 Q3 财报创纪录:营收 829 亿美元,AI 业务年化运行率突破 370 亿美元,Azure 同比增长 40%(按固定汇率 39%),Microsoft 365 Copilot 付费席位超过 2000 万。
OpenAI 启动 DevDay 2026 门票挑战赛,每周从基于 GPT-5.5 + Image Gen 的作品中挑选 2-3 个获胜者,由 Codex 协助初筛、官方团队定夺。
OpenAI 介绍 Codex 不止于写代码,还能处理资料整理、表格、演示稿、摘要等围绕主线工作的辅助任务。
Figure AI 公布 F.03 人形机器人在 BotQ 工厂的量产进展:120 天内日产能从 1 台提升至 1 台/小时,本周将生产 55 台。
OpenAI 官宣 DevDay 2026 回归,时间定在 9 月 29 日,地点旧金山。
Paul Graham 拜访 Legora 后表示,这家公司将在 2027 年超越 Harvey,未来唯一可能的对手只剩大模型厂商,而法律恰是少数能抵御模型公司侵入的领域。
土耳其开发者 Bedirhan Keskin 凭借基于语音的临床模拟器 MedKit 获得金奖,可让医学生练习问诊、开化验、做诊断,并依据最新指南对推理过程评分。
Anthropic 与 cerebral_valley 联合举办的 Claude Code 黑客松收官,参与者使用 Opus 4.7 进行了一周开发,官方公布了获奖作品名单。
Cursor 发布 SDK,开发者可使用与 Cursor 相同的运行时、框架和模型,在 CI/CD、自动化流程或自有产品中嵌入 Agent。
Sam Altman 表示,OpenAI 的 Codex 编码 Agent 正迎来一波类似 ChatGPT 当年的爆发期。
微软 1 月开源的 9B 参数语音转文字模型 VibeVoice-ASR 单次可处理 60 分钟音频。Simon Willison 在 M5 Max MacBook 跑 4-bit 量化版,转写 1 小时播客耗时 8 分 45 秒。
YC CEO Garry Tan 抨击旧金山禁建 AI 数据中心提案,称此举将摧毁本地就业、税基,并把 AI 竞赛拱手让给中国。
Sam Altman 在 X 上预告 OpenAI 接下来几次更新值得期待,并称团队成员 ajambrosino 表现亮眼。
DeepSeek 官方宣布 V4-Pro 折扣促销延期至 2026 年 5 月 31 日 15:59 UTC,开发者可继续享受降价 API 调用。
For decades, computational biology has operated under a reductionist compromise. To fit complex biological systems into the limited memory of a single GPU,...
Agentic systems often reason across screens, documents, audio, video, and text within a single perception‑to‑action loop. However, they still rely on...
Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents
The subsurface industry is at a critical point in its digital evolution. For decades, unlocking reservoir potential has relied on experts performing essential...
OpenAI GPT models, Codex, and Managed Agents are now available on AWS, enabling enterprises to build secure AI in their AWS environments.
Learn how OpenAI protects community safety in ChatGPT through model safeguards, misuse detection, policy enforcement, and collaboration with safety experts.
蚂蚁集团 Ling-2.6-flash 即时 MoE 模型上线即获 vLLM Day-0 支持。104B 总参/7.4B 激活,混合 1:7 MLA+Lightning Linear 注意力,262K 上下文,原生工具调用。
Apple 提出 Stochastic KV Routing,让 KV Cache 可在不同深度间自适应共享,提升大模型推理效率。
vLLM 项目盛赞 Fireworks AI 在模型质量问题诊断上的严谨与高标准,称这正是开源推理生态需要的态度。
HashiCorp 联合创始人 Mitchell Hashimoto 称 GitHub 频繁宕机影响工作,宣布把开源终端模拟器 Ghostty 从 GitHub 迁出,过去一个月几乎每天都有故障日记标记。
NVIDIA 引述 Fireworks AI 联合创始人 Lin Qiao 观点,认为定制化推理与模型扩张正大幅压缩从生产到规模化的时间线,2026 是 AI 爆发之年。
Runway 第二届 Big Pitch 创作大赛奖金最高 10 万美元,作品提交截止时间为 5 月 4 日,欢迎创作者投稿。
YC 公司 Saffron 上线,提供针对软件工程师 AI 工具使用能力的评估服务,定位为帮企业发掘下一代 10 倍工程师。
港科大、新国大、牛津等高校联合发表 88 页世界模型综述,提出 L1 预测器/L2 模拟器/L3 进化器 × 物理/数字/社会/科学四领域的二维框架。