来自 Twitter · Hacker News · GitHub 的 AI 行业动态
OpenAI 推出生命科学模型系列研究预览版,Amgen、Moderna、Allen Institute、Thermo Fisher 等合作机构今起可通过 ChatGPT、Codex 和 API 调用。
Cursor 与芝加哥大学经济学家 Suproteem Sarkar 合作研究了 500 支团队的使用数据,发现随着更强模型落地,开发者今年承担的高复杂度任务同比增长 68%。
Google 为 Gemini App 引入 Personal Intelligence 与 Nano Banana 2,用户可更便捷地生成反映个人生活与兴趣的图像,整个过程保持完全可控。
OpenAI 指出美国新药从靶点发现到获批平均耗时 10–15 年,先进 AI 系统能帮助科学家更快形成假设、发现潜在关联,加速药物研发流程。
NVIDIA 祝贺 OpenAI 将 Codex 扩展到更多软件工作流环节,Codex 正演变为覆盖开发者跨工具协作、长任务执行的系统级产品。
用户现可在 Codex 中使用 gpt-image-1.5 生成并迭代图像,支持前端设计、原型、游戏素材等场景,使用额度包含在 ChatGPT 账户中,无需 API Key。
OpenAI 推出 GPT-Rosalind 生命科学模型系列,针对科学工作流优化,在蛋白质与化学推理、基因组分析、生物化学知识以及科研工具调用方面表现更强。
Sam Altman 披露 Codex 现已具备从用户经验中学习的能力,能主动建议可执行的任务,同时新增应用内浏览器和大量插件。
OpenAI CEO Sam Altman 对用户从其他 AI 编码工具迁移到 Codex 表示欢迎,并调侃负责人 Tibo 不要对他限速或分配较弱的模型。
Perplexity 宣布 Claude Opus 4.7 担任 Computer 产品的默认编排模型,同时向 Max 订阅者在 Web、iOS 与 Android 端开放使用。
Google Chrome 新搜索体验允许用户在 AI Mode 旁并排打开网页,无需切换标签即可对比细节并追问,保留搜索上下文。
通过 macOS computer use,Codex 可自行看、点击、输入以操作任意应用,后台运行不占用户桌面,适用于前端迭代、应用测试等无 API 场景。
GPT-Rosalind 是 OpenAI 推出的前沿推理模型,专为生物学、药物发现与转化医学研究设计。
Sam Altman 表示 Codex 的 computer use 是重要升级,能够并行调用 Mac 上的所有应用,且不干扰用户自己的操作。
Anthropic 宣布 Claude Opus 4.7 即日起在 claude.ai、Claude Platform 以及所有主要云平台提供。
Codex 新版可调用 Mac 上的应用、连接更多工具、生成图像,能从过往操作中学习并承担持续性、可重复的任务。
Perplexity 发布 Personal Computer,基于 Mac App 实现跨本地文件、原生应用与浏览器的安全编排,今日起向 Max 订阅者及候补用户开放。
Ollama 宣布 Qwen 3.6 开源版已上线,支持本地运行并强化 Agent 编码能力;用户可直接在 Claude Code 或 OpenClaw 中调用 qwen3.6 模型。
Garry Tan 点评 Gemini Voice 体验遥遥领先,并预告该能力将很快在 GBrain 以及 OpenClaw/Hermes 上线。
Google DeepMind 宣布与 Boston Dynamics 合作,用 Gemini Robotics 具身推理模型驱动 Spot 机器人,使其更好理解环境、识别物体并执行整理房间等简单指令。
Elon Musk 在推文中确认,Grok Build 应用与对应终端将于下周进入 Beta 测试阶段。
Paul Graham 表示,最近常听到此前表现尚可但不突出的初创公司,因借力 AI 而出现增长加速,AI 正把应有的增长带给踏实工作的创始人。
Anthropic 在 API 侧引入介于 high 与 max 之间的 xhigh 推理档,可在难题上精细调节推理与延迟;同时上线 beta 版任务预算,帮助 Claude 在长周期任务中分配优先级与成本。
Claude Code 新增 /ultrareview 命令,会开启专门 review 会话逐行审读改动并指出严谨审查者会发现的问题;auto 模式同步向 Max 用户开放,让长任务减少中断。
Anthropic 表示 Opus 4.7 视觉大幅升级,可识别分辨率较此前提升三倍以上,由此能生成质量更高的界面、幻灯片与文档。
Cursor 宣布集成 Claude Opus 4.7,官方称实测其自主性强、推理更具创造力,新模型以 50% 优惠价限时供用户使用。
阿里开源稀疏 MoE 模型 Qwen3.6-35B-A3B,总参 35B、激活 3B,Apache 2.0 协议;声称编码 Agent 能力可比肩激活量 10 倍的模型,支持多模态思考与非思考双模式。
Anthropic 推出迄今最强 Opus 模型 4.7,声称在长周期任务中执行更严谨、指令遵循更精确,并会在汇报结果前自行验证输出,允许减少人工监督。
若石新博客提出 Harness Engineering——给 AI Agent 装上"安全带"的工程实践。继 Prompt 和 Context 工程之后的新阶段,通过 Schema 约束、外置关键状态等原则解决多步自主执行中的崩溃问题。
Chamath Palihapitiya 在 All-In 播客中警告,每次重大 AI 模型突破都让量子破解日临近,这一风险真实存在且日益紧迫。