人工智能行业最新动态
vLLM 项目 GitHub Star 达 7 万。近期进展包括 NVIDIA Blackwell 多节点生产级支持(WideEP + 专家并行)、异步调度、实时语音流式推理、多模态(文本/视觉/视频/语音)能力扩展。
Vercel v0 推出面向 GTM(市场推广)团队的新功能,可用真实数据在几分钟内构建自定义演示、AI Agent 和研究工具。
ElevenLabs 在伦敦举办峰会,近 1000 名客户和合作伙伴到场。公司表示语音将取代过时的界面,通用智能将改善人们的生活。
宝玉详细介绍如何用 Claude Code Skills 编排 Midjourney 生图、Gemini 生成、PS 去背景、加文字、上传素材等步骤,实现全流程自动化。
Latent Space 创始人 swyx 分享在攀岩馆用 AI 全程设计会议网站(含 99% 视频资源优化)的经历,称这就是 AGI 的感觉。
vLLM 宣布首日支持智谱 GLM-5(744B 参数/40B 激活),集成 DeepSeek 稀疏注意力、MTP 推测解码和工具调用等功能。
阿里通义千问修复了 Qwen Chat 中 Qwen-Image 2.0 的两个 bug,涉及古典诗词图像排序和图像编辑中的角色一致性问题。
Karpathy 解释其极简 GPT 项目原理:将完整 LLM 架构拆解为加、乘、幂、对数、指数等原子运算,用微型自动微分引擎计算梯度。
Claude 免费版现已支持对话压缩功能,AI 会自动总结早期上下文,让长对话可以持续进行而无需从头开始。
Ollama 发布 GLM-5 云端版本,免费起步,支持连接 Claude Code、Codex、OpenCode 等工具,付费用户可获得更高使用限额。
DeepMind 发表两篇论文展示 Gemini Deep Think 如何通过智能体工作流协助解决数学、物理和计算机科学领域的研究级问题。
Anthropic 决定主动以更高的 ASL-4 安全标准评估 Opus 4.6 的 AI 研发风险,发布了详细的破坏风险评估报告。
Anthropic 宣布将 100% 承担电网升级费用,推动新电力上线并投资减少电网压力的系统,确保数据中心扩张不增加居民电费负担。
Karpathy 发布新项目,仅用 243 行无依赖纯 Python 实现 GPT 的完整训练和推理,展示 LLM 的核心算法本质。
Karpathy 推荐 DeepWiki 工具,可自动为 GitHub 仓库生成 wiki 页面并支持即时问答,只需将 URL 中的 github 替换为 deepwiki。
Anthropic 将 Claude 最常用的功能向免费用户开放,包括文件创建、连接器和技能功能,无需订阅即可使用。
Altman 表示从团队运营方式来看一直相信 Codex 最终会胜出,但其成功速度令人惊喜,感谢开发者们的贡献。
xAI 官方回顾成立以来的进展,强调小而精干的团队在短短 30 个月内实现了显著成果。
OpenAI 更新了 ChatGPT 中的 GPT-5.2 即时模型,Altman 表示变化不大但体验应有所提升。
xAI 数天前进行组织重组以加快执行速度,部分员工离职。Musk 表示公司快速增长必须不断进化,并宣布积极招聘。
MiniMax 出人意料地跳过 M2.2,直接发布 M2.5。新模型在编程和 Agent 能力上大幅提升,与智谱 GLM-5 同日发布,上演中国 AI 公司版的 OpenAI vs Anthropic 对决。
智谱 2 月 11 日深夜发布 GLM-5,采用 MoE 架构(256 专家、激活 44B 参数),引入 DeepSeek 稀疏注意力,在编程和长程 Agent 任务上达到开源最强水平。此前以神秘模型 Pony Alpha 上架 OpenRouter。
vLLM 与 Meta、Mistral AI 合作推出流式输入和实时 WebSocket API,成为首个支持该功能的主流开源 LLM 推理引擎。
Anthropic 兑现此前承诺,为 Claude Opus 4.6 发布破坏风险报告。随着模型能力接近 AI 安全等级 4(自主 AI 研发)阈值,该报告旨在评估前沿模型的潜在风险。
Supabase 宣布与 TRAE IDE 集成,支持一键后端部署、Supabase Platform Kit 集成及 MCP 支持。
腾讯混元 3D 3.1 现已登陆 Replicate 平台,支持最多 8 个输入视角生成高保真纹理和精确几何结构的 3D 模型。
ChatGPT 深度研究新增多项功能:可连接应用搜索特定网站、实时跟踪进度并随时插入追问或新来源、支持全屏查看报告。
Anthropic 宣布 Claude 的 Cowork 功能现已支持 Windows,实现与 MacOS 的完整功能对等,包括文件访问、多步骤任务执行、插件和 MCP 连接器。
Supabase 与 PostHog 将在里斯本联合举办线下活动,聚焦 AI 工作流,面向 SaaS 创始人群体。
蚂蚁集团开源 LLaDA 2.1,100B 参数离散扩散语言模型,支持快速并行生成与即时纠错,SGLang 已第一时间支持。采用大规模块级 RL 训练,兼顾效率与性能。