全部 今日 本周 本月
2026-02-11

vLLM:GitHub Star 突破 7 万

vLLM 项目 GitHub Star 达 7 万。近期进展包括 NVIDIA Blackwell 多节点生产级支持(WideEP + 专家并行)、异步调度、实时语音流式推理、多模态(文本/视觉/视频/语音)能力扩展。

大模型
@vllm_project 阅读 →

v0:支持 GTM 团队快速构建演示、AI Agent 和研究工具

Vercel v0 推出面向 GTM(市场推广)团队的新功能,可用真实数据在几分钟内构建自定义演示、AI Agent 和研究工具。

产品发布
@v0 阅读 →

ElevenLabs:伦敦峰会吸引近千人参加

ElevenLabs 在伦敦举办峰会,近 1000 名客户和合作伙伴到场。公司表示语音将取代过时的界面,通用智能将改善人们的生活。

活动
@elevenlabsio 阅读 →

宝玉:用 Claude Code Skills 构建全自动生图工作流

宝玉详细介绍如何用 Claude Code Skills 编排 Midjourney 生图、Gemini 生成、PS 去背景、加文字、上传素材等步骤,实现全流程自动化。

大模型
@dotey 阅读 →

swyx:用 Vibe Coding 在攀岩馆设计 6000 人大会网站

Latent Space 创始人 swyx 分享在攀岩馆用 AI 全程设计会议网站(含 99% 视频资源优化)的经历,称这就是 AGI 的感觉。

观点
@swyx 阅读 →

vLLM 首日支持 GLM-5:稀疏注意力+推测解码+工具调用

vLLM 宣布首日支持智谱 GLM-5(744B 参数/40B 激活),集成 DeepSeek 稀疏注意力、MTP 推测解码和工具调用等功能。

产品发布
@vllm_project 阅读 →

通义千问:Qwen-Image 2.0 修复古诗排序和角色一致性问题

阿里通义千问修复了 Qwen Chat 中 Qwen-Image 2.0 的两个 bug,涉及古典诗词图像排序和图像编辑中的角色一致性问题。

产品发布
@Alibaba_Qwen 阅读 →

Karpathy 详解极简 GPT:将 LLM 分解为最基本的数学运算

Karpathy 解释其极简 GPT 项目原理:将完整 LLM 架构拆解为加、乘、幂、对数、指数等原子运算,用微型自动微分引擎计算梯度。

大模型
@karpathy 阅读 →

Claude 免费版新增对话压缩功能,长对话无需重新开始

Claude 免费版现已支持对话压缩功能,AI 会自动总结早期上下文,让长对话可以持续进行而无需从头开始。

产品发布
@claudeai 阅读 →

Ollama 上线 GLM-5 云端版:免费可用,支持多种 AI 编码工具

Ollama 发布 GLM-5 云端版本,免费起步,支持连接 Claude Code、Codex、OpenCode 等工具,付费用户可获得更高使用限额。

产品发布
@ollama 阅读 →

Google DeepMind:Gemini Deep Think 用智能体工作流解决研究级难题

DeepMind 发表两篇论文展示 Gemini Deep Think 如何通过智能体工作流协助解决数学、物理和计算机科学领域的研究级问题。

研究
@GoogleDeepMind 阅读 →

Anthropic 发布 Opus 4.6 破坏风险报告,主动达到 ASL-4 安全标准

Anthropic 决定主动以更高的 ASL-4 安全标准评估 Opus 4.6 的 AI 研发风险,发布了详细的破坏风险评估报告。

行业
@AnthropicAI 阅读 →

Anthropic 承诺承担数据中心电力成本,不让纳税人买单

Anthropic 宣布将 100% 承担电网升级费用,推动新电力上线并投资减少电网压力的系统,确保数据中心扩张不增加居民电费负担。

企业动态
@AnthropicAI 阅读 →

Karpathy 新作:243 行纯 Python 实现 GPT 完整训练与推理

Karpathy 发布新项目,仅用 243 行无依赖纯 Python 实现 GPT 的完整训练和推理,展示 LLM 的核心算法本质。

大模型
@karpathy 阅读 →

Andrej Karpathy:DeepWiki 让代码仓库理解变得前所未有的简单

Karpathy 推荐 DeepWiki 工具,可自动为 GitHub 仓库生成 wiki 页面并支持即时问答,只需将 URL 中的 github 替换为 deepwiki。

观点
@karpathy 阅读 →

Claude 免费版大升级:文件创建、连接器和技能全部开放

Anthropic 将 Claude 最常用的功能向免费用户开放,包括文件创建、连接器和技能功能,无需订阅即可使用。

产品发布
@claudeai 阅读 →

Sam Altman:Codex 胜出速度超出预期,感谢所有开发者

Altman 表示从团队运营方式来看一直相信 Codex 最终会胜出,但其成功速度令人惊喜,感谢开发者们的贡献。

观点
@sama 阅读 →

xAI 成立仅 30 个月取得卓越进展,未来充满期待

xAI 官方回顾成立以来的进展,强调小而精干的团队在短短 30 个月内实现了显著成果。

企业动态
@xai 阅读 →

Sam Altman:ChatGPT 中 GPT-5.2 即时模型已更新

OpenAI 更新了 ChatGPT 中的 GPT-5.2 即时模型,Altman 表示变化不大但体验应有所提升。

大模型
@sama 阅读 →

xAI 重组提速:Elon Musk 宣布公司架构调整并大规模招聘

xAI 数天前进行组织重组以加快执行速度,部分员工离职。Musk 表示公司快速增长必须不断进化,并宣布积极招聘。

企业动态
@elonmusk 阅读 →

MiniMax 发布 M2.5 模型:跳过 M2.2 直接大版本升级,与 GLM-5 同日竞技

MiniMax 出人意料地跳过 M2.2,直接发布 M2.5。新模型在编程和 Agent 能力上大幅提升,与智谱 GLM-5 同日发布,上演中国 AI 公司版的 OpenAI vs Anthropic 对决。

大模型
@MiniMaxAI 阅读 →

智谱发布新一代旗舰模型 GLM-5:Coding 与 Agent 开源 SOTA,逼近 Claude Opus 4.5

智谱 2 月 11 日深夜发布 GLM-5,采用 MoE 架构(256 专家、激活 44B 参数),引入 DeepSeek 稀疏注意力,在编程和长程 Agent 任务上达到开源最强水平。此前以神秘模型 Pony Alpha 上架 OpenRouter。

大模型
@ZhipuAI 阅读 →

vLLM:首发流式输入与实时 WebSocket API

vLLM 与 Meta、Mistral AI 合作推出流式输入和实时 WebSocket API,成为首个支持该功能的主流开源 LLM 推理引擎。

大模型
@vllm_project 阅读 →

Anthropic:发布 Claude Opus 4.6 破坏风险报告

Anthropic 兑现此前承诺,为 Claude Opus 4.6 发布破坏风险报告。随着模型能力接近 AI 安全等级 4(自主 AI 研发)阈值,该报告旨在评估前沿模型的潜在风险。

研究
@AnthropicAI 阅读 →