全部 今日 本周 本月
2026-02-11

Cursor Arena 排行榜出炉:Gemini 3 Flash 击败 Pro,用户更看重速度

Cursor Arena Mode 首周获 4 万票。主要发现:Gemini 3 Flash 击败 Pro、Grok Code Fast 击败 Gemini 3、Claude Haiku 4.5 击败 GPT 5.2、SWE 1.5 击败 Claude Haiku。结论:用户更看重速度。

大模型 AI 摘要 · 单一来源
@swyx 阅读 →

Vercel:Sandbox 支持网络出口策略,防止 Agent 数据泄露

Vercel Sandbox 新增出口策略配置功能,可控制 AI Agent 的网络流量,防止数据外泄,提升安全性。

产品发布 AI 摘要 · 单一来源
@vercel 阅读 →

Ming-flash-omni-2.0 多模态模型发布

Ming-flash-omni-2.0 模型已在 Hugging Face 上线,支持多模态能力。

大模型 AI 摘要 · 单一来源
@_akhaliq 阅读 →

LMSys:确认 Pony Alpha 即 GLM-5,SGLang 首日支持

LMSys 确认 OpenRouter 上神秘的 Pony Alpha 模型就是智谱 GLM-5(744B 参数/40B 活跃),SGLang 首日提供推理支持。模型集成 DeepSeek Sparse Attention 和 slime 异步 RL 框架。

大模型 AI 摘要 · 单一来源
@lmsysorg 阅读 →

LatentLens:揭示 LLM 中高度可解释的视觉 Token

新论文 LatentLens 提出方法揭示大语言模型中高度可解释的视觉 token,为理解多模态模型内部机制提供新视角。

研究 AI 摘要 · 单一来源
@_akhaliq 阅读 →

vLLM:GitHub Star 突破 7 万

vLLM 项目 GitHub Star 达 7 万。近期进展包括 NVIDIA Blackwell 多节点生产级支持(WideEP + 专家并行)、异步调度、实时语音流式推理、多模态(文本/视觉/视频/语音)能力扩展。

大模型 AI 摘要 · 单一来源
@vllm_project 阅读 →

v0:支持 GTM 团队快速构建演示、AI Agent 和研究工具

Vercel v0 推出面向 GTM(市场推广)团队的新功能,可用真实数据在几分钟内构建自定义演示、AI Agent 和研究工具。

产品发布 AI 摘要 · 单一来源
@v0 阅读 →

ElevenLabs:伦敦峰会吸引近千人参加

ElevenLabs 在伦敦举办峰会,近 1000 名客户和合作伙伴到场。公司表示语音将取代过时的界面,通用智能将改善人们的生活。

活动 AI 摘要 · 单一来源
@elevenlabsio 阅读 →

宝玉:用 Claude Code Skills 构建全自动生图工作流

宝玉详细介绍如何用 Claude Code Skills 编排 Midjourney 生图、Gemini 生成、PS 去背景、加文字、上传素材等步骤,实现全流程自动化。

大模型 AI 摘要 · 单一来源
@dotey 阅读 →

swyx:用 Vibe Coding 在攀岩馆设计 6000 人大会网站

Latent Space 创始人 swyx 分享在攀岩馆用 AI 全程设计会议网站(含 99% 视频资源优化)的经历,称这就是 AGI 的感觉。

观点 · 观点/主张 AI 摘要 · 单一来源
@swyx 阅读 →

vLLM 首日支持 GLM-5:稀疏注意力+推测解码+工具调用

vLLM 宣布首日支持智谱 GLM-5(744B 参数/40B 激活),集成 DeepSeek 稀疏注意力、MTP 推测解码和工具调用等功能。

产品发布 AI 摘要 · 单一来源
@vllm_project 阅读 →

通义千问:Qwen-Image 2.0 修复古诗排序和角色一致性问题

阿里通义千问修复了 Qwen Chat 中 Qwen-Image 2.0 的两个 bug,涉及古典诗词图像排序和图像编辑中的角色一致性问题。

产品发布 AI 摘要 · 单一来源
@Alibaba_Qwen 阅读 →

Karpathy 详解极简 GPT:将 LLM 分解为最基本的数学运算

Karpathy 解释其极简 GPT 项目原理:将完整 LLM 架构拆解为加、乘、幂、对数、指数等原子运算,用微型自动微分引擎计算梯度。

大模型 AI 摘要 · 单一来源
@karpathy 阅读 →

Claude 免费版新增对话压缩功能,长对话无需重新开始

Claude 免费版现已支持对话压缩功能,AI 会自动总结早期上下文,让长对话可以持续进行而无需从头开始。

产品发布 AI 摘要 · 单一来源
@claudeai 阅读 →

Ollama 上线 GLM-5 云端版:免费可用,支持多种 AI 编码工具

Ollama 发布 GLM-5 云端版本,免费起步,支持连接 Claude Code、Codex、OpenCode 等工具,付费用户可获得更高使用限额。

产品发布 AI 摘要 · 单一来源
@ollama 阅读 →

Google DeepMind:Gemini Deep Think 用智能体工作流解决研究级难题

DeepMind 发表两篇论文展示 Gemini Deep Think 如何通过智能体工作流协助解决数学、物理和计算机科学领域的研究级问题。

研究 AI 摘要 · 单一来源
@GoogleDeepMind 阅读 →

Anthropic 发布 Opus 4.6 破坏风险报告,主动达到 ASL-4 安全标准

Anthropic 决定主动以更高的 ASL-4 安全标准评估 Opus 4.6 的 AI 研发风险,发布了详细的破坏风险评估报告。

行业 AI 摘要 · 单一来源
@AnthropicAI 阅读 →

Anthropic 承诺承担数据中心电力成本,不让纳税人买单

Anthropic 宣布将 100% 承担电网升级费用,推动新电力上线并投资减少电网压力的系统,确保数据中心扩张不增加居民电费负担。

企业动态 AI 摘要 · 单一来源
@AnthropicAI 阅读 →

Karpathy 新作:243 行纯 Python 实现 GPT 完整训练与推理

Karpathy 发布新项目,仅用 243 行无依赖纯 Python 实现 GPT 的完整训练和推理,展示 LLM 的核心算法本质。

大模型 AI 摘要 · 单一来源
@karpathy 阅读 →

Andrej Karpathy:DeepWiki 让代码仓库理解变得前所未有的简单

Karpathy 推荐 DeepWiki 工具,可自动为 GitHub 仓库生成 wiki 页面并支持即时问答,只需将 URL 中的 github 替换为 deepwiki。

观点 · 观点/主张 AI 摘要 · 单一来源
@karpathy 阅读 →

Claude 免费版大升级:文件创建、连接器和技能全部开放

Anthropic 将 Claude 最常用的功能向免费用户开放,包括文件创建、连接器和技能功能,无需订阅即可使用。

产品发布 AI 摘要 · 单一来源
@claudeai 阅读 →

Sam Altman:Codex 胜出速度超出预期,感谢所有开发者

Altman 表示从团队运营方式来看一直相信 Codex 最终会胜出,但其成功速度令人惊喜,感谢开发者们的贡献。

观点 · 观点/主张 AI 摘要 · 单一来源
@sama 阅读 →

xAI 成立仅 30 个月取得卓越进展,未来充满期待

xAI 官方回顾成立以来的进展,强调小而精干的团队在短短 30 个月内实现了显著成果。

企业动态 AI 摘要 · 单一来源
@xai 阅读 →

Sam Altman:ChatGPT 中 GPT-5.2 即时模型已更新

OpenAI 更新了 ChatGPT 中的 GPT-5.2 即时模型,Altman 表示变化不大但体验应有所提升。

大模型 AI 摘要 · 单一来源
@sama 阅读 →

xAI 重组提速:Elon Musk 宣布公司架构调整并大规模招聘

xAI 数天前进行组织重组以加快执行速度,部分员工离职。Musk 表示公司快速增长必须不断进化,并宣布积极招聘。

企业动态 AI 摘要 · 单一来源
@elonmusk 阅读 →

MiniMax 发布 M2.5 模型:跳过 M2.2 直接大版本升级,与 GLM-5 同日竞技

MiniMax 出人意料地跳过 M2.2,直接发布 M2.5。新模型在编程和 Agent 能力上大幅提升,与智谱 GLM-5 同日发布,上演中国 AI 公司版的 OpenAI vs Anthropic 对决。

大模型 AI 摘要 · 单一来源
@MiniMaxAI 阅读 →

智谱发布新一代旗舰模型 GLM-5:Coding 与 Agent 开源 SOTA,逼近 Claude Opus 4.5

智谱 2 月 11 日深夜发布 GLM-5,采用 MoE 架构(256 专家、激活 44B 参数),引入 DeepSeek 稀疏注意力,在编程和长程 Agent 任务上达到开源最强水平。此前以神秘模型 Pony Alpha 上架 OpenRouter。

大模型 AI 摘要 · 单一来源
@ZhipuAI 阅读 →