来自 Twitter · Hacker News · GitHub 的 AI 行业动态
vLLM 宣布在 NVIDIA GB200 上运行 DeepSeek R1/V3 的性能数据:预填充 26.2K TPGS,解码 10.1K TPGS,使用一半 GPU 即可达到 H200 的 3-5 倍吞吐
Mistral 发布 Voxtral Mini 4B Realtime,4B 参数流式语音识别模型,延迟低于 500ms,准确率可比离线模型,vLLM 首日支持
vLLM 宣布首日支持 Intern-S1-Pro,这是一款万亿参数级 MoE 科学推理模型:1T 总参数、512 专家、每 token 激活 22B 参数
ElevenLabs 宣布将利用新融资加大对 ElevenAgents 的投入,使企业能够部署具有可靠性、集成、测试和监控功能的语音和聊天代理
Qwen3-Coder-Next 现已在 Together、HuggingFace 和 Ollama 上线,作为生产就绪的编码代理可供使用
Kimi 宣布支持斯坦福大学 CS224N 自然语言处理课程,学生将使用 Kimi K2.5 API 构建期末项目
NVIDIA Nemotron 在 HuggingFace 上的下载量突破 3000 万,vLLM 感谢与 NVIDIA AI Dev 的持续合作
Kimi 推出 K2.5 充值优惠活动第二轮:$200-$499 享 20% 赠券,$500-$1999 享 25% 赠券
Sam Altman 发推称「真的很期待几个月后让 Elon 宣誓作证,四月的圣诞节!」暗示 OpenAI 与 Elon Musk 的诉讼将在四月开庭
Sam Altman 宣布欢迎 Dylan Scand 加入 OpenAI 担任 Preparedness 负责人,称「事情即将快速推进,我们将很快使用极其强大的模型,需要相应的安全保障」
Andrej Karpathy 宣布启用 fp8 训练后复现 GPT-2 时间缩短至 2.91 小时,使用 8×H100 Spot 实例仅需约 20 美元。感叹「7 年前 GPT-2 被认为太危险不能发布,如今成为新手教程」
Sam Altman 宣布 Codex 应用上线首日下载量突破 20 万,用户反馈积极。「CODEX FTW!」
Runway 发布 Motion Sketch 功能,用户可通过手绘草图和标注来描述动作意图,配合 Gen-4.5 图生视频模型使用,无需编写文字提示
Anthropic 宣布 Claude Pro 和 Max 计划用户现可连接 Slack 工作区,支持搜索频道内容、准备会议、发送消息,无需离开 Claude 对话界面
Anthropic 宣布 Apple Xcode 现已直接集成 Claude Agent SDK,开发者可在 iPhone、Mac 和 Apple Vision Pro 等全平台获得 Claude Code 完整功能
Anthropic 发布面向企业内部法务团队的 AI 工具后,欧洲法律软件和出版公司股价大幅下跌,市场担忧 AI 将颠覆法律科技行业
NVIDIA CEO Jensen Huang 与 Cisco CEO Chuck Robbins 今日对话,探讨开放模型、下一代加速计算和「行星级智能工厂」的崛起
开发者注意到 Opus 4.5 性能出现下滑,历史经验表明这通常是新模型发布前的信号。社区预测 Sonnet 5 今日发布
通义千问团队邀请开发者参加 Qwen-Image LoRA Training Competition,共同构建和训练 LoRA 模型
社区汇总 Sonnet 5 泄露信息:代号「Fennec」,价格约为 Opus 4.5 的一半,1M token 上下文,SWE-Bench 超 80%,Claude Code 支持并行子 Agent
Elon Musk 推广最新版 Grok 应用,继 SpaceX 收购 xAI 后,Grok 预计将获得更多资源支持
Elon Musk 宣布「To the stars! SpaceX 与 xAI 现已成为一家公司」,这是 AI 行业与航天行业的历史性整合,预计将加速 AI 在太空探索领域的应用
Anthropic Fellows 研究发现推理时间越长,模型越不一致;更聪明的模型往往更不一致。AI 失败更像「工业事故」而非追求错误目标
A.A.Murakami 使用 Claude 作为工作室协作者,创作融合雾、泡沫和等离子体等自然现象的多感官沉浸式装置艺术
OpenAI 演示 Prism 如何让 GPT-5.2 在 LaTeX 项目中工作,具备完整论文上下文理解能力,科学工具链即将迎来变革
预测 2026-2028 AI 自动化白领工作,2027-2030 机器人自动化蓝领,2028-2032 AI 开始科学突破,2032 年 AI 破解无限能源问题
Vercel v0 团队发布预告「Big day tomorrow…」,暗示今日(2月3日)将有重大更新,新版 v0 支持导入 GitHub 仓库、多框架和全栈应用开发
Sam Altman 回应近期传闻,称「我们热爱与 NVIDIA 合作,他们制造世界上最好的 AI 芯片,希望长期保持大客户关系」
OpenAI 发布 Codex 独立应用,支持多 Agent 并行工作、可复用 Skills、自动化任务调度。限时向免费用户开放,付费用户速率限制翻倍
Sam Altman 分享使用 Codex 构建应用的体验,称 AI 提出的功能点子比自己想的更好,坦言「感到有点没用,这让人难过」