全部 今日 本周 本月
2026-02-04

vLLM 在 NVIDIA GB200 上实现 3-5 倍吞吐提升

vLLM 宣布在 NVIDIA GB200 上运行 DeepSeek R1/V3 的性能数据:预填充 26.2K TPGS,解码 10.1K TPGS,使用一半 GPU 即可达到 H200 的 3-5 倍吞吐

芯片 AI 摘要 · 单一来源
@vllm_project 阅读 →

Mistral Voxtral Mini 4B 发布:实时流式 ASR

Mistral 发布 Voxtral Mini 4B Realtime,4B 参数流式语音识别模型,延迟低于 500ms,准确率可比离线模型,vLLM 首日支持

产品发布 AI 摘要 · 单一来源
@vllm_project 阅读 →

vLLM 首日支持 Intern-S1-Pro

vLLM 宣布首日支持 Intern-S1-Pro,这是一款万亿参数级 MoE 科学推理模型:1T 总参数、512 专家、每 token 激活 22B 参数

产品发布 AI 摘要 · 单一来源
@vllm_project 阅读 →

ElevenLabs 宣布加大 ElevenAgents 投入

ElevenLabs 宣布将利用新融资加大对 ElevenAgents 的投入,使企业能够部署具有可靠性、集成、测试和监控功能的语音和聊天代理

企业动态 AI 摘要 · 单一来源
@elevenlabsio 阅读 →

Qwen3-Coder-Next 上线多个平台

Qwen3-Coder-Next 现已在 Together、HuggingFace 和 Ollama 上线,作为生产就绪的编码代理可供使用

产品发布 AI 摘要 · 单一来源
@Alibaba_Qwen 阅读 →

Kimi 支持斯坦福 CS224N 课程

Kimi 宣布支持斯坦福大学 CS224N 自然语言处理课程,学生将使用 Kimi K2.5 API 构建期末项目

企业动态 AI 摘要 · 单一来源
@Kimi_Moonshot 阅读 →

NVIDIA Nemotron 在 HuggingFace 下载量破 3000 万

NVIDIA Nemotron 在 HuggingFace 上的下载量突破 3000 万,vLLM 感谢与 NVIDIA AI Dev 的持续合作

大模型 AI 摘要 · 单一来源
@vllm_project 阅读 →

Kimi K2.5 充值优惠活动第二轮

Kimi 推出 K2.5 充值优惠活动第二轮:$200-$499 享 20% 赠券,$500-$1999 享 25% 赠券

企业动态 AI 摘要 · 单一来源
@Kimi_Moonshot 阅读 →
2026-02-03

期待几个月后让 Elon 出庭作证

Sam Altman 发推称「真的很期待几个月后让 Elon 宣誓作证,四月的圣诞节!」暗示 OpenAI 与 Elon Musk 的诉讼将在四月开庭

人物 AI 摘要 · 单一来源
@sama 阅读 →

OpenAI 任命 Dylan Scand 为 Preparedness 负责人

Sam Altman 宣布欢迎 Dylan Scand 加入 OpenAI 担任 Preparedness 负责人,称「事情即将快速推进,我们将很快使用极其强大的模型,需要相应的安全保障」

企业动态 AI 摘要 · 单一来源
@sama 阅读 →

fp8 训练 GPT-2 仅需 20 美元

Andrej Karpathy 宣布启用 fp8 训练后复现 GPT-2 时间缩短至 2.91 小时,使用 8×H100 Spot 实例仅需约 20 美元。感叹「7 年前 GPT-2 被认为太危险不能发布,如今成为新手教程」

研究 AI 摘要 · 单一来源
@karpathy 阅读 →

Codex 应用首日下载量超 20 万

Sam Altman 宣布 Codex 应用上线首日下载量突破 20 万,用户反馈积极。「CODEX FTW!」

产品发布 AI 摘要 · 单一来源
@sama 阅读 →

Runway 发布 Motion Sketch:手绘提示生成视频

Runway 发布 Motion Sketch 功能,用户可通过手绘草图和标注来描述动作意图,配合 Gen-4.5 图生视频模型使用,无需编写文字提示

产品发布 AI 摘要 · 单一来源
@runwayml 阅读 →

Claude Slack 集成上线:Pro/Max 用户可连接工作区

Anthropic 宣布 Claude Pro 和 Max 计划用户现可连接 Slack 工作区,支持搜索频道内容、准备会议、发送消息,无需离开 Claude 对话界面

产品发布 AI 摘要 · 单一来源
@claudeai 阅读 →

Apple Xcode 集成 Claude Agent SDK:全平台 AI 开发

Anthropic 宣布 Apple Xcode 现已直接集成 Claude Agent SDK,开发者可在 iPhone、Mac 和 Apple Vision Pro 等全平台获得 Claude Code 完整功能

产品发布 AI 摘要 · 单一来源
@AnthropicAI 阅读 →

Anthropic 法律 AI 工具引发欧洲法律科技股暴跌

Anthropic 发布面向企业内部法务团队的 AI 工具后,欧洲法律软件和出版公司股价大幅下跌,市场担忧 AI 将颠覆法律科技行业

企业动态 AI 摘要 · 单一来源
@business 阅读 →

NVIDIA 今日举办 Jensen Huang 与 Cisco CEO 炉边对话

NVIDIA CEO Jensen Huang 与 Cisco CEO Chuck Robbins 今日对话,探讨开放模型、下一代加速计算和「行星级智能工厂」的崛起

活动 AI 摘要 · 单一来源
@nvidia 阅读 →

社区观察:Opus 4.5 性能下滑,Sonnet 5 或今日发布

开发者注意到 Opus 4.5 性能出现下滑,历史经验表明这通常是新模型发布前的信号。社区预测 Sonnet 5 今日发布

观点 · 观点/主张 AI 摘要 · 单一来源
@ChrisLloyd__ 阅读 →

Qwen 启动图像 LoRA 训练大赛

通义千问团队邀请开发者参加 Qwen-Image LoRA Training Competition,共同构建和训练 LoRA 模型

活动 AI 摘要 · 单一来源
@Alibaba_Qwen 阅读 →

Sonnet 5 泄露汇总:代号 Fennec,今日或发布

社区汇总 Sonnet 5 泄露信息:代号「Fennec」,价格约为 Opus 4.5 的一半,1M token 上下文,SWE-Bench 超 80%,Claude Code 支持并行子 Agent

大模型 AI 摘要 · 单一来源
@ZSkyX7 阅读 →

下载最新 Grok 应用

Elon Musk 推广最新版 Grok 应用,继 SpaceX 收购 xAI 后,Grok 预计将获得更多资源支持

产品发布 AI 摘要 · 单一来源
@elonmusk 阅读 →

SpaceX 正式收购 xAI:Elon Musk 宣布两家公司合并

Elon Musk 宣布「To the stars! SpaceX 与 xAI 现已成为一家公司」,这是 AI 行业与航天行业的历史性整合,预计将加速 AI 在太空探索领域的应用

企业动态 AI 摘要 · 单一来源
@elonmusk 阅读 →

Anthropic 新研究:AI 推理越长越不一致

Anthropic Fellows 研究发现推理时间越长,模型越不一致;更聪明的模型往往更不一致。AI 失败更像「工业事故」而非追求错误目标

研究 AI 摘要 · 单一来源
@AnthropicAI 阅读 →

Claude AI 成为艺术家 A.A.Murakami 的创作伙伴

A.A.Murakami 使用 Claude 作为工作室协作者,创作融合雾、泡沫和等离子体等自然现象的多感官沉浸式装置艺术

产品发布 AI 摘要 · 单一来源
@claudeai 阅读 →

OpenAI 展示 Prism:GPT-5.2 在 LaTeX 科研论文中的应用

OpenAI 演示 Prism 如何让 GPT-5.2 在 LaTeX 项目中工作,具备完整论文上下文理解能力,科学工具链即将迎来变革

产品发布 AI 摘要 · 单一来源
@OpenAI 阅读 →

Bindu Reddy 发布「通往乌托邦」AI 发展时间线预测

预测 2026-2028 AI 自动化白领工作,2027-2030 机器人自动化蓝领,2028-2032 AI 开始科学突破,2032 年 AI 破解无限能源问题

观点 · 观点/主张 AI 摘要 · 单一来源
@bindureddy 阅读 →