全部 今日 本周 本月
2026-02-26

Music Arena 上线 Google Lyria 3 和 ElevenLabs Music v1

AI 音乐生成评测平台 Music Arena 新增 Google Lyria 3、ElevenLabs Music v1 等模型,用户可免费试用并对比各模型生成效果。

产品发布
@_akhaliq 阅读 →

海螺 AI:Seedream 5.0 Lite 上线,支持 14 张参考图一致性生成

MiniMax 旗下海螺 AI 上线 Seedream 5.0 Lite 图像模型,支持精准编辑、最多 14 张参考图锁定一致性、图文联合推理,会员可无限使用。

产品发布
@Hailuo_AI 阅读 →

Runway:宣布新领导层任命,继续推进世界模拟技术

Runway 宣布新一轮高管任命,持续加码世界模拟(World Simulation)方向的研发投入。

企业动态
@runwayml 阅读 →

Replicate:PrunaAI 推出 P-video,10 秒视频仅需 10 美分

PrunaAI 的 P-video 模型上线 Replicate,10 秒内生成带原生音频的视频,成本仅 10 美分。上线首 24 小时免费使用。

产品发布
@replicate 阅读 →

宇树科技:德国总理默茨率团到访宇树机器人

德国总理默茨及代表团参观宇树科技,对宇树机器人表现出浓厚兴趣。宇树表示期待与全球更多优秀企业合作,共同推进智能机器人技术发展。

机器人
@UnitreeRobotics 阅读 →

vLLM:致力于打造最易用的高性能推理服务

vLLM 团队回应 Karpathy 推荐,表示正在让 vLLM 兼具易用性和高性能,为开发者和 AI 代理提供简单、快速、低成本的 LLM 部署方案。

大模型
@vllm_project 阅读 →

Cursor Agent 实测:仅凭视频 43 分钟还原完整网站

swyx 分享 Cursor Agent 云端版实测,仅输入一条推文中的视频,Agent 自主工作 43 分钟后成功还原完整网站,展现惊人的自主编码能力。

行业
@swyx 阅读 →

通义千问:Qwen3.5 首日即支持 MLX-VLM 运行

阿里通义千问宣布 Qwen3.5 发布当天即可通过 MLX-VLM 在 Apple Silicon 设备上运行。

大模型
@Alibaba_Qwen 阅读 →

Kimi:K2.5 支持 MIT 多模态机器学习课程研究项目

Kimi 与 MIT EECS 和 NLP 实验室合作,学生将利用 Kimi K2.5 的多模态能力完成 2026 春季学期研究项目。

研究
@Kimi_Moonshot 阅读 →

Ollama:OpenClaw 现已支持视觉能力

Ollama 为 OpenClaw 添加视觉功能,支持查看图片、读取截图和提取照片细节,可通过 Kimi K2.5 云端模型使用。

产品发布
@ollama 阅读 →
2026-02-25

论文:Xray-Visual Models 在工业级数据上扩展视觉模型

新论文提出 Xray-Visual Models,探索在工业规模数据集上训练视觉模型的方法,推动视觉理解能力的大规模扩展。

研究
@_akhaliq 阅读 →

论文:面向扩展 LLM 终端能力的数据工程方法

新论文探讨如何通过数据工程手段提升大语言模型在终端/命令行场景下的能力,为 AI Coding Agent 的训练数据构建提供方法论。

研究
@_akhaliq 阅读 →

海螺 AI:联合 WAIFF 巴西电影节举办 AI 视频制作工作坊

MiniMax 海螺 AI 将在 2 月 28 日巴西 WAIFF 电影节上发表主题演讲并举办工作坊,同时设立 MiniMax 长片电影奖。

活动
@Hailuo_AI 阅读 →

ElevenLabs:AI 语音助手自动处理 189 万通贷款电话

ElevenLabs 的 AI 语音 Agent 帮助 tinmanAI 在 2025 年自动化处理 189 万通抵押贷款电话,35% 无需人工介入,贷款转化率提升 2 倍,每月节省 1600 小时人力。

行业
@elevenlabsio 阅读 →

Replit:Musixmatch 用 AI 编程 2 个月上线艺术家周边工具

为 Spotify/Apple Music 提供歌词服务的 Musixmatch 使用 Replit,让设计师和 PM 自主开发,两个月从概念到上线,已售出 1000+ 件 T 恤并开辟新营收。

产品发布
@Replit 阅读 →

宝玉:Agent Skills 火爆的底层逻辑——模型能力+工具成熟

宝玉分析 Agent Skills 爆发原因:模型能力到位加上 Agent 工具链成熟,能力从编程泛化到非编程任务,从技术圈扩展到非技术圈。

观点
@dotey 阅读 →

论文:LAP 语言-动作预训练实现零样本跨机体迁移

LAP(Language-Action Pre-Training)通过语言与动作的联合预训练,实现机器人在不同机体间的零样本策略迁移,无需针对新硬件重新训练。

研究
@_akhaliq 阅读 →

论文:测试时训练的 KV Binding 本质上是线性注意力

新论文揭示 Test-Time Training 中的 KV Binding 机制与线性注意力之间的等价关系,为理解和改进推理时自适应提供新视角。

研究
@_akhaliq 阅读 →

Karpathy:Agent 要跑起来,关键是把你脑子里的知识喂给工具

Karpathy 回复讨论称,Agent 能力已到位,UI 也在改善,核心挑战在于如何将开发者脑中的知识和上下文系统化、可测试、可观察,让 Agent 能独立跑更长的循环。

观点
@karpathy 阅读 →

论文速递:EgoScale——用大规模自我中心数据训练灵巧操控

新研究 EgoScale 提出利用多样化自我中心人类数据来扩展灵巧操控能力,为机器人精细操作提供新思路。

研究
@_akhaliq 阅读 →

n8n:推出 AI 股票分析自动化模板

n8n 发布股票分析自动化模板,可自动拉取每日价格数据、分析趋势并生成买卖信号,结果保存至 Google Sheets。

行业
@n8n_io 阅读 →

v0:支持连接 PostHog 数据辅助产品开发

v0 新增与 PostHog 产品分析平台的数据对接功能,开发者可基于产品洞察进行迭代构建。

产品发布
@v0 阅读 →

Runway:集成 Kling 3.0 多镜头功能,一键生成时尚造型视频

Runway 平台集成 Kling 3.0 多镜头功能,用户可一键创建时尚造型视频。

行业
@runwayml 阅读 →

Replit:推出四档 Agent 模式,兼顾性价比与性能

Replit 发布新的 Agent 模式分档:Lite(小编辑)、Economy(降价 66%)、Power(标准性能)和 Turbo(最强性能,仅 Pro+ 用户可用)。

产品发布
@Replit 阅读 →

论文速递:SimToolReal——零样本灵巧工具操控策略

新研究 SimToolReal 提出以物体为中心的策略,实现零样本灵巧工具操控,推动机器人工具使用能力进步。

研究
@_akhaliq 阅读 →

Together AI:开源 CoderForge,25.8 万条编码代理训练数据

Together AI 开源 CoderForge-Preview 数据集,包含 25.8 万条测试验证的编码代理轨迹。微调 Qwen3-32B 后 SWE-bench 通过率从 23% 飙升至 59.4%,32B 以下开放数据模型中排名第一。

大模型
@togethercompute 阅读 →

Karpathy:深度技术专长在 AI 时代反而更具杠杆效应

Karpathy 认为将 AI 编程用户称为「提示者」是一种误解,顶级开发者的深度技术专长在 AI 工具加持下可能比以往更具乘数效应。

观点
@karpathy 阅读 →

Claude:协同工作模式 Cowork 进入研究预览阶段

Claude 推出 Cowork 功能研究预览版,支持 macOS 和 Windows 平台,所有付费用户均可使用。

产品发布
@claudeai 阅读 →

宝玉:Claude Code/Cowork 新增定时任务功能

Anthropic 桌面工具 Cowork 新增定时任务、插件系统和自定义面板,正从即时助手转型为自动化工具,支持每日简报、每周更新等重复性工作。

产品发布
@dotey 阅读 →

vLLM 首日支持 Liquid AI LFM2-24B-A2B 模型

vLLM 稳定版首日支持 Liquid AI 的 LFM2-24B-A2B 模型,总参数 240 亿但每 token 仅激活 20 亿,可在 32GB 内存运行,H100 上达 293 tok/s。

芯片
@vllm_project 阅读 →