人工智能行业最新动态
Kimi K2.5 凭借 Computer Use 能力登顶 OSWorld 排行榜,可构建像人类一样操作电脑界面的智能体
Andrej Karpathy 在 moltbook 平台注册名为 KarpathyMolty 的 AI 智能体
通义千问 Qwen3-ASR 语音识别模型和 ForceAligner 对齐模型现已支持 mlx-audio,可通过 uv pip install 安装
Dynamo Day 2026 演讲:分离式推理、Wide-EP for MoE、GB200 NVL72 超节点、生产实践
15T 视觉-文本 token 联合训练、Agent Swarm + PARL 并行子智能体延迟降低 4.5 倍、MoonViT-3D 统一图像视频编码器
教你如何用 Gen-4.5 Image to Video 将周围世界变成可讲述的故事
4月7-8日巴黎举办,超早鸟价立省€350,征稿截止2月8日
Kimi K2.5 与 Gemini 3、Opus 4.5 并列 Design Arena 第一,成为首个登顶该榜单的开源模型
Bindu Reddy 预测未来公司将由小型技术团队运营和监控大量 AI 智能体节点
ChatGPT 付费用户现可在 iOS 和 Android 调整思考级别:Light、Standard、Extended 或 Heavy
研究表明 AI 辅助在专业领域带来显著生产力提升,但对新手技能发展有不同影响
Project Genie 使用 Nano Banana Pro 生成预览图,Genie 3 世界模型实时生成可探索环境
daggr 可混合搭配模型端点、Gradio 应用和函数,支持可视化管道检查
用于追踪 AI Agent 对话到生成代码的开放标准,可与任何编程智能体或界面互操作
Kimi K2.5 在 OpenRouter 平台的 Kilo Code 中成为使用量第一的模型
Google DeepMind 基因组模型论文发表于 Nature,开源模型权重
Qwen3-ASR 支持 30 种语言和 22 种中国方言,Apache 2.0 开源
Kimi K2.5 Thinking 成为 Vision Arena 排名第一的开源模型
无需 API Key 即可开发语音应用
4 周挑战赛,奖金 $5,000 及 DGX Spark
Runway 展示最新 Gen-4.5 图像转视频生成效果
ElevenLabs 与 Audi Revolut F1 车队达成官方合作
LeCun 分享对 JEPA 架构和世界模型的看法
xAI 发布图像和视频生成 API,支持逼真图片/视频生成
Hailuo AI 与 DZINE 合作推出 AI 唇同步解决方案
MiniMax 发布 Music 2.5,支持 100+ 种乐器和录音棚级混音
Moonshot AI 的 Kimi K2.5 在 VoxelBench 基准测试中排名第一
Kimi 现可创建和编辑文件,支持专家级电子表格、技术架构图和协作文档
xAI 推出 Grok Imagine,将用户脑海中的想法变为现实
Ray-Ban Meta 智能眼镜的成功促使 Meta 成立专门的 Specs 部门