来自 Twitter · Hacker News · GitHub 的 AI 行业动态
15T 视觉-文本 token 联合训练、Agent Swarm + PARL 并行子智能体延迟降低 4.5 倍、MoonViT-3D 统一图像视频编码器
教你如何用 Gen-4.5 Image to Video 将周围世界变成可讲述的故事
4月7-8日巴黎举办,超早鸟价立省€350,征稿截止2月8日
Kimi K2.5 与 Gemini 3、Opus 4.5 并列 Design Arena 第一,成为首个登顶该榜单的开源模型
Bindu Reddy 预测未来公司将由小型技术团队运营和监控大量 AI 智能体节点
ChatGPT 付费用户现可在 iOS 和 Android 调整思考级别:Light、Standard、Extended 或 Heavy
研究表明 AI 辅助在专业领域带来显著生产力提升,但对新手技能发展有不同影响
Project Genie 使用 Nano Banana Pro 生成预览图,Genie 3 世界模型实时生成可探索环境
daggr 可混合搭配模型端点、Gradio 应用和函数,支持可视化管道检查
用于追踪 AI Agent 对话到生成代码的开放标准,可与任何编程智能体或界面互操作
Kimi K2.5 在 OpenRouter 平台的 Kilo Code 中成为使用量第一的模型
Google DeepMind 基因组模型论文发表于 Nature,开源模型权重
Qwen3-ASR 支持 30 种语言和 22 种中国方言,Apache 2.0 开源
Kimi K2.5 Thinking 成为 Vision Arena 排名第一的开源模型
无需 API Key 即可开发语音应用
4 周挑战赛,奖金 $5,000 及 DGX Spark
Runway 展示最新 Gen-4.5 图像转视频生成效果
ElevenLabs 与 Audi Revolut F1 车队达成官方合作
LeCun 分享对 JEPA 架构和世界模型的看法
xAI 发布图像和视频生成 API,支持逼真图片/视频生成
Hailuo AI 与 DZINE 合作推出 AI 唇同步解决方案
MiniMax 发布 Music 2.5,支持 100+ 种乐器和录音棚级混音
Moonshot AI 的 Kimi K2.5 在 VoxelBench 基准测试中排名第一
Kimi 现可创建和编辑文件,支持专家级电子表格、技术架构图和协作文档
xAI 推出 Grok Imagine,将用户脑海中的想法变为现实
Ray-Ban Meta 智能眼镜的成功促使 Meta 成立专门的 Specs 部门
PyTorchCon Europe 超早鸟优惠即将结束