人工智能行业最新动态
Musk 展示 Grok Imagine 功能,生成了一段 30 秒池塘场景视频,展示 xAI 在视频生成领域的最新进展。
Musk 透露 Macrohard(数字擎天柱)是 xAI-Tesla 联合项目,Grok 作为主导 AI 深度理解世界并指挥数字擎天柱实时处理屏幕视频和键鼠操作。
Meta 详细介绍了自研训练与推理加速器 MTIA 的演进历程,强调定制芯片对于支撑下一代 AI 大规模训练和推理至关重要。
Google 与英国帝国理工学院合作,利用 AI 技术改进乳腺癌筛查。乳腺癌是全球最常见癌症之一,在英国每 8 名女性中就有 1 人受其影响。
Runway 宣布成立 Runway Labs,这是一个由联合创始人兼首席创新官 Alejandro Matamala Ortiz 领导的生成式 AI 孵化器,旨在探索 AI 创意工具的前沿应用。
AI 播客 Latent Space 创始人 swyx 宣布其播客已超越 The Business Podcast Network 和 Collisons,标志着 AI 内容创作者影响力持续攀升。
Karpathy 分享了 AI Agent 持续运行的痛点——Agent 不愿无限循环执行任务,目前需要用 watcher 脚本监控并重新注入提示,呼吁增加 /fullauto 全自动模式。
Anthropic 宣布成立 Anthropic Institute,旨在推动社会各界围绕强大 AI 技术展开深入公共讨论,促进 AI 治理与安全共识的建立。
Kimi 创始人兼 CEO 杨植麟将于 3 月 17 日在 NVIDIA GTC 首次公开亮相美国,分享 Kimi K2.5 的训练细节。
Karpathy 表示 tmux 网格虽好,但需要一个专门的 Agent 指挥中心 IDE,支持切换显示、查看空闲状态、终端工具、使用统计等功能。
Hugging Face 推出 Storage Buckets 新功能,为 AI 开发者提供便捷的存储桶服务。
PowerSync AI 黑客松正式开启,总奖金超 8000 美元,使用 Supabase 构建的最佳项目可获 1000 美元积分。
论文探讨无监督强化学习验证奖励(RLVR)在扩展大语言模型训练方面的潜力与极限。
论文提出基于分布引导的置信度校准方法,帮助模型更准确地评估自身预测的可靠性。
论文提出 VGGT-Det,利用 VGGT 内部先验实现无需传感器几何信息的多视角室内 3D 物体检测。
Latent Space 播客将邀请 Notion AI 团队做客,swyx 称 Notion 可能是全球最重要的知识工作 Agent 实验室。
Musk 回复 Peter Diamandis 表示这确实使之可行,对某项技术或方案的可行性表示认同。
AI 播客 Latent Space 主理人 swyx 展示了 Evals 帽子实体周边,呼吁更多人重视 AI 评测。
n8n 宣布本月在里斯本、维也纳、马德里举办三场线下工作坊,内容涵盖 Webhook、MCP、子工作流和错误处理等。
Runway 宣布 Characters 功能已在 Web 应用中上线,用户可使用预设角色或创建自定义角色进行对话交互。
Sparse-BitNet 研究发现 1.58 位大语言模型天然适合半结构化稀疏化处理,有望进一步降低推理成本。
Holi-Spatial 论文提出从视频流中构建完整 3D 空间理解的新方法,实现视频到三维空间智能的演化。
研究论文 V1 提出将生成与自验证统一的并行推理方法,旨在提升大模型推理效率和准确性。
Anthropic 宣布拓展澳新市场,即将在悉尼开设办公室,这是其在亚太地区继东京、班加罗尔、首尔之后的第四个办公室。
Ollama 宣布 Claude Code 现已支持定时运行提示功能,用户可设置自动任务和提醒,例如每天早上获取最新 AI 新闻。
Karpathy 回复推友称某项目令人上瘾,和 Factorio 一样让人欲罢不能,引发社区热议。
知名博主宝玉点评 Claude Code 的 Agent SDK 架构,认为本质是通过 IM 指挥 Claude Code,满足情绪价值和厂商消耗 Token 的需求。
Fish Audio 发布 S2 语音合成模型,支持自然语言标签控制韵律和情绪,Seed-TTS 评估 WER 最优,单 H200 达 RTF 0.34,覆盖 100+ 语言。
Latent Space 主理人回顾 AlphaGo 十周年,AlphaGo Zero 不依赖人类数据仅靠 RL 训练即以 100:0 完胜,标志性改变了围棋与 AI 发展。
AutoResearch-RL 提出永续自评估强化学习框架,让 AI 智能体自主发现新的神经网络架构,推进自动化 AI 研究。