来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Google 推出 Gemini 3.1 Flash Live,专注低延迟多模态实时交互,支持语音、视觉和上下文即时响应,开发者可构建实时 AI 应用。
Apple 计划在 iOS 27 中允许用户通过 App Store 应用将任意 AI 服务接入 Siri,终结 ChatGPT 在 Apple Intelligence 中的独占地位。
Anthropic 为 Claude Code 推出 AutoDream 功能,可自动合并、修剪和重组跨会话的记忆文件,防止记忆膨胀。用户可通过 /dream 命令手动触发或设定自动运行。
前特斯拉高级经理解释马斯克设定超激进目标的真实目的:迫使团队深度思考瓶颈,从 1000 件任务中识别出真正影响进度的 100 件关键事项,形成优先级清单。
a16z 播客邀请能源专家解析沙特与美国石油供应成本差异,为科技从业者提供 AI 基础设施能源成本的底层视角。
知名投资人 Chamath 分享 Grok 的一段解释并表示赞赏,反映 AI 大模型在日常信息理解和解释方面的能力提升。
MIT CSAIL 分享了一张数据结构速查表,涵盖数组、链表、树、图等核心数据结构的特性和操作复杂度对比,适合开发者快速参考。
Anduril 总裁 Matthew Steckman 透露,2017 年首款感知塔的 CV AI 技术至今仍嵌入其自主战斗机系统中,展示了军事 AI 从边境监控到空战的技术传承路线。
Latent Space 主播 swyx 推荐 create-context-graph 工具,一条命令即可为 22 个主流行业领域建立关键实体关系图,可叠加社交图谱到任意应用中。
AI 研究者 AK 展示 Claude Code 结合 HuggingFace Papers CLI 工具,可自动检索、筛选和总结论文,实现 AI 辅助的自动化研究工作流。
Allen AI 发布 MolmoBot,一套完全在仿真环境中训练的开源机器人操作系统,包含代码、训练数据、数据生成管线和评估工具,无需大规模真实世界数据采集即可使用。
Garry Tan 分享 AI Agent 辅助编程体验——代码分支不再因长时间搁置而腐烂,可随时用 Agent 快速跟进,这是 AI 编程带来的一大解放。
Y Combinator CEO Garry Tan 宣布 GStack 将推出 /design-shotgun 设计探索功能,用户可自由尝试各种方向和变体,与 AI 协作创造精美设计。
知名投资人 Chamath 表示英伟达的估值重估缺乏合理性,苹果、微软、Meta 和 Alphabet 的自由现金流估值倍数变化同样令人费解,指出公开市场定价模型正在快速变化。
Runway 推出全新 Ad Concepter 应用,用户只需一个提示词、参考图和产品照片即可快速探索广告概念、构图和故事节拍,现已在网页端上线。
Google 展示 Veo 3.1 新功能,用户可在 Gemini 和 Flow 中通过食材照片加提示词快速生成移动端优先的创意视频,赋予用户更强的创作控制力。
Perplexity AI 正式为三星浏览器的 Galaxy Android 和 Windows 设备提供 Browsing Assist 功能,进一步扩展其 AI 搜索能力在移动端的覆盖。
Y Combinator Lightcone 播客专访 François Chollet,探讨其从深度学习研究到创建 ARC Prize 的历程,以及新发布的 ARC V3 基准测试——旨在衡量 AI 的学习、适应和推理能力。
宇树科技开源了高质量真实世界人形机器人全身遥操作数据集,自3月5日起公开并持续高频更新,目标是建立场景覆盖、任务复杂度和操作多样性最全面的人形机器人数据集。
SAM 3.1 是 SAM 3 的直接升级版,通过引入 object multiplexing 技术,在不牺牲精度的前提下显著提升视频处理效率,使高性能应用在小型硬件上也能运行。模型和代码已开源。
OpenAI CEO Sam Altman 宣布,与 Oracle 和 Related Digital 合作的 Stargate 密歇根数据中心项目本周已开始搭建首批钢梁,标志着该项目进入实质建设阶段。
vLLM 宣布 Kimi K2.5 1T MXFP4 在 AMD GPU 上实现高达 18 倍交互性能提升,优化已合入 0.18.0 版本,AMD 黑客松设立 65 万美元 MI355X 专项赛道。
OpenAI 连续关停 Sora(日推理成本 1500 万美元、总收入仅 210 万)、Instant Checkout(仅 12 家接入)和成人聊天 Citron mode,迪士尼 10 亿美元投资交易作废。
AI 工程师 swyx 分享将过去 4 年 Mac 配置博客交给 Claude AI 自动转换为可执行脚本,称这是记录工作流程者的黄金时代。
因 CMS 配置失误,Anthropic 泄露了代号 Capybara 的新模型 Claude Mythos,作为 Opus 之上的第四档,在编程、推理和网络安全测试中大幅超越 Opus 4.6。
Altman 分享了用户 Paul 利用 ChatGPT 等 LLM 设计 mRNA 疫苗方案拯救爱犬的故事,称 AI 赋予个人研究机构级别的科研能力。
Musk 回应关于 2028-2030 年 AGI 时间表的讨论,表示那大概就是 AI 超越所有人类智能的时间节点。
Garry Tan 呼吁释放 AI Agent,认为开放市场和开放平台是 2020 年代实现繁荣所需的反垄断方式。
OpenAI 为 Codex 推出插件功能,可将技能提示词、应用集成和 MCP 服务器配置打包为可复用插件,支持团队共享。公共插件目录尚未开放。
vLLM 团队推荐了一项关于推测解码的系统性研究,对 vLLM 中各种推测解码策略进行了全面评测,为生产环境部署选型提供实用参考。