来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Garry Tan早上5点起床,走4英里,在孩子醒来前合并了13个Pull Request到main分支。称这是人生最大的解锁之一。
月之暗面推出本地AI助手Kimi Work,具备原生agent swarm、浏览器自动化(WebBridge扩展)、Yahoo Finance和世界银行数据直连等能力,内置记忆系统。
paulg指出,这个问题的本质与当年问Google如出一辙——要么暴露投资者的愚蠢,要么暴露他们对提问对象的不信任与挑剔。
6月4日,当维也纳多瑙河畔的 ICRA 2026 进入正会的最后一天,大洋彼岸的美国丹佛科罗拉多会议中心(Colorado Convention Center)已经人声鼎沸。许多我们前几天还在维也纳见到的熟悉面孔,各大顶尖高校的学者和硬科技企业的高管,此刻都正拖着行李箱,马不停蹄地出现在丹佛的街头。 这种罕见的“全球双城赶场”现象背后,是计算机视觉(CVPR)与机器人(ICRA)两大顶会赛道正在发
PhaseLock是一个无需训练的框架,通过在去噪过程中保留早期推理步骤的运动先验,提升图像转视频扩散模型的物理一致性。
2026年6月2日,国际机器人与自动化会议(ICRA 2026)在奥地利维也纳进入第二天。普渡大学(Purdue University)计算机科学系教授、IDEAS Lab实验室主任Aniket Bera发表了题为"RobotsSafe Navigation in Unstructured & Human-Centered Environments"(在非结构化与以人为中心环境中安全导航)的主题演
CVPR 2026主会议于6月7日落下帷幕,三大重磅信号同频共振:奖项端,Google DeepMind的D4RT摘得最佳论文奖,Oxford VGG实现CVPR最佳论文「背靠背」两连冠,何恺明的ResNet/YOLO同获Longuet-Higgins时间检验奖,微软×清华的TRELLIS.2斩获最佳学生论文奖;数据基建端,号称「视觉物理ImageNet时刻」的PhysInOne以2M视频、150
2026年6月3日,ICRA 2026维也纳会议“操作、控制与具身设计”主题Keynote环节,斯坦福大学计算机科学系的副教授,同时也是斯坦福交互式感知实验室(Interactive Perception Lab)的负责人Jeannette Bohg以一个反问开场——“我们还需要灵巧手吗?” 这个问题之所以有力,恰恰因为它指向了当下机器人操作领域最真实的张力:二指夹爪(two-finger gri
原文作者:公众号“NE时代智能体” 原文链接:https://mp.weixin.qq.com/s/qWvJdOFTkD2iOjM2hlWlWw 全球机器人行业顶会ICRA 2026圆满落幕,从展会各家前沿方案的密集发布来看,灵巧手正加速脱离传统「工业末端夹爪」的刻板印象,向着高自由度、拟人化感知和手脑协同的具身智能核心终端演进。 本次ICRA展会释放了明确的信号:仿生灵巧手已经跨越了“能不能动”
GuidedVLA:以目标、阶段和空间约束,重塑 VLA 动作生成过程。 作者丨郑佳美 编辑丨马晓宁 机器人要进入更复杂的真实环境,真正的难点已经超出“能不能完成一个动作”。 更关键的问题是:当桌面变得杂乱、光照发生变化、任务步骤变长,或者目标物体变得透明、难以定位时,机器人能否稳定判断自己该看哪里、该做哪一步、空间位置是否准确。 这也是视觉-语言-动作模型(VLA)正在面对的核心挑战。VLA 可
可动结构、4D 表征与高效重建登场。 作者丨郑佳美 编辑丨马晓宁 2026 年 6 月 1 日,国际机器人与自动化会议(ICRA)在奥地利维也纳召开。次日上午的自动驾驶与导航报告环节,雷峰网GAIR 2021大会嘉宾、上海交通大学教授王贺升发表了题为《Learning to Navigate: From Scene Understanding to Decision Makin》的演讲。 3D 视
算力时代“微光”,广工本科生靠古早Titan显卡拼下顶会大奖;十年树木,CV社区将最高荣誉授予已故先驱孙剑。 作者丨小雷哥 编辑丨岑 峰 美国当地时间6月5日,在结束了两天的Workshop议程后,全球计算机视觉与模式识别领域的顶级学术盛会 CVPR 2026(IEEE Conference on Computer Vision and Pattern Recognition)正会,在科罗拉多州丹
原文作者:谭梓馨 原文链接:https://mp.weixin.qq.com/s/llcXE2be4oNWItL_0ydVZw 2026年IEEE国际机器人与自动化会议(IEEE ICRA 2026)是机器人与自动化领域的顶级学术盛会,于6月1日至5日在奥地利维也纳举办。 今年,FP3、HITTER等多篇华人团队论文入围最佳论文奖提名,头部科技此前曾报道过HITTER,今天来看另一篇研究FP3。
ToolMaze 基准显示,现实场景中的工具故障显著降低 TIR 性能,其中隐式语义故障导致最严重的性能下降,动态重规划成为关键瓶颈。
SubtleMemory 基准评估 AI 智能体处理长时间交互中涌现的复杂关系记忆结构的能力,揭示了当前记忆系统在保存和利用细微关系记忆方面的局限。
宝玉指出,若 Agent 无法自我验证结果,长时间运行只会浪费 Token,需内置验证机制避免无效计算。
宝玉认为设计稿需动态交互和结构化组件,React 可拆分小组件、便于 Agent 映射代码,巨大 HTML 则难以维护和同步修改。
NVIDIA CEO Jensen Huang 访问首尔国立大学,与学生、开发者及 AI 研究者互动,现场展示从零构建智能 Agent。
Chamath 警告:若未先明确目标和意图就依赖 AI 编程,大概率产出低质量、无价值的代码(AI slop)。
Garry Tan 宣布 GBrain 更新,新增详细总结用户思维随时间演变的功能,帮助用户复盘思考模式改进。
Garry Tan 建议:不应让 Agent 重复机械劳动,应相信其智能与审慎,给予更复杂任务,而非限制其能力。
Garry Tan 表示,目前教会用户有效使用 AI 工具的环节,已成为制约 AI 落地的关键瓶颈,重要性不亚于工具本身开发。
Paul Graham 提出heuristic:若产品同时需要超越人类智能(如复杂市场匹配),则天然对 AI 竞争对手免疫,原因与对人类竞争对手相同。
Altman 在推文中表示“有趣的递归循环”,未明确指代具体技术,但可能暗示 AI 自我改进或自我参照的潜在特性。
伊朗岛屿霍尔木兹名称来源于古波斯琐罗亚斯德教的神Ahura Mazda(阿胡拉·马兹达), Musk 在推文中指出这一历史渊源。
宝玉吐槽:虽然 Claude Code 支持移动端远程控制,但 plan 后仍无法跳过每次确认,操作繁琐影响体验。
Paul Graham 指出,若创始人先解决自己真实需求(如 Woz 在 Homebrew Computer Club 演示 Apple I),会比直接向 VC 推销更容易获得用户认可。
Latent Space 主理人 swyx 宣布明天推出年度最大代码评估项目,并表示很荣幸参与了关键议程的制定。
OpenAI 内部高管称"聊天已死",正对 ChatGPT 进行 2022 年上线以来最大改版。Codex、Agent、Canva 和 Booking 等第三方功能将整合进统一界面,目标成为跨平台个…
深度搜索方面 Claude 表现一般,ChatGPT 的 DeepResearch 效果最佳,Gemini 凭搜索能力也不错,通常两者配合使用对比结果。