来自 Twitter · Hacker News · GitHub 的 AI 行业动态
解释"世界模型"被过度使用的原因,阐述三种形态分别对应像素生成、机器人控制及核心的仿真模拟功能。
World Labs CEO 指出 AI 已能超越标准化测试,人类最宝贵资源是人力资本,必须重塑 K-16 学习与评估方式。
1,500 teams entered the Billion Dollar Build and have been building for 7 weeks. 8 finalists presen…
三个月研究表明,使用 Computer 类自主 Agent 的工作者完成任务时间减少 87%,成本降低 94%,满意度更高。
研究显示 SWE-bench 存在大量不可合并的低质数据,FrontierCode 收录 1000+ 小时人工验证的软件工程任务,难度极高(Opus 4.8 仅获 13.8 分)。
新智能搜索框支持多模态输入(文本/图片/标签页),AI 驱动的意图预判超越传统自动补全,同时保留网页链接。
Apple 借助 NVIDIA GPU 为 Google Cloud 提供隐私计算服务,三方合作推进下一代私有 AI 基础设施。
新研究指出生物数据库如同"汽车出现前的城市规划",对 AI agent 极不友好,并提出构建 agent 可用基础设施的方法。
Altman 在社交平台公开 OpenAI 战略规划链接,详细阐述公司发展方向与优先级。
@RusGarbageHuman The system is severely biased against Whites
It wasn’t. With rare exception, colonies were unprofitable, meaning more was spent building infrast…
Runway推出视频智能裁切功能,上传现有视频并选择目标比例,Aleph 2.0模型会自动生成完整画面,如同原生拍摄一般自然。已在桌面端开放。
Garry Tan认为这波创新浪潮正在催生全新的中间派政治形态,2030年代回望此刻,会看到'旧金山式常识民主党人'从极左失败中诞生的历史节点。
Garry Tan语出惊人:如果深入思考,GStack实际上是智能体的'egregore'——一种由agent群体涌现的集体智慧形态。
Garry Tan提出完美系统应具备的特质:边界严格管控、发送内容保持一致、能力范围受限、信任精确界定、快速大声失败而非静默损坏、敢于对选定节点运行有意的漏洞循环。
Garry Tan早上5点起床,走4英里,在孩子醒来前合并了13个Pull Request到main分支。称这是人生最大的解锁之一。
月之暗面推出本地AI助手Kimi Work,具备原生agent swarm、浏览器自动化(WebBridge扩展)、Yahoo Finance和世界银行数据直连等能力,内置记忆系统。
paulg指出,这个问题的本质与当年问Google如出一辙——要么暴露投资者的愚蠢,要么暴露他们对提问对象的不信任与挑剔。
6月4日,当维也纳多瑙河畔的 ICRA 2026 进入正会的最后一天,大洋彼岸的美国丹佛科罗拉多会议中心(Colorado Convention Center)已经人声鼎沸。许多我们前几天还在维也纳见到的熟悉面孔,各大顶尖高校的学者和硬科技企业的高管,此刻都正拖着行李箱,马不停蹄地出现在丹佛的街头。 这种罕见的“全球双城赶场”现象背后,是计算机视觉(CVPR)与机器人(ICRA)两大顶会赛道正在发
PhaseLock是一个无需训练的框架,通过在去噪过程中保留早期推理步骤的运动先验,提升图像转视频扩散模型的物理一致性。
2026年6月2日,国际机器人与自动化会议(ICRA 2026)在奥地利维也纳进入第二天。普渡大学(Purdue University)计算机科学系教授、IDEAS Lab实验室主任Aniket Bera发表了题为"RobotsSafe Navigation in Unstructured & Human-Centered Environments"(在非结构化与以人为中心环境中安全导航)的主题演
CVPR 2026主会议于6月7日落下帷幕,三大重磅信号同频共振:奖项端,Google DeepMind的D4RT摘得最佳论文奖,Oxford VGG实现CVPR最佳论文「背靠背」两连冠,何恺明的ResNet/YOLO同获Longuet-Higgins时间检验奖,微软×清华的TRELLIS.2斩获最佳学生论文奖;数据基建端,号称「视觉物理ImageNet时刻」的PhysInOne以2M视频、150
2026年6月3日,ICRA 2026维也纳会议“操作、控制与具身设计”主题Keynote环节,斯坦福大学计算机科学系的副教授,同时也是斯坦福交互式感知实验室(Interactive Perception Lab)的负责人Jeannette Bohg以一个反问开场——“我们还需要灵巧手吗?” 这个问题之所以有力,恰恰因为它指向了当下机器人操作领域最真实的张力:二指夹爪(two-finger gri
原文作者:公众号“NE时代智能体” 原文链接:https://mp.weixin.qq.com/s/qWvJdOFTkD2iOjM2hlWlWw 全球机器人行业顶会ICRA 2026圆满落幕,从展会各家前沿方案的密集发布来看,灵巧手正加速脱离传统「工业末端夹爪」的刻板印象,向着高自由度、拟人化感知和手脑协同的具身智能核心终端演进。 本次ICRA展会释放了明确的信号:仿生灵巧手已经跨越了“能不能动”
GuidedVLA:以目标、阶段和空间约束,重塑 VLA 动作生成过程。 作者丨郑佳美 编辑丨马晓宁 机器人要进入更复杂的真实环境,真正的难点已经超出“能不能完成一个动作”。 更关键的问题是:当桌面变得杂乱、光照发生变化、任务步骤变长,或者目标物体变得透明、难以定位时,机器人能否稳定判断自己该看哪里、该做哪一步、空间位置是否准确。 这也是视觉-语言-动作模型(VLA)正在面对的核心挑战。VLA 可
可动结构、4D 表征与高效重建登场。 作者丨郑佳美 编辑丨马晓宁 2026 年 6 月 1 日,国际机器人与自动化会议(ICRA)在奥地利维也纳召开。次日上午的自动驾驶与导航报告环节,雷峰网GAIR 2021大会嘉宾、上海交通大学教授王贺升发表了题为《Learning to Navigate: From Scene Understanding to Decision Makin》的演讲。 3D 视
算力时代“微光”,广工本科生靠古早Titan显卡拼下顶会大奖;十年树木,CV社区将最高荣誉授予已故先驱孙剑。 作者丨小雷哥 编辑丨岑 峰 美国当地时间6月5日,在结束了两天的Workshop议程后,全球计算机视觉与模式识别领域的顶级学术盛会 CVPR 2026(IEEE Conference on Computer Vision and Pattern Recognition)正会,在科罗拉多州丹
原文作者:谭梓馨 原文链接:https://mp.weixin.qq.com/s/llcXE2be4oNWItL_0ydVZw 2026年IEEE国际机器人与自动化会议(IEEE ICRA 2026)是机器人与自动化领域的顶级学术盛会,于6月1日至5日在奥地利维也纳举办。 今年,FP3、HITTER等多篇华人团队论文入围最佳论文奖提名,头部科技此前曾报道过HITTER,今天来看另一篇研究FP3。
ToolMaze 基准显示,现实场景中的工具故障显著降低 TIR 性能,其中隐式语义故障导致最严重的性能下降,动态重规划成为关键瓶颈。
SubtleMemory 基准评估 AI 智能体处理长时间交互中涌现的复杂关系记忆结构的能力,揭示了当前记忆系统在保存和利用细微关系记忆方面的局限。