来自 Twitter · Hacker News · GitHub 的 AI 行业动态
xAI 发布宣传视频,以「理解宇宙必须探索宇宙」为主题,展示其太空算力愿景。
xAI 正式宣布 Terafab 计划,定位为通往星际文明的关键一步,将大幅扩展算力基础设施规模。
Musk 回应称 xAI 的 Colossus 数据中心今年的投入和交付的算力将远超竞争对手。
Musk 宣布 SpaceXAI 与特斯拉合作启动 TERAFAB 项目,目标每年实现万亿瓦级计算能力,其中大部分算力将部署到太空,因为美国现有电力仅为 0.5TW。
Mem0 发布 3 月第 3 周更新,Python SDK v1.0.6 修复 21 个 Bug,TypeScript SDK 升级至 v2.4.1,新增 Apache AGE 图存储、MiniMax LLM、pgvector NodeJS 支持和 LM Studio 集成。
Replit 发布用户体验分享视频,展示开发者在平台上的构建经历。
海螺AI 发布创作教程,鼓励用户动手尝试并分享成果,展示其视频生成工具的易用性。
Musk 正式宣布 TERAFAB 计划,SpaceX 与 Tesla 联合建造超级工厂,目标年产超 1 太瓦算力(逻辑、内存及封装),约 80% 用于太空、20% 用于地面。今晚将在 X 平台直播发布。
Musk 回应用户反馈,表示 Grok 应增加自动校对和建议功能,暗示 xAI 正在推进 Grok 的实用工具化方向。
Karpathy 回应关于电影质量的讨论,指出创作者往往认同观众批评,但市场需求迫使他们妥协,引用 Ben Affleck 和 Matt Damon 播客观点,认为应恨游戏规则而非玩家。
Karpathy 分享对 AI 人格设计的思考,以 Claude 说「我们进去了」(We're in!)而非「成功找到服务器」为例,认为 AI 应像《海妖之歌》里的 Rocky 一样有队友感。他指出当前 AI 个性不足、过于企业化,人格塑造不需要新技术,而需要一份认真的「SOUL.md」文件和组织层面的重视。
海螺 AI 推广其 Light Studio 图像生成工具,主打专业级清晰锐利的输出效果,目前提供免费试用。
在 ~/.claude/settings.json 中添加 attribution 配置,可默认不在 commit 和 PR 中添加 co-author 署名。
LeCun 阐述 JEPA 架构的核心理念:智能的本质在于找到现实的抽象表征以实现预测,这与科学的运作方式一致。
AI 大牛 Karpathy 参加播客访谈并在推特评论区进行公开答疑,与社区互动。
马斯克宣布 SpaceXAI 将提供 Multipass 服务,具体产品详情尚未公布。
vLLM v0.18.0 发布,包含 445 次提交、213 位贡献者。新增 gRPC serving、无 GPU 多模态渲染、GPU 上 NGram 推测解码、Elastic EP 里程碑 2、Responses API 流式工具调用等功能。
Midjourney V8 新增 Relax 模式,同时推出新版 SREF/Moodboard(--sv 7),速度和成本均提升 4 倍,支持 HD 模式和个性化参数。
Karpathy 吐槽 AI Agent 代码质量差、抽象膨胀、大量复制粘贴,即使在 AGENTS.md 中反复要求代码规范也被无视。
Musk 预言各类医疗护理工作未来都将由机器人执行,延续其对机器人大规模落地的一贯判断。
Musk 回应 Pichai 表示,Google 正在部署的 AI 算力规模令人震惊,几乎没人能理解其量级之大。
AI 记忆层初创公司 Mem0 在 NVIDIA GTC 2026 期间采取别出心裁的营销策略,放弃昂贵展位赞助,转而向参会者免费发放冰水。
Vercel 旗下 AI 编程工具 v0 宣布向开发者提供免费 hosting 额度,鼓励开发者使用 v0 构建和部署项目。
Replit 推出 Agent 4 新版本,包含 Insider 和 Builder 专属功能更新,并举办直播展示活动介绍最新能力。
论文 Loc3R-VLM 将视觉语言模型应用于三维空间定位和推理任务,实现基于自然语言的 3D 场景理解与物体定位。
论文 FASTER 提出新的实时 Flow VLA 架构,重新设计视觉-语言-动作模型的推理流程,旨在提升机器人操控任务的实时性。
论文提出利用生成模型中的隐式 3D 先验来提升场景理解能力,为视觉生成与 3D 感知的结合开辟新路径。
NVIDIA 在 Hugging Face 上开源 Nemotron-Cascade 2 模型,附带论文。该系列延续 NVIDIA 在大模型推理优化方向的持续投入。
Replit 发布 Agent 4 幕后团队系列访谈视频第一期,揭秘 Agent 4 的开发过程和团队故事。
LlamaParse 发布官方 Agent Skill,可在 40 多种 Agent 框架中使用,内置复杂文档解析指令,支持多格式、表格、图表和图像的深度理解。