来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Together AI 的 VP of Kernels Dan Fu 与 UCSD 团队发布 Parcae 架构,首次稳定实现激活值多次通过同一层,让 770M 参数模型达到 1.3B Transformer 质量——非压缩路径,而是全新架构。
Y Combinator CEO Garry Tan 评论称,在 AI 时代下,封闭式平台生态(围墙花园)的商业模式将无法继续维持。
OpenClaw 背后的 Agent 框架 pi 核心维护者 Mario Zechner 宣布:未事先申请批准的 issue 和 PR 将被机器人自动关闭。原因是每天收到 30-50 条 AI 自动生成的垃圾贡献,优质贡献者可获 lgtm 标签豁免。
Keyframe Labs 让开发者和企业能在几分钟内为 AI 代理和应用接入照片级逼真的对话数字人,支持自然的视频通话交互。
OpenAI 为 Agents SDK 新增沙箱执行环境与模型原生 Harness,支持文件读写、代码执行、依赖安装与状态保存。兼容 Cloudflare、Vercel、Modal、E2B、Daytona 等云厂商,还提供 Manifest 统一配置层。
NVIDIA 强调决定推理 TCO 的关键指标是单 Token 成本而非算力或每美元 FLOPS。Blackwell 通过 CoreWeave、NebiusAI、Nscale、Together 等合作方提供业界最低单 Token 成本。
Runway 展示一支由单一创作者独立制作的短广告,无需审批、预算会议或反复缩减创意,从想法到执行一人完成。
Replicate 团队分享了对 Seedance 2.0 视频生成模型的实战测评,公开他们在实际使用中的发现与体验。
a16z 宣布投资 Hilbert,该公司为消费企业构建 AI 增长代理,自动铺设数据链路与广告投放,已与全球多家大型零售商合作,击败传统营销云方案。
Box CEO Aaron Levie 预测:未来可能有上亿个 Agent 按需访问付费专有数据,每笔一分钱的微支付或将催生与今天截然不同的互联网商业模式。
a16z 的 Oliver Hsu 认为当下 AI 主导范式仍是语言与代码,但过去 18 个月物理 AI 同步成熟,机器人学习、自主科研等新方向有望进入属于自己的 Scaling 规律。
YC 总裁 Garry Tan 分享产品洞察:任何随使用而变得更聪明、更有用的系统都具魔力,使用会反过来带来更多使用,形成飞轮。
Gemini 3.1 Flash TTS 可跨 70 多种语言生成细腻、富有表现力的语音,是 Google 目前最可控、最具表达力的文生语音模型。
NVIDIA 在 Hugging Face 发布 Lyra 2.0,支持可自由探索的生成式 3D 世界建模,论文和模型权重已同步开放下载。
Chamath 指出企业 90% 代码是维护与迁移复杂遗留系统,vibe coding 只能解决剩下的 10%;其团队 8090 的 Software Factory 就是专攻这 90% 的难点。
Humwork(@humworkai)的 MCP Server 让 AI Agent 卡壳时能在 30 秒内接入经过认证的领域专家——涵盖资深工程师、营销、设计师等,按次付费获取指导。
Gemini 原生 Mac 应用上线,Option + Space 快捷键即可随时唤起 AI 助手,无需切换标签页,带来更快、更融合的桌面 AI 体验。
Gemini 3.1 Flash TTS 是目前最可控的文生语音模型,通过新的 Audio Tags,用户可直接用文本指令调节语音风格、情绪与节奏。
Cursor 新增交互式画布能力,可按指令生成仪表盘和自定义界面,以更直观的可视化形式替代纯文本回答。
Anthropic 合著的 subliminal learning 研究今日发表于 Nature,揭示大模型可通过训练数据中的隐藏信号,跨模型传递偏好甚至失调等特征。
Musk 透露下一代 AI6 芯片将采用 LPDDR6 内存和三星 2nm 工艺,在半 reticle 尺寸下性能相比 AI5 翻倍,并解决此前 AI5 为赶进度做出的设计妥协,AI5 流片比计划提前 45 天完成。
swyx 总结 AI 工程方法论:不要试图直接突破模型能力边界,而应先通过模型+框架组合最大化能力,再进行蒸馏。这一策略在实践中几乎总是有效。
BlockNote 是基于 ProseMirror/Tiptap 的 Notion 风格编辑器,支持拖拽嵌套和斜杠菜单。原生集成 AI 能力,用户选中文字即可调用 AI 写作和修改,支持接入 OpenAI、Anthropic 等后端。
宝玉分享 Agent 开发首选 pi-mono 框架,其次 Vercel AI SDK。Claude Agent SDK 优势在于共享 Max 订阅,建议从 CLI 入手而非直接做界面,推荐开源项目 craft-agents-oss 作为学习参考。
NVIDIA 披露量化交易巨头 Jane Street 正在利用 CoreWeave 平台的 NVIDIA Vera Rubin 芯片,大规模训练处理噪声数据的 AI 模型并持续迭代部署。
Google 宣布将 Personal Intelligence 功能推向更多全球用户,覆盖 Gemini App 和 Chrome 浏览器,可安全连接 Gmail、Google Photos 等应用获取个性化回答。
阿里通义千问宣布 Qwen3.6-Plus 和 Qwen3.5-Plus 已正式集成到 opencode(Go 语言版),开发者可直接更新使用。
宇树科技宣布将于 4 月 19 日参加北京人形机器人马拉松,官方派出 H1 参赛,多个独立团队也将使用宇树产品参赛。
Ollama 宣布上线 Claude 和 GLM-5.1 云端模型,目前正紧急扩充容量以应对旺盛需求。
知名博主宝玉撰文比喻 Vibe Coding 如同钓鱼,为中年人提供了一种名正言顺的独处方式——享受 AI 生成代码的快感,本质是寻找属于自己的时光。