来自 Twitter · Hacker News · GitHub 的 AI 行业动态
阿里通义千问展示了 Audio-Visual Vibe Coding 演示,将音频和视觉结合到 AI 编程体验中,探索多模态编码新范式。
阿里通义千问展示了语音合成的风格、情感和音量控制能力演示,展现了其在语音交互领域的技术进展。
Replit 发布 AI Ad Creator 功能,用户只需一条提示词即可生成广告内容,降低小团队和个人开发者的营销门槛。
MIT 计算机科学与人工智能实验室发布了一门深度学习入门课程,面向初学者系统讲解深度学习基础知识。
宝玉分享了使用 Mac Mini 运行 AI 模型的无显示器方案,通过 macOS 自带屏幕共享功能即可远程操控,适合 OpenClaw 等本地模型部署场景。
Claude 宣布 MCP(电脑操控)功能已在 macOS 上开放研究预览,Pro 和 Max 用户可通过 /mcp 命令启用,实现 AI 直接操控桌面进行测试验证。
马斯克分享了 Grok AI 的专家分析功能演示,展示了 xAI 大模型在复杂分析任务上的能力。
Redpoint 发布 SaaS 企业 AI 重构机会排名。调研显示 46% 的企业 CIO 愿意选择 AI 原生创业公司替代现有供应商,远超预期,表明当前市场窗口期对 AI 创业公司极为有利。
飞书开源 lark-cli 命令行工具,让 AI Agent 可直接操作飞书的消息、日历、文档等功能。此前 Google 也开源了类似的 gws 工具,CLI 正成为 AI Agent 接入企业应用的标准方式。
Marc Andreessen 表示 AI 导致劳动力替代的说法完全错误,大多数裁员实际源于利率上升和疫情期间过度招聘。他认为这是典型的零和经济学思维。
a16z 指出建筑工程行业是全球最大且数字化程度最低的行业之一,大部分软件还停留在 1997 年。85% 的项目超预算,75% 延期交付,平均争议金额达 6010 万美元。LLM 有望改变这一局面。
vLLM-Omni v0.18.0 发布,83 位贡献者提交 324 次 commit。新增 Qwen3-TTS/Omni、Fish Speech 等生产级 TTS 服务,重构扩散模型运行时,新增统一量化框架和 12+ 新模型支持。
Claude Code 新增 MCP 功能研究预览版,支持操作 Mac 上的任何应用程序,包括 SwiftUI 应用、Electron 构建和无 CLI 的 GUI 工具。Pro 和 Max 用户可在 macOS 上通过 /mcp 启用。
Claude Code 创建者 Boris Cherny 分享手机端编程、跨设备会话切换(teleport/remote-control)、语音编程、自动代码审查等 15 个实用功能。
Starcloud 从 YC Demo Day 到独角兽仅用 17 个月。去年发射首颗搭载 H100 GPU 的卫星,正在开发可从 Starship 发射的太空数据中心,目标与地面 AI 推理成本持平。
Ollama 发布 Pi 编程 Agent(驱动 OpenClaw 的底层工具),支持扩展、技能、模板和主题自定义,可与 Kimi K2.5 云端模型配合使用。
OpenAI 发布 codex-plugin-cc,在 Claude Code 里直接调用 Codex 做代码审查、对抗性审查和任务移交。竞争对手主动入驻对方插件生态。
Musk 表示 AI 的未来主要在视频理解和生成,因为光子是最高带宽的通信方式。同时透露 xAI 的 Imagine 已实现正毛利。
Claude Code + Computer Use 可在一个提示中完成代码编写、编译、启动应用、UI 点击测试、发现 Bug、修复并验证,支持 SwiftUI、Electron 等任何 Mac 应用。
Claude Code 的 Auto Mode 现已支持企业版和 API 用户,运行 claude --enable-auto-mode 即可启用。
Qwen3.5-Omni 支持文本、图像、音频、视频原生理解,亮点功能「音视觉 Vibe Coding」:对着摄像头描述想法,即时生成网站或游戏。
Claude Code 新增 Computer Use 功能,Claude 可以打开应用、点击 UI、测试代码,全程在 CLI 中完成。Pro 和 Max 用户可用,macOS 研究预览版。
Replit 的 Agent 4 Buildathon 黑客松第一周已有 4000 名开发者参赛,竞争激烈,官方发布首周进展更新。
AI 记忆基础设施公司 Mem0 宣布推出关于 AI Agent 记忆与上下文工程的系列文章,并向社区征集下一期想深入分析的记忆系统。
Runway 推出 Big Ad Contest,参赛者可使用 Ad Concepter App 创作广告创意,最高可赢得 10 万美元现金奖励。
LlamaIndex 发布深度文章,解析如何从 PDF 中智能提取表格数据,现代 OCR 技术需重建空间关系、保留表头层级并确保数据完整性,远比普通文本识别复杂。
二次创业的 YC 创始人推出 Sazabi,一个 AI 原生可观测性平台,能分析日志并回答「为什么生产环境宕机了」等问题,将数小时的排障缩短到几分钟。
GojiberryAI 是一款面向小型销售团队的 AI 工具,可自动在 LinkedIn 寻找有购买意向的潜客、发起对话、处理回复并预约演示,实现全自动获客。
n8n 与 Firecrawl 合作推出月度社区挑战,参赛者需构建网络爬取 Agent 解决实际客户问题,提供三个难度级别,优胜者将获得直播展示机会,截止 4 月 26 日。
北京智源研究院、北大、清华等 23 家机构在中关村论坛期间联合发布 FlagOS 2.0,这是面向多种 AI 芯片的统一开源系统软件栈的重大版本升级。