来自 Twitter · Hacker News · GitHub 的 AI 行业动态
宝玉推荐了一款终端运行的开源视频剪辑工具,可标记起始时间点并导出可控宽高比的剪辑片段,设计非常简洁。
英伟达 GTC 直播节目汇聚科技、基础设施和工业领域顶级领袖,共同探讨加速计算和 AI 如何变革芯片设计、数据中心、制造业和机器人等领域。
英伟达回顾 2006 年推出的 CUDA 并行计算平台,20 年后已服务全球 600 万开发者,呼吁开发者加入下一波创新浪潮。
微软研发的 MicroLED 数据中心网络系统通过数千个并行通道传输数据,比主流激光光缆约节省 50% 能耗,同时支持 AI 和云服务的大规模数据流。
英伟达 GTC 大会主题演讲中,黄仁勋阐述了 AI 工厂的兴起、Agent AI 系统及驱动机器人和工业的物理 AI,以及新一代加速计算平台。
Runway 推出 Big Ad Contest,参赛者可从 7 个创意简报中选择,为虚构产品制作广告,无客户限制,为期两周,最高奖金 10 万美元。
Replit 推出为期 4 周的 Agent 4 内容挑战赛,每周评选一位获胜者,参赛者需构建作品并拍摄分享,总奖金池 2 万美元。
MiniMax-M2.7 现可通过 Ollama 云端使用,专注编程和 Agent 任务,支持在 Claude Code 和 OpenClaw 中直接调用。
Karpathy 分享黄仁勋签名照背后故事,回忆 2015 年 GTC 上黄仁勋向游戏和科学计算观众宣告深度学习将改变一切,并引用了他的博士论文作为案例。
Perplexity 宣布 AI 浏览器 Comet 的 iOS 版本正式登陆 App Store,用户可即刻下载使用。Comet 此前已上线企业版,此次移动端版本的发布进一步扩展了其多端覆盖能力。
Ollama 宣布 NVIDIA Nemotron 3 Nano 4B 模型现已可通过 Ollama 运行。该模型是 Nemotron 家族新成员,专为资源受限硬件上的 Agent 构建与运行场景设计,可与 Pi 轻量级 Agent 运行时配合使用。
Anthropic 宣布向 Linux 基金会捐款,以持续强化 AI 所依赖的开源软件基础设施安全。Anthropic 指出开源生态几乎支撑了全球所有软件系统,随着 AI 能力不断增强,开源安全的重要性日益凸显。
Perplexity 发布 Comet Enterprise,将其最强大的 AI 浏览器带入企业团队。企业版支持在浏览器内直接完成研究、任务自动化等工作,无需离开浏览器切换工具。
Cursor 团队通过强化学习训练 Composer 进行自我摘要,替代原有的 Prompt 方式,使代码上下文压缩(Compaction)错误率降低 50%。改进后 Composer 能成功完成需要数百步操作的复杂编程任务。
Ollama 发布 0.18.1 版本,新增 OpenClaw 网络搜索与网页抓取插件,支持本地及云端模型实时获取最新网络内容。同时新增非交互式(无头)启动模式,适用于 Docker、CI/CD 流水线及自动化脚本场景。
Runway 联合 NVIDIA 在 GTC 大会上发布实时视频生成研究预览,新模型运行于 Vera Rubin 硬件上,可即时生成高清视频,首帧延迟低于 100ms。这是其通用世界模型 GWM-1 的重要里程碑,开辟了视频模型与世界仿真的全新设计空间。
OpenAI 面向开发者社区发起了一项编程挑战活动,邀请开发者参与测试并展示 Codex 的编程能力。具体赛题及规则详见官方链接。
Moonshot Kimi 官方宣布已将最新研究论文上传至 arXiv,供学术社区免费获取阅读。配图显示了相关论文内容,具体研究方向待进一步阅读确认。
Sam Altman 回应用户对 Codex 前途的担忧,明确表示 Codex 不会关闭,「恰恰相反」。他暗示团队正在开发令人期待的新功能,并表示用户会喜欢的。
Anthropic 发起了一项大规模定性调研,邀请 Claude 用户分享 AI 使用方式、期许与担忧。一周内共有近 81,000 人响应,成为同类调研中规模最大的一次,调研报告已公开发布。
Anthropic 宣布开发者大会「Code with Claude」今春回归,举办城市为旧金山、伦敦和东京。活动提供全天工作坊、产品演示及与 Claude 团队一对一答疑,支持线上远程参与或申请现场出席。
OpenAI 发布 GPT-5.4 mini,即日起在 ChatGPT、Codex 及 API 中上线。该模型针对编程、计算机操作、多模态理解和子 Agent 任务进行了专项优化,速度是 GPT-5 mini 的 2 倍。
Andrej Karpathy 透露收到了 Jensen Huang 与 NVIDIA 赠送的一台神秘设备,事先只被告知「需要 20 安培电流」。他表示这台设备将成为其 Dobby 机械爪等各类实验项目的新家,并表达了感激之情。
OpenAI CEO Sam Altman 感慨 AI 时代到来前,开发者逐字逐句手写极度复杂软件的艰辛付出。他表示现在已很难想象那需要多大的努力,并向所有让行业走到今天这一步的人致谢。
Google 发布首个全多模态嵌入模型 Gemini Embedding 2,支持文本、图片、视频和音频的统一映射,已在 Gemini API 和 Vertex AI 上提供公开预览。
Replit 发布 Agent 4,支持在 Agent 构建的同时进行设计,可在无限画布上探索多种 UI 方案,并将精确的 UI 编辑直接应用到应用中。
NVIDIA CEO 黄仁勋在 SAP Center 的 GTC 大会上进行现场主题演讲,分享 AI 领域的最新进展与未来方向。
Karpathy 发表技术观点,指出 SGD 的前向+反向传播构成类似 ResNet 的残差块,权重即残差流,引发对 Attention is All You Need 的深层思考。
Cursor 构建了一组安全代理持续运行在其代码库上,并开源了自动化模板供开发者复用。
xAI 发布 Grok 的 Text to Speech API,支持自然语音和表达控制,开发者可立即集成到应用中。