来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Runway 展示其预可视化能力,可将故事板和草图在几分钟内转化为高保真预览画面,大幅缩短传统影视制作中需要数月的前期预览流程。
Replicate 发布新技能标准,可教 AI Agent 查找、对比和运行 AI 模型。遵循 Agents Skills 标准,兼容 Claude Code、OpenCode、Codex、Pi 等主流平台,一行命令即可安装。
最新研究论文 AnchorWeave 提出通过检索局部空间记忆来实现视频生成中的世界一致性,解决生成视频在场景切换时的空间连贯性问题。
宝玉认为借助 AI Agent 操作 Git 的成本几乎为零,完全不需要记忆繁琐命令。但提醒注意 GitHub Repo 权限,避免误将私有项目设为公开。
Google 在 Gemini 应用中上线 AI 音乐生成功能,基于 DeepMind 最新 Lyria 3 模型。用户可通过文字描述、照片或视频生成 30 秒完整音轨(含人声和歌词),面向全球 18 岁以上用户开放 Beta。
Latent Space 主理人 swyx 分享了他珍藏的经典梗图,每当有新一轮"加拿大女友式"表演型程序员出现在时间线上时就会拿出来。推文获超 1300 赞,引发广泛共鸣。
Google DeepMind 宣布与印度政府机构和科研院所合作,通过培训、辅导学生和建设创新中心,推动 AI 在科学发现和教育领域的实际应用。
ST Engineering MRAS 利用 Boston Dynamics 的 Spot 机器人自主采集设备健康数据,结合 Leica BLK ARC 生成精确点云用于数字孪生。
Google 正式发布 Pixel 10a,定价 499 美元,配备先进 AI 工具和同价位最佳相机系统,采用全平面耐用设计,续航更持久。
阿里通义千问 Qwen 3.5 Plus 模型已在 Vercel AI Gateway 上线,开发者可直接通过 model: 'alibaba/qwen3.5-plus' 调用。
ElevenLabs 获得 AIUC-1 认证,成为首家为 AI 语音代理及其行为投保的公司,标志着 AI 代理商业化进入保险保障新阶段。
Replicate 宣布 Runway Gen-4.5 上线,支持多种美学风格的电影级视频生成,物理准确性和真实感达到前所未有的水平。
宝玉分享了使用 Claude Code 的 Hook 和 Skill 机制,在每次任务结束后自动执行 Git 提交的实践方案,让 AI 写作流程中的版本管理完全自动化。
Google DeepMind 推出迄今最强音乐生成模型 Lyria 3,支持清晰音频和精细控制,已在 Gemini 应用中以 Beta 形式上线。用户可通过文字描述或上传图片/视频生成 30 秒完整音轨。
Anthropic 发布报告指出,软件工程占其 API 上 Agent 工具调用的约 50%,但已观察到在其他行业的新兴应用。随着风险与自主性边界的扩展,部署后监控变得至关重要。
Google 扩展内容验证工具,用户可将音频文件上传至 Gemini,检测是否包含 SynthID 隐形水印,判断是否为 AI 生成内容。
Claude 推出 Figma MCP 服务器插件,用户可直接让 Claude 将本地网页应用的页面发送到 Figma 进行设计协作。
Qwen3.5-397B-A17B-FP8 模型权重已开源,SGLang 支持已合并,vLLM 支持即将到来,可在 Hugging Face 和 ModelScope 下载。
阿里云模型服务平台推出 Qwen Coding Plan,提供最新 Qwen3.5-Plus 模型,支持 Claude Code、Cursor 等工具,Lite 版月费约 10 美元起,首发五折优惠。
Cursor 现已支持将过去的对话内容作为上下文使用,提升代码编辑的连续性和效率。
DeepMind 发布 Lyria 3 详细介绍,该模型可将照片和文字转化为包含人声和歌词的动态音乐曲目,为目前最强生成式音乐模型。
Anthropic 分析了 Claude Code 和 API 的数百万次交互,研究人们赋予 AI 智能体多少自主权、部署场景及潜在风险。
Google DeepMind 最新音乐生成模型 Lyria 3 已登陆 Gemini App,用户可通过描述想法或上传图片/视频来创作包含人声和歌词的自定义音乐。
OpenAI 推出 EVMbench 基准测试,用于衡量 AI 智能体检测、利用和修补高危智能合约漏洞的能力。
Musk 宣布推出新版 Grok 4.20 Heavy 模型,称其为一次重大升级,建议用户尝试体验。
Google 公布最新数据显示全球 74% 的公务员已在使用 AI,但仅 18% 认为其政府有效利用了 AI,为此 Google 宣布多项新举措帮助弥合这一差距。
Elon Musk 回复 AI 评论员 Dave Shapiro 称已将其反馈转发给 Grok 团队,显示 xAI 正积极收集用户意见优化 Grok。
Claude Code 现已支持将代码原型直接推送到 Figma 画布,通过最新更新的 Figma MCP 服务器,开发者可在代码中构建原型后发送到 Figma 探索多种设计版本。
Google 在印度 AI 影响力峰会上宣布美印连接计划(战略光纤线路提升数字连接),以及 3000 万美元的 Google.org AI 政府创新挑战赛,支持全球组织利用 AI 改善公共服务。
博主宝玉分享了由 AI 制作的《楚门的世界》续集短片,作者 Yubinnnn 使用即梦 SeedDance 2.0 生成,展示了 AI 视频生成的最新效果。