AI 资讯

2026-03-26

Runway：推出 Multi-Shot App 多镜头视频生成应用

只需简单提示即可生成包含对话、音效、剪辑节奏和电影级构图的完整场景，支持图生视频和纯文本生成。

产品发布 AI 摘要 · 单一来源

@runwayml 阅读 →

Google：AI 搜索语音对话 Search Live 全球上线 200+ 国家

Search Live 交互式多模态对话功能已覆盖 200+ 国家和地区，由 Gemini 3.1 Flash Live 驱动，原生支持多语言。

产品发布 AI 摘要 · 单一来源

@Google 阅读 →

Cursor：公开 Composer 2 技术报告，每 5 小时迭代一次模型

Cursor 发布 Composer 2 技术报告，揭示通过实时强化学习训练新检查点的方法，实现每 5 小时更新一次模型版本。

产品发布 AI 摘要 · 单一来源

@cursor_ai 阅读 →

Google：Gemini 3.1 Flash Live 带来语音交互全面升级

新模型响应更快、对话更自然，Gemini Live 对话记忆翻倍，多语言支持扩展至 200+ 国家和地区。

产品发布 AI 摘要 · 单一来源

@Google 阅读 →

Google DeepMind：发布 Gemini 3.1 Flash Live 音频模型

最新音频模型支持更自然的对话体验，改进了函数调用能力，使 AI 对话更实用、更智能。

产品发布 AI 摘要 · 单一来源

@GoogleDeepMind 阅读 →

期待 AI Agent 能一句话完成从代码到部署的全流程

Karpathy 分享构建 menugen 的经历，指出最难的不是代码而是组装各种服务（支付、认证、数据库等），期待 Agent 自动完成全栈部署。

观点 · 观点/主张 AI 摘要 · 单一来源

@karpathy 阅读 →

Mistral AI：发布 Voxtral TTS 开源语音合成模型

Voxtral TTS 支持 9 种语言，具备情感表达能力和超低首音延迟，可轻松适配新声音，模型权重开源。

产品发布 AI 摘要 · 单一来源

@MistralAI 阅读 →

Meta AI：发布 TRIBE v2 三模态脑编码器基础模型

TRIBE v2 基于 500+ 小时 fMRI 数据训练，能预测人脑对视觉和听觉的反应，可零样本预测新受试者、新语言和新任务。

产品发布 AI 摘要 · 单一来源

@AIatMeta 阅读 →

xAI：新一代 Imagine 图像模型即将发布

Elon Musk 预告 xAI 新版 Imagine 图像生成模型将更加出色，并展示了视频演示效果。

大模型 AI 摘要 · 单一来源

@elonmusk 阅读 →

海螺 AI 联合巴西 Belas Artes 大学举办创意 AI 工作坊

海螺 AI 将于 3 月 31 日在圣保罗 Belas Artes 大学举办线下工作坊，探索 AI 如何变革设计、摄影、视频和动画创作流程。

活动 AI 摘要 · 单一来源

@Hailuo_AI 阅读 →

如何让老板理解「AI 是工具不是魔法」

知名博主宝玉分享职场 AI 认知难题——当老板对 AI 期望过高时，或许可以让他亲自体验 AI 的局限性，知难而退。

观点 · 观点/主张 AI 摘要 · 单一来源

@dotey 阅读 →

通义千问：Qwen3.5 全系列获社区测试认可

通义千问感谢社区用户对 Qwen3.5 全系列模型进行全面测试，表示社区反馈有助于持续改进模型表现。

大模型 AI 摘要 · 单一来源

@Alibaba_Qwen 阅读 →

AI 时代创业核心是大胆使用 Token，降低创业门槛

YC CEO Garry Tan 表示 AI 时代创业者需要积极使用 Token 创造产品，AI 额度是让各阶层都能创业的关键。

观点 · 观点/主张 AI 摘要 · 单一来源

@garrytan 阅读 →

给高中生演示 AI Coding 的三个核心建议

宝玉分享向高中生演示 AI 编程的心得：AI 是工具非魔法、批判性思维很重要、AI 将消灭旧岗位创造新机会，建议多用但不依赖。

观点 · 观点/主张 AI 摘要 · 单一来源

@dotey 阅读 →

vLLM：集成 Google TurboQuant 技术，USB 充电器大小设备可缓存 400 万+ Token

vLLM 集成 Google 的 TurboQuant 量化技术，在极小设备上实现超过 400 万 Token 的 KV-cache，大幅提升边缘推理能力。

大模型 AI 摘要 · 单一来源

@vllm_project 阅读 →

Kimi：GTC 大会发布 Attention Residuals 新架构

Kimi 联合创始人在 GTC 2026 大会上介绍 Attention Residuals 技术，提出选择性记忆而非机械累积的注意力机制改进方向。

研究 AI 摘要 · 单一来源

@Kimi_Moonshot 阅读 →

YC：印度 Startup School 录取学生可获 2.5 万美元 AI 及云服务额度

Y Combinator 宣布，所有被 Startup School India 录取的学生将获得超过 2.5 万美元的 AI 和云计算额度，旨在降低创业门槛。

行业 AI 摘要 · 单一来源

@ycombinator 阅读 →

Agent 时代开发首选 bun 执行 TypeScript

AI 开发者宝玉分享经验，所有 skills 脚本默认用 bun 执行 TypeScript，无需编译即可运行，出错时 Agent 能直接定位并修改源码，大幅提升调试效率。

观点 · 观点/主张 AI 摘要 · 单一来源

@dotey 阅读 →

开源 AI 药物发现崛起：Open Source Floats All Boats

Bio-IT World 报道开源工具在 AI 驱动药物发现中的崛起。目前已有 160+ AI 设计药物进入临床阶段，研发周期缩短 75%。

AI4Science AI 摘要 · 单一来源

@BioIT 阅读 →

分子之心 MoleculeOS 升级：融合蛋白药物表达量提升 400 倍

分子之心 MoleculeOS 平台重大升级，将融合蛋白药物表达量提升超 400 倍，AI+量子化学效率较传统方法提升千亿倍，达到工业可用水平。

AI4Science AI 摘要 · 单一来源

@分子之心阅读 →

上海交大 Venus 模型：全球最大蛋白质数据集，精准预测蛋白质功能

上海交通大学洪亮教授团队发布 Venus 系列模型，基于全球最大蛋白质数据集训练，可精准高效预测和设计蛋白质功能。

AI4Science AI 摘要 · 单一来源

@上海交大阅读 →

Boltz-2：MIT+Recursion 联合发布，结构预测比传统方法快 1000 倍

MIT CSAIL 与 Recursion 联合发布 Boltz-2，可同时预测蛋白质结构和结合亲和力，运行速度比基于物理的自由能微扰方法快 1000 倍。

AI4Science AI 摘要 · 单一来源

@Science 阅读 →

AlphaFold 数据库新增 3000 万蛋白质复合物预测

EMBL-EBI 宣布 AlphaFold 数据库新增 3000 万蛋白质复合物预测结构，其中 170 万高置信度同源二聚体。帮助科学家理解蛋白质如何相互作用。

AI4Science AI 摘要 · 单一来源

@EMBL 阅读 →

Isomorphic Labs 发布 IsoDDE：被科学家称为 AlphaFold 4 的药物发现引擎

Google DeepMind 药物研发子公司 Isomorphic Labs 发布新一代 AI 药物发现引擎 IsoDDE，Nature 报道科学家称之为 AlphaFold 4。27 页技术报告展示了超越 AlphaFold 3 的结构预测和药物设计能力。

AI4Science AI 摘要 · 单一来源

@Nature 阅读 →

2026-03-25

SpecEyes：通过推测感知与规划加速多模态 LLM Agent

新论文提出 SpecEyes 方法，通过推测性感知和规划机制加速 Agent 式多模态大语言模型的推理效率。

研究 AI 摘要 · 单一来源

@_akhaliq 阅读 →

MiniMax Audio 史上最大促销：全场最高六折优惠

海螺 AI 旗下 MiniMax Audio 推出史上最大力度促销，所有订阅至少五折、最高六折优惠，年度会员可升级享受折扣。

产品发布 AI 摘要 · 单一来源

@Hailuo_AI 阅读 →

Ego2Web：基于第一视角视频的 Web Agent 评测基准

新论文提出 Ego2Web 基准，通过第一视角视频评估 Web Agent 的任务完成能力，为多模态 LLM Agent 研究提供新方向。

研究 AI 摘要 · 单一来源

@_akhaliq 阅读 →

n8n 推出 AI 灵感工作坊：免费线下实操自动化活动

自动化平台 n8n 推出 AI Inspiration Sessions 系列免费线下工作坊，展示真实 AI 驱动的自动化工作流，无需经验即可参与。

活动 AI 摘要 · 单一来源

@n8n_io 阅读 →

MinerU-Diffusion：将文档 OCR 重新定义为扩散模型逆渲染

新论文提出 MinerU-Diffusion，将文档 OCR 任务建模为逆渲染过程，利用扩散解码实现更准确的文档识别。

研究 AI 摘要 · 单一来源

@_akhaliq 阅读 →

WildWorld：面向生成式 ARPG 的大规模动态世界建模数据集发布

研究者发布 WildWorld 数据集，支持基于动作和显式状态的动态世界建模，推动生成式动作角色扮演游戏的发展。

研究 AI 摘要 · 单一来源

@_akhaliq 阅读 →

Runway：推出 Multi-Shot App 多镜头视频生成应用

Google：AI 搜索语音对话 Search Live 全球上线 200+ 国家

Cursor：公开 Composer 2 技术报告，每 5 小时迭代一次模型

Google：Gemini 3.1 Flash Live 带来语音交互全面升级

Google DeepMind：发布 Gemini 3.1 Flash Live 音频模型

期待 AI Agent 能一句话完成从代码到部署的全流程

Mistral AI：发布 Voxtral TTS 开源语音合成模型

Meta AI：发布 TRIBE v2 三模态脑编码器基础模型

xAI：新一代 Imagine 图像模型即将发布

海螺 AI 联合巴西 Belas Artes 大学举办创意 AI 工作坊

如何让老板理解「AI 是工具不是魔法」

通义千问：Qwen3.5 全系列获社区测试认可

AI 时代创业核心是大胆使用 Token，降低创业门槛

给高中生演示 AI Coding 的三个核心建议

vLLM：集成 Google TurboQuant 技术，USB 充电器大小设备可缓存 400 万+ Token

Kimi：GTC 大会发布 Attention Residuals 新架构

YC：印度 Startup School 录取学生可获 2.5 万美元 AI 及云服务额度

Agent 时代开发首选 bun 执行 TypeScript

开源 AI 药物发现崛起：Open Source Floats All Boats

分子之心 MoleculeOS 升级：融合蛋白药物表达量提升 400 倍

上海交大 Venus 模型：全球最大蛋白质数据集，精准预测蛋白质功能

Boltz-2：MIT+Recursion 联合发布，结构预测比传统方法快 1000 倍

AlphaFold 数据库新增 3000 万蛋白质复合物预测

Isomorphic Labs 发布 IsoDDE：被科学家称为 AlphaFold 4 的药物发现引擎

SpecEyes：通过推测感知与规划加速多模态 LLM Agent

MiniMax Audio 史上最大促销：全场最高六折优惠

Ego2Web：基于第一视角视频的 Web Agent 评测基准

n8n 推出 AI 灵感工作坊：免费线下实操自动化活动

MinerU-Diffusion：将文档 OCR 重新定义为扩散模型逆渲染

WildWorld：面向生成式 ARPG 的大规模动态世界建模数据集发布

该话题暂无资讯