大模型 @Google 2026-06-09

Google 发布 Gemini 3.5 Live Translate，实时语音翻译支持 70+…

历时20余年消除语言障碍的最新成果，该音频模型实现跨语言即时语音到语音翻译，适用于多种场景的全球化沟通需求。

TL;DR · 产品解读

Google 发布 Gemini 3.5 Live Translate，实现端到端语音实时翻译，支持 70+ 语言。这是 Google 耗时 20 余年打磨的里程碑产品，标志实时翻译从「文字中转」正式进入「原生语音」时代。

深度解读

Gemini 3.5 Live Translate 是 Google 发布的端到端语音翻译模型。与传统翻译工具需要「语音→文字→翻译→语音」的多跳流程不同，它实现真正的语音到语音直译——输入源语言音频，输出目标语言音频，中间不经过文字转写环节。这意味着翻译延迟大幅降低，语音自然度也更高。

从技术定位看，这是一个专攻 Audio-to-Audio 的 Gemini 3.5 子模型，而非通用多模态模型。Google 强调这是历时 20 余年消除语言障碍的最新成果，足见其战略分量。

传统翻译工具在实时场景有三大痛点：

Live Translate 的目标是让两个人各说各的语言，却能像母语对话一样自然流畅，适用于商务会议、旅游问路、医疗问诊、跨国客服等场景。

当前实时翻译市场的主要玩家：

● 未登录访客

SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源，仅 Pro 会员可见

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示？联系反馈

参考来源

本解读由 AI 自动生成 · 模板：产品解读 · 仅供参考，请以原文为准。