Google 发布 Gemini 3.5 Live Translate,实时语音翻译支持 70+…
历时20余年消除语言障碍的最新成果,该音频模型实现跨语言即时语音到语音翻译,适用于多种场景的全球化沟通需求。
查看原文TL;DR · 产品解读
Google 发布 Gemini 3.5 Live Translate,实现端到端语音实时翻译,支持 70+ 语言。这是 Google 耗时 20 余年打磨的里程碑产品,标志实时翻译从「文字中转」正式进入「原生语音」时代。
深度解读
产品是什么
Gemini 3.5 Live Translate 是 Google 发布的端到端语音翻译模型。与传统翻译工具需要「语音→文字→翻译→语音」的多跳流程不同,它实现真正的语音到语音直译——输入源语言音频,输出目标语言音频,中间不经过文字转写环节。这意味着翻译延迟大幅降低,语音自然度也更高。
从技术定位看,这是一个专攻 Audio-to-Audio 的 Gemini 3.5 子模型,而非通用多模态模型。Google 强调这是历时 20 余年消除语言障碍的最新成果,足见其战略分量。
解决什么问题
传统翻译工具在实时场景有三大痛点:
- 延迟高:需要等说完一句话才能开始翻译。
- 语气丢失:文字翻译无法保留说话人的语调、停顿、情绪。
- 交互割裂:双方需要盯着屏幕看文字,或戴耳机听合成音。
Live Translate 的目标是让两个人各说各的语言,却能像母语对话一样自然流畅,适用于商务会议、旅游问路、医疗问诊、跨国客服等场景。
对比同类竞品
当前实时翻译市场的主要玩家:
● 未登录访客
SMARTFLOW PRO
继续阅读深度解读 + 编辑加注
下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见
加入机智流 PRO →¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道
已是 Pro 但仍被提示?联系反馈
参考来源
- Google 发布 Gemini 3.5 Live Translate · 2026-06-09
- Meta Live Translate 官方介绍 · 2023-09-27
- DeepL Voice 发布公告 · 2024-06-15
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。