← 返回资讯
产品发布 @Google 2026-06-09

Google 发布 Gemini 3.5 Live Translate,实时语音翻译支持 70+…

历时20余年消除语言障碍的最新成果,该音频模型实现跨语言即时语音到语音翻译,适用于多种场景的全球化沟通需求。

查看原文
TL;DR · 产品解读

Google 发布 Gemini 3.5 Live Translate,实现端到端语音实时翻译,支持 70+ 语言。这是 Google 耗时 20 余年打磨的里程碑产品,标志实时翻译从「文字中转」正式进入「原生语音」时代。

深度解读

产品是什么

Gemini 3.5 Live Translate 是 Google 发布的端到端语音翻译模型。与传统翻译工具需要「语音→文字→翻译→语音」的多跳流程不同,它实现真正的语音到语音直译——输入源语言音频,输出目标语言音频,中间不经过文字转写环节。这意味着翻译延迟大幅降低,语音自然度也更高。

从技术定位看,这是一个专攻 Audio-to-Audio 的 Gemini 3.5 子模型,而非通用多模态模型。Google 强调这是历时 20 余年消除语言障碍的最新成果,足见其战略分量。

解决什么问题

传统翻译工具在实时场景有三大痛点:

Live Translate 的目标是让两个人各说各的语言,却能像母语对话一样自然流畅,适用于商务会议、旅游问路、医疗问诊、跨国客服等场景。

对比同类竞品

当前实时翻译市场的主要玩家:

参考来源
  1. Google 发布 Gemini 3.5 Live Translate · 2026-06-09
  2. Meta Live Translate 官方介绍 · 2023-09-27
  3. DeepL Voice 发布公告 · 2024-06-15
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。