订阅 AI123 精选资讯,每周获取最新动态

立即订阅
返回新闻列表
精选新闻
2026-06-10
3

谷歌Gemini 3.5实时翻译上线:70+语言同声传译,保留原声语调

谷歌Gemini 3.5实时翻译上线:70+语言同声传译,保留原声语调
谷歌发布Gemini3.5实时翻译模型,支持70多种语言自动识别,通过先进音频处理技术实现语音到语音翻译,核心优势在于卓越的感知与还原能力,旨在打破跨语言交流边界。

核心要点

  • 1.谷歌发布Gemini3.5实时翻译模型
  • 2.支持70多种语言自动识别
  • 3.采用语音到语音翻译,先进音频处理
  • 4.核心优势在于卓越的感知与还原能力
  • 5.旨在打破跨语言交流边界

关键数据

支持语言数量: 70多种(Gemini3.5支持自动识别的语言数量)

影响评估

正面

推动实时翻译技术发展,降低跨语言沟通门槛

通过语音到语音的实时翻译和音频处理优化,提升多语言交互的流畅性和自然度,对全球化沟通和AI语音应用领域有积极影响

相关工具

Gemini3.5谷歌发布的实时翻译模型

6月9日,谷歌正式发布 Gemini 3.5​ 实时翻译模型。该技术旨在利用先进音频处理,消除跨语言沟通障碍。

核心功能与技术细节

Gemini 3.5 专注于 语音到语音(Speech-to-Speech)​ 的实时翻译。据谷歌官方介绍,模型具备三大特点:

  • 广泛覆盖:​ 支持全球 70多种语言​ 的自动化识别,涵盖主流与小众语种。

  • 个性保留:​ 区别于传统机械翻译,它能精准捕捉并同步说话者的 语调、语速和音高

  • 情感还原:​ 确保翻译内容准确流畅的同时,保留原发言人的情绪特征与个人风格。

落地与应用

目前,这项技术已进入部署阶段。谷歌正将其逐步集成至旗下的各类产品矩阵中。

随着模型全面推送,用户在国际化会议、旅行或商务场景中,将体验到更自然的无缝实时互译服务。