精选新闻
2026-06-10
3
谷歌Gemini 3.5实时翻译上线:70+语言同声传译,保留原声语调

谷歌发布Gemini3.5实时翻译模型,支持70多种语言自动识别,通过先进音频处理技术实现语音到语音翻译,核心优势在于卓越的感知与还原能力,旨在打破跨语言交流边界。
核心要点
- 1.谷歌发布Gemini3.5实时翻译模型
- 2.支持70多种语言自动识别
- 3.采用语音到语音翻译,先进音频处理
- 4.核心优势在于卓越的感知与还原能力
- 5.旨在打破跨语言交流边界
关键数据
支持语言数量: 70多种(Gemini3.5支持自动识别的语言数量)
影响评估
正面
推动实时翻译技术发展,降低跨语言沟通门槛
通过语音到语音的实时翻译和音频处理优化,提升多语言交互的流畅性和自然度,对全球化沟通和AI语音应用领域有积极影响
相关工具
Gemini3.5— 谷歌发布的实时翻译模型
6月9日,谷歌正式发布 Gemini 3.5 实时翻译模型。该技术旨在利用先进音频处理,消除跨语言沟通障碍。
核心功能与技术细节
Gemini 3.5 专注于 语音到语音(Speech-to-Speech) 的实时翻译。据谷歌官方介绍,模型具备三大特点:
广泛覆盖: 支持全球 70多种语言 的自动化识别,涵盖主流与小众语种。
个性保留: 区别于传统机械翻译,它能精准捕捉并同步说话者的 语调、语速和音高。
情感还原: 确保翻译内容准确流畅的同时,保留原发言人的情绪特征与个人风格。
落地与应用
目前,这项技术已进入部署阶段。谷歌正将其逐步集成至旗下的各类产品矩阵中。
随着模型全面推送,用户在国际化会议、旅行或商务场景中,将体验到更自然的无缝实时互译服务。