谷歌宣布,旗下搜索与谷歌翻译应用迎来重大更新,此次升级由Gemini 人工智能模型提供技术支持,旨在让翻译结果更贴近真人表达的质感。升级后的功能不仅能更精准地解读具有微妙含义的俚语与惯用表达,还为耳机用户新增了一项实时翻译功能,可完整保留说话人的语气。
谷歌方面表示,整合 Gemini 模型后,其文本翻译能力能够处理比以往丰富得多的语义细节。在过去,口语化的俚语和习语往往会被生硬直译,有时还会产生令人啼笑皆非的翻译结果。而本次更新后,这类非正式表达会被纳入具体语境进行解读,最终输出的译文更自然地道,且更贴合目标语言的文化背景。
本次更新将率先在美国与印度上线,支持英语及约 20 种其他语言(包括中文、德语、西班牙语和阿拉伯语),覆盖 iOS、Android 及网页端平台。除文本翻译外,语音翻译功能也同步得到增强。谷歌对语音互译技术进行了升级,用户可通过耳机直接收听实时翻译内容。
目前,这项功能已作为测试版在美国地区的安卓版谷歌翻译中推出(iOS 版本计划于明年上线),其最大亮点在于,能够借助 AI 技术完整保留说话人的语气、重音与语调节奏。即使用户不看屏幕,也能判断出说话人是在发怒、开玩笑还是认真陈述,大幅提升跨语言对话的流畅度。
该功能兼容所有品牌耳机,并非仅限谷歌 Pixel Buds,且支持70 余种语言。此举似乎表明,谷歌正与传闻中搭载同类功能的苹果 AirPods Pro 3 展开直接竞争。与此同时,谷歌显然有意抢占更大的语言学习市场份额。早在今年 8 月,谷歌翻译应用就已推出 AI 辅助学习工具,而本次更新又新增了类似多邻国(Duolingo)的 **“连续学习天数” 打卡功能 **,通过记录用户的每日学习情况来培养学习习惯。不过,谷歌是否会效仿多邻国标志性的高强度激励策略,目前尚未可知。
此外,发音反馈功能也得到优化,能够为用户提供更实用、更具指导性的发音建议。这些学习类工具即将拓展至另外 20 个地区,包括德国、印度和瑞典。
在笔者看来,谷歌近期对翻译领域的重视程度明显提升。尽管长期以来,人工智能一直是谷歌翻译的技术基石,但生成式 AI 的发展,已将谷歌翻译从传统机器翻译的范畴推向更高阶的水平 —— 译文不仅准确度提高,还具备了更接近人类表达的质感。当然,文化层面的细微差异至今仍是一道需要攻克的难题。
此次更新强化了对俚语和语音语气的处理能力,凸显出谷歌正着力发挥 Gemini 模型的技术优势,解决长期以来困扰机器翻译的两大痛点:语境理解与情感传递。当人工智能不仅能识别文字表层含义,还能读懂言外之意、捕捉语音语调时,阻碍人类实现真正无障碍跨语言沟通的最后一道壁垒,或许正开始逐步瓦解。








发表评论
您还未登录,请先登录。
登录