微软在Edge浏览器中推出了一项实用性极强的新功能:当用户观看英语视频时,浏览器可借助人工智能将音频实时翻译成用户母语(例如简体中文)并以语音输出,让观众无需依赖字幕即可流畅观看。
本地AI处理:硬件门槛与原理
由于翻译通过本地AI模型处理,该功能对系统资源要求较高。微软表示,仅配备至少12GB内存和四核CPU的电脑可启用实时视频翻译,低配低配((需至少12GB内存和四核CPU的设备将无法支持该功能。
功能原理简明:AI模型先将视频音频转录为文本,再通过文本转语音模型生成翻译音频。
具体流程为:AI模型先将视频音频转录为文本,再通过文本转语音模型生成翻译音频。整个过程实时本地化运行,因此需占用大量内存——实际测试显示,16GB内存设备启用该功能时,Edge会占用近12GB内存。
使用方法与语言支持
该功能已在Edge Beta版本上线。用户可升级至Beta版,进入语言设置启用“实时视频翻译”,激活后即可测试任意视频的翻译效果。支持语言覆盖全球主要语种,近年购买的PC多配备16GB内存,而老旧设备若仍为8GB内存,虽可满足日常办公,但运行游戏或此类AI功能时会明显不足,建议升级至32GB或64GB以确保流畅体验。
发表评论
您还未登录,请先登录。
登录