微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 Skype Translator发布实时语音翻译中文预览版

Skype Translator发布实时语音翻译中文预览版

2015-04-09 19:07
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2015-04-09 19:07 CNET科技资讯网

Skype Translator发布实时语音翻译中文预览版

自2014年12月Skype Translator 推出英文和西班牙文之间的实时语音翻译之后,此次在中国市场的发布是Skype Translator旅程中又一迭新,Skype Translator预览版适用于Windows 8.1或Windows 10技术预览版的客户端或平板电脑客户端。除了英文和中文普通话的语音翻译之外,还支持四十多种语言的即时文本翻译。

Skype Translator发布实时语音翻译中文预览版

Skype Translator构建于机器学习平台之上。通过在预览版阶段获取的训练数据,加之其中的细微差别,软件就能够针对真实使用者的不同话题、口音与语言转换进行学习,实现更好的识别和翻译。

Skype Translator的机器学习协议训练并优化语音识别和机器翻译任务,该协议促进对被识别的文本进行更好的翻译。这个过程包括去除造成不流利的字词(例如“啊”“嗯”以及重复措辞)、将文本分解成句子、添加标点符号和大小写识别。

语音识别和机器翻译的训练数据来源多种多样,包括翻译的网页、配有字幕的视频,以及预先翻译且转录成文字的一对一谈话。Skype Translator通过记录这些对话,来分析对话文本并训练系统更好地“学习”各种语言。微软官方称,已经有很多人与分享了他们过去的对话记录,微软对其进行了分析并为统计模型创造训练数据,该统计模型教会语音识别和机器翻译引擎如何将收集到的语音转换为文本信息,然后将文本信息转换为另一种语言。使用Skype Translator的用户都会在对话开始前得到清晰的系统提示,即对话将被录制并用于提高微软翻译和语音识别服务的质量。

在准备好的数据被录入机器学习系统后,机器学习软件会在这些对话和环境涉及到的单词中搭建一个统计模型。当用户说话时,软件会在该统计模型中寻找相似的内容,之后应用到预先“学到”的转化程序中,使得音频转换为文本再从文本转换成另一种语言。

虽然语音识别一直是近几十年来的重要研究课题,但是该技术的发展普遍被错误率高、麦克风敏感度差异、噪音环境等因素阻碍。微软研究院率先将深层神经网络(DNNs)技术引入语音识别极大程度地降低了错误率,提高了可靠性,最终使这项语音翻译技术得以更广泛地应用,包括Skype Translator。

Skype Translator的机器翻译部分负责将文本从一种语言翻译成另一种语言。它采用了和必应在线翻译同样的技术:开创性地结合了句法和统计模型,此外更加有针对性地训练对话性语言。这点非常有挑战性,因为现在用来搭建文本翻译系统的典型训练数据都是优化过的清晰、结构严谨的书面语言。我们的系统在包含必应翻译的丰富语言知识的同时,还额外加入了口语对话中出现的单词及短语。

另外,我们创造了一个定制化的机器人程式来协调整个产品体验。如电话中的第三方一样,它负责建立电话连接、发送音频流至语音引擎获取翻译文本,并分别在双方结束说话时翻译其所说的内容。

要创造这样的程式,需要微软研究院和Skype团队集合双方共同的专业知识和工程能力,形成一个复杂的架构,但希望对用户来说获取的则是简单而直接的体验。

另外,在语言翻译的用户体验中也存在一些固有的挑战。比如,Skype Translator的自动翻译器会以类似于第三方通话者的角色出现。Skype发现,过去使用过现场翻译服务的用户能很快适应这种沟通方式,而其他用户则需要更多的时间来适应。

相较于2014年12 月推出的英文和西班牙文之间的实时语音对话,本次推出中文预览版的功能更新如下:

  • 语音读取文字信息

用户可以通过语音收听到对话方发送给自己的即时消息,语音的语言可以自选。

  • 持续性识别

在对方发送语音信息期间可持续性的进行文字翻译。

  • 自动声量控制

用户对话方可以在实时语音翻译期间不间断地说话。同时,用户可收听到较高音量的语音翻译,对话方本身的语音信息呈现出较低音量,所以只要将注意力集中在语音翻译上即可,这可以保证翻译信息的收听流畅。

  • 语言翻译静音功能

可以任意开启或关闭语音翻译的声音,并直接读取文字翻译。

除了语音翻译现有的四种语言(英语,西班牙语,中文普通话,意大利语), Skype Translator 的即时通讯文本翻译更是在原有40多种语言的基础上加入了塞尔维亚语,波斯尼亚语,克罗地亚语,玛雅语和奥托米语。

分享至
0赞

好文章,需要你的鼓励

推荐文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-