Skype 翻译器的工作原理
目录:
科幻小说中充满了对技术先进设备的引用,用神话的说法来说,这些设备的操作与魔法没有区别。由于其作者的创造性思维,很难想象这些发明何时会掌握在我们手中,我们最终接受它们的存在不会成为我们生命周期的一部分。但每隔一段时间,其中一个就会过早地潜入我们的生活。这就是Microsoft 和Skype 即将实现的实时翻译的情况
"任务一点也不简单。它涉及到 Skype 的视频会议能力、微软 Azure 庞大的云服务器网络、微软研究院的技术创新,以及统计和机器学习等多个领域的最新进展。所有这一切都为您服务,因此,一旦您用您的语言说出一个句子,系统就会识别您所说的内容,将其翻译并以不同的语言将其传输给您的联系人。这怎么可能?"
使之成为可能的技术
Skype Translator,新功能的名称,不是昙花一现,甚至一年都没有. Skype Translator 是语音识别、机器翻译和机器学习技术数十年研究的成果。在所有这些领域中,如果没有最新的进展,系统的运行是不可能的。
Skype Translator 是语音识别、机器翻译和机器学习技术数十年研究的成果。从语音识别开始,这项技术已经研究了一段时间,但其采用一直受到大量影响现有系统的错误和过度敏感。一秒钟的怀疑、口音的细微变化或最小的噪音都足以让计算机感到困惑,并让它明白自己想要什么。在“深度学习”技术的发展和人工神经网络的创建爆炸式增长之前,情况一直如此,而微软研究院对此有所了解。多亏了他们,才有可能大大降低错误率并提高语音识别的可靠性和鲁棒性,这是 Skype 翻译工作的必要第一步。
machine translation是Skype Translator赖以生存的另一个明显支柱。微软在这里再次使用内部技术并使用 Bing 翻译引擎将文本从一种语言翻译成另一种语言。他的系统结合使用语法识别技术和统计模型来改进结果。此外,在这种情况下,引擎经过专门训练,可以识别口头对话中出现的语言类型,远非通常假定的书面形式的正确性和整洁性。因此,Skype Translator 系统结合了 Bing Translator 庞大的语言知识库以及广泛的口语常用单词和短语层。
但是言语和语言是复杂的地形。它们不断变化,有多种口味和品种,每个人都有自己独特的风格,等等。 Skype Translator 必须跟上这一切,需要不断训练和优化语音识别和机器翻译。为此该系统建立在强大的“机器学习”平台上,这是人工智能的一个分支,旨在开发允许机器和算法学习的技术通过样本数据训练。使用这些在统计领域很常见的技术,可以让服务在使用时得到改进,利用使用它时生成的数据进一步完善语音识别和自动翻译。
其中一些测试数据是从各种来源自动生成的,包括社交网络(例如 Facebook)、翻译的网页、带字幕的视频,甚至是为此目的创建并手动转录和翻译的对话.但另一部分数据来自通过该服务进行的实际对话。这很重要,因为微软会在每次通话时通知您,您应该知道Skype Translator 可以记录对话,保持匿名,以便以后可以通过其算法进行分析 并在他们的统计模型的训练过程中引入。
Skype Translator 只有能够通过基于其在真实人类对话中使用的过程进行学习才能正常工作
"如果没有这个学习过程,系统将无法运行。当人类说话时,我们会停下来重复事情,犯错误并改变我们的想法,介绍啊,嗯,呃>只有了解它的实际用途才能让它变得更好"
在几秒钟内从一种语言到另一种语言
在所有这些进步的支持下,关键是Skype Translator能够为用户快速透明地执行整个识别和翻译过程 每次我们说话时,系统都必须识别我们所说的内容,将其翻译成接收者的语言,并以忠实于我们最初尝试交流的方式与他交流。我们越少注意到中间步骤越好
一旦系统检测到我们正在说话,它就会开始记录我们所说的话,并开始语音识别过程这不是不仅要识别我们正在发音的每个单词,还要消除所有多余的东西,删除无意义的表达和噪音,检测文本分成句子的情况,包括标点符号和大写字母,并为其提供上下文这有助于你的解释。稍微想一想,你就会发现,从口头语言来判断这一切是多么的困难。
Skype Translator 需要语音识别尽可能准确,因为接下来是准备收集的信息以将其与一直在改进的统计模型进行比较 通过其“机器学习”系统。这里的过程包括寻找系统理解的我们所说的内容与模型中包含的单词和上下文之间的相似性,随后应用先前学习的转换将音频转换为文本并将其翻译成外语。
在最后一步,Skype准备了一对机器人,有女性和男性的声音,在通话中充当翻译一旦用户选择了一个,他将负责将我们翻译的消息传达给接收者,这样不仅书面转录和翻译会出现在屏幕上,而且他还可以大声听到它们,就像第三个人一样介于我们之间。。这些机器人能够快速传达信息,因此在屏幕另一边收听的人会在我们发出信息后几秒钟收到信息。
以测试程序为起点
准确地说,机器人作为第三方发言者在对话中的存在是仍有待完善的细节之一。微软认识到,对于习惯通过口译员说话的人来说,适应它们很容易,但对于其他人来说,这需要一个学习期。微软和 Skype 可能决心创造现有的最佳实时翻译体验,但要做到这一点他们需要我们自己和机器学习Skype 翻译器预览只是该过程中的一个步骤。
测试程序于12月中旬上线,引入了英语和西班牙语两种语言的口译,以及40多个语言的笔译要访问它,需要邀请,我们可以通过在程序的网站上注册来请求邀请。如果我们喜欢它,我们可以从 Windows 8 的 Skype 应用程序中尝试 Skype Translator。1 或 Windows 10 技术预览版。不然就得等服务延期正式对外公开了
"不管怎样,在我们即将告别2014之际,Skype翻译已经开始了。在结束之前,停在这里一秒钟,想想你刚刚读到的那一年:2014>"
通过| Skype 博客 I、II