微软宣布其语音识别技术降低了错误率并且与人类一样有效

Anonim
"

这是许多人肯定不同平台将在不久的将来发展的支柱之一。无需与书面命令或手势进行交互。 未来在于与机器对话而不是与机器人指令和非自然指令对话。我们会用自然语言来做,这是我们在个人助理中越来越清楚地欣赏的东西。"

从这个意义上说,在职业生涯中最著名的公司之一是微软,这家公司的发展道路是不断提高员工在其平台上的语音识别能力。一项我们现在从开发团队那里获得新闻的技术,谈论的重大改进,使其与人类使用的精度水平相同

从这个意义上说,他们宣布他们的语音识别系统在WER中达到了5.1%,即错误率使用的词。对于许多人来说,这可能没有说明什么,但如果我们一方面看到这个速率与我们在人与人之间的交流中发现的速率相同,那将是令人惊讶的

为此,雷德蒙德他们选择使用基于神经网络的改进的口头和声学语言模型这些是 它们与长期双向记忆相结合,从而改进了声学建模,从而通过根据通信历史预测可以使用的单词来提高识别能力。由于公司为改进云计算基础架构所做的努力,尤其是 Azure,这些改进也得到了云的支持。

另外,这意味着这个错误率在失败率方面已经降低了,因为之前它是5.9%,因此从 12% 下降,这是该系统不到一年前的数字。因此,微软已经实现了与人类一样有效的语音识别系统,看到他们正在取得的进步,他们甚至会在未来几个月或几年内改进它也就不足为奇了。

谁知道在几年后与我们的Windows PC 交谈、与Cortana 或Office 等应用程序交互,是否会像它们已经让我们梦想(或做噩梦,谁知道)在电影院

在Xataka |它们不是来自坟墓之外的声音,它们是语音助手能识别而人类不能识别的隐藏命令

编辑的选择

Back to top button