阿里巴巴语音识别技术再升级,嘈杂环境中仍能准确进行语音识别
2019年02月20日 由 z朝闻 发表
948523
0
阿里巴巴作为世界上最大的电子商务公司之一,如今已经越来越多地将注意力转向人工智能(AI,Artificial Intelligence)。 2017年3月,阿里巴巴成立了医疗和制造人工智能服务部门,9月,阿里云成立了,作为一家专门用于自主研发并生产人工智能推理芯片的子公司。该芯片可用于物流和自动驾驶。
在蒙特利尔举行的NeurIPS2018会议上,阿里巴巴介绍了这些跨领域开发的最新情况。
阿里巴巴数据科学研究所所长表示:“我们正在解决……一些看不见的难题。” “人工智能和创新(正在)帮助解决一些有趣的问题。”
其中一个问题就是在嘈杂的环境中进行语音识别,比如拥挤的地铁或拥挤的会议中心,这样的环境下,如何进行清晰的语音识别。阿里巴巴的解决方法部分依靠硬件更换,部分是软件升级,将二者全面改善后发现,一个远场麦克风阵列和复杂的深度学习算法,可以隔离人群中的噪音,同时大大降低了错误率。
阿里巴巴声称,这项新技术与现存最好的语音识别技术相比,准确率高出10%左右。这项的新的语音识别系统已经作为上海地铁票务系统中语音系统的一部分。目前,阿里巴巴正打算将其推广到其他城市。
阿里巴巴新成立的研究机构——达摩院(简称DAMO)成立至今仅一年多的时间,该研究院一直致力于解决机器学习和网络安全等新兴技术,并在圣马特奥、西雅图、莫斯科、特拉维夫和新加坡开设了实验室。阿里巴巴旗下的天猫精灵正是在这期间推出的。天猫精灵是一款人工智能语音助手,自2017年7月上市以来销量已超过500万部。
可以说,该公司才刚刚起步就已取得了优异的成绩。阿里巴巴在2017年10月与Quartz的洽谈中称,计划到2020年在人工智能方向的研发上投入150亿美元。