思必驰最新语音专用芯片与传统芯片对比
2019年01月07日 由 荟荟 发表
551144
0
近日,思必驰发布了其第一代人工智能芯片TAIHANG(TH1520)系列,这款AI聚焦于语音应用场景的AI专用芯片由思必驰投资的独立公司深聪智能打造。从2018年年开始,国内数家语音技术创业公司陆续推出了各家的AI语音专用芯片,包括出门问问、Rokid等。而新年伊始,思必驰、云知声也重磅发声发布AI语音芯片,显现出AI语音从通用芯片走向专用芯片的终级一致。
据悉,TH1520主要面向智能家居、智能终端、车载、手机、可穿戴设备等各类终端设备。解决方案包含算法+芯片,具有完整语音交互功能,能实现语音处理、语音识别、语音播报等功能,支持离线语音交互。
和通用芯片相比,AI语音专用芯片好在哪里?
一.通用芯片的不足
一是算力不够效率不高。二是算法要不断迭代,功耗要实现毫瓦级,算法和通用芯片架构难以深度融合;三是对技术的理解难以协同;
2019年思必驰AI芯片暨战略发布会上举了个例子,他表示思必驰曾经对接过一个最复杂的场景,算法运行在4核Arm的芯片上,占用了芯片50%-60%的计算量,语音作为一种交互手段占用这么高的计算量在许多应用场景是难以接受的。
更重要的是通用芯片没有算法,算法是灵魂,芯片是框架。没有灵魂的框架产生不了价值的,必须借由专用芯片才能够实现芯片未来的潜能。比如思必驰的还有相当一部分的算法停留在实验室里,因为受到目前硬件平台的限制没法上线,不能真正提供给客户去使用。其中周伟达举例说道:“多麦克风阵列设计,我们自己设计了代码,然后去跟芯片厂家提出芯片接口是否能增加六个、八个麦克风,因为当时的 SOC 芯片一般只有左右两个通道的麦克风。但芯片厂商的迟疑是「你们确认有这个需求吗?」这些需求或许在他们看来是不可思议的。我们最后没办法,直接去用 FPGA 这种可编辑的硬件器件自己搭了一个 demo,向客户演示是双麦还是六麦效果更好,如果六麦效果更好,那芯片是否应该支持。所以作为技术提供商我们去要去硬件平台非常费劲。”
二.AI语音专用芯片优点
1.算力和可扩展性
:深聪智能CTO朱澄宇表示,TH1520进行了算法硬件优化,基于双DSP架构,
内部集成codec编解码器以及大容量的内置存储单元,同时,TH1520采用了AI指令集扩展和算法硬件加速的方式,使其
相较于传统通用芯片具有10X以上的效率提升。此外,TH1520在架构上对接下来两三年内的做优化留了一定的空间。使其
支持未来算法的升级和扩展。
2.技术协同性:TH1520兼具低功耗及实用性,采用多级唤醒模式,内置低功耗IP,使其在always-on监听阶段的功耗低至毫瓦级,典型工作场景功耗仅需几十毫瓦,极端场景峰值功耗不超过百毫瓦。该芯片支持单麦、双麦、线性4麦、环形4麦、环形6麦等全系列麦克风阵列,同时支持USB/SPI/UART/I2S/I2C/GPIO等应用接口和多种格式的参考音,
能在各类IOT产品中灵活部署应用。
3.数据安全性:思必驰CTO周伟达介绍,
在芯片的安全性上,研发团队做了三层数据安全的保护,主要表现在减少数据传输到云端,同时基于芯片中加入的芯片密码,能够更好地保护用户的隐私。
4.市场反应迅速:对于市场应用,该款芯片定位于各类终端设备,并针对家居环境进行算法优化,
能够快速落地,大幅度提升电视、盒子、白电、平板、灯具等产品的用户体验。
随着语音交互技术在落地过程中的应用,单纯的AI算法一方面无法满足用户对于语音交互需求的不断提升,此外,为了实现商业价值的最大化,创业公司也必须通过算法和硬件的垂直整合才能保证自身的核心利益。