语音识别作为人工智能发展最早、且率先商业化的技术,近几年来随着深度学习技术的突破,识别准确率大幅提升,带动了一波产业热潮。继科大讯飞、捷通华声之后,行业内又涌现出思必驰、云知声、出门问问、炬芯科技等后起之秀,在教育、客服、电信等传统行业之外,开辟出了车载、家居、医疗、智能硬件等语音技术应用新天地。与此同时,自然语言处理(NLP)作为人机交互技术的重要一环,也为此提供了助力。Siri的推出打开了语音交互的先河,不仅催生了一批语音语义创业公司,还激发了百度、搜狗等大型互联网公司在语音语义技术上的投入。
在AI快速发展的时代,语音识别技术已经陆续出现在生活日常电子产品中,如何智能芯片让机器听到且听准确人类的语言这将是一大难题。众所周知,生物识别靠人脸或指纹这类的技术都有稳定的特征,可是声纹就不稳定。一个浅显的比喻:人高兴的时候,第一天晚上唱了卡拉OK,第二天声音哑了,怎么能够在变化比较明显的生物特征上做识别是一个很大的挑战。语音识别整个过程包含语音信号处理、静音切除、声学特征提取、模式匹配等多个环节。由于语音信号的多样性和复杂性,系统只能在一定限制条件下才能获得满意效果。在真实使用场景中,考虑到远场、方言、噪音、断句等问题,准确率会大打折扣。目前业内普遍宣称的97%识别准确率,更多的是人工测评结果,只在安静室内的进场识别中才能实现。
行业专家表示:想要让语音识别更加准确,需要解决两方面的问题。一方面,在语音增强、麦克风阵列以及说话人分离等多项技术领域持续投入,并结合后端语义,促进对上下文的理解,从而提升识别效果;另一方面,需要从产品设计上进行优化,比如通过进一步交互,使语音识别变得更为准确。在端侧主控芯片上来讲,应该研发出更高端的主控芯片,在声音前处理方面有更加优秀的表现,让拾音的距离和效率都能大幅提升。国内AI芯片主力供应商炬芯科技作为领先的声音前处理技术代表,凭借其20余年对声音研究的经验,曾推出的智能音频和智能机器人芯片备受国内外知名品牌商的青睐,且一直坚持对声音领域的不断投入和研究,坚持通过技术更好地捕捉声音,降低干扰,让有效的声音信息传送至智能机器的“耳朵”。
ATS3605(D)就是炬芯近两年一直在主推的智能语音平台,此芯片的语音前处理算法非常强大,尤其在降噪方面有非常好的表现。ATS3605(D)在相关平台上整合了语音前处理算法、本地语音识别、唤醒、VAD等终端语音的核心算法,对接阿里/Baidu后台,支持LCD显示,支持摄像头,并提供完整的智能语音解决方案。目前应用到的领域包括智能儿童机器人,智能音箱,智能家居中控等产品上,行业口碑甚佳。
通过深耕垂直领域和细分赛道,实现自我造血和快速成长,任何一家公司有机会在这一新兴产业中逐渐做大。接下来,随着语音识别和NLP技术的逐步成熟,智能汽车、智能家居、智能机器人产业的日渐完善,定会有一批优秀的技术类公司在智能语音产业的浪潮中顺势而起。
相关知识
声音前处理专家炬芯用芯耕耘智能语音产品
炬芯运用声音前处理技术助力智能语音市场发展
炬芯科技推多模态智能交互芯片平台开启新的交互方式
炬芯:在智能语音领域深耕声音前处理技术
深思声音前处理技术:炬芯如何让机器人正常对话
炬芯2019香港电子展:领衔声音前处理技术
实现机器人之间对话?炬芯深耕声音前处理为你解析
群雄逐鹿,炬芯是如何在54亿颗蓝牙芯市场中开花结果
TWS耳机市场血拼将回归品质决定成败
CES Asia 2019 炬芯语音前处理技术迎来重大机遇