华尔思AI语音算法全面升级，误唤醒率降低90%以上

2023年初，华尔思与思必驰深度合作，进行AI语音算法的深度定制与适配，历经近9个月的软硬件声学调整，华尔思全系列产品全面提升语控的算法能力，使得在现在公版的方案上，唤醒率从90%提升到98%，误唤醒率则降低了90%以上。唤醒词由原来的“你好小智”更改为“小智小智”。

众所周知，现在行业中几乎都是没有进行过声学适配的公版AI语音方案。高灵敏唤醒时，容易触发更多的误唤醒。用户在聊天或者看电视的时候，就常常遇到旁边的智能突然被唤醒，被“插话”，让用户不胜其烦。很多客户都是关闭语音，语音功能就变成了摆设。

此前，行业大部分产品能达到24小时的误唤醒率2-10次已经算是不错的水平。有些产品更是达到24小时数十次，甚至更高，华尔思产品经过思必驰最新的技术深度优化，定制与硬件匹配的声学模型，经1000h+实测，噪杂环境测试，每168小时误唤醒仅一次，在维持超高唤醒率的同时，误唤醒率相对降低90%以上。

华尔思产品搭载了思必驰双麦或四麦阵列前端信号处理算法，语音唤醒、语音合成、语音识别、智能降噪等语音语言新技术。定制了专属的声学模型，大大提升产品的AI语音能力，让语控更丝滑。

华尔思定制的AI语音声学模型基于思必驰人工智能技术，主要包括语音识别、语音合成和语音评测三个部分。

定制专属AI语音识别是将语音转换为文本的过程有更高的识别度，主要使用了专有声学模型、专有语言模型和搜索算法。首先，专有声学模型会将输入的语音信号映射到对应的音素上；然后，语言模型会利用文本上下文来找到最有可能的文本输出结果；最后，搜索算法会选择最优的文本结果输出。

定制的AI语音合成是将文本转换为语音的过程，主要采用了基于规则、基于统计和基于深度学习的方法。其中，基于深度学习的语音合成，可以通过对大量的真人语音数据进行训练，生成非常自然的语音。这种方法让整个语音的链路更加通顺。这样使得华尔思产品，语音识别度更高，语音唤醒率更高，语音误唤醒率更低，大大提升AI语音识别的体验感。
图片

展开全文

安装智能头条APP 看数小智行业点评

为您推荐