首页 / 市场 / 华尔思AI语音算法全面升级,误唤醒率降低90%以上

华尔思AI语音算法全面升级,误唤醒率降低90%以上

2023年初,华尔思与思必驰深度合作,进行AI语音算法的深度定制与适配,历经近9个月的软硬件声学调整,华尔思全系列产品全面提升语控的算法能力,使得在现在公版的方案上,唤醒率从90%提升到98%,误唤醒率则降低了90%以上。唤醒词由原来的“你好小智”更改为“小智小智”。

众所周知,现在行业中几乎都是没有进行过声学适配的公版AI语音方案。高灵敏唤醒时,容易触发更多的误唤醒。用户在聊天或者看电视的时候,就常常遇到旁边的智能突然被唤醒,被“插话”,让用户不胜其烦。很多客户都是关闭语音,语音功能就变成了摆设。

此前,行业大部分产品能达到24小时的误唤醒率2-10次已经算是不错的水平。有些产品更是达到24小时数十次,甚至更高,华尔思产品经过思必驰最新的技术深度优化,定制与硬件匹配的声学模型, 经1000h+实测,噪杂环境测试,每168小时误唤醒仅一次,在维持超高唤醒率的同时,误唤醒率相对降低90%以上。

华尔思产品搭载了思必驰双麦或四麦阵列前端信号处理算法,语音唤醒、语音合成、语音识别、智能降噪等语音语言新技术。定制了专属的声学模型,大大提升产品的AI语音能力,让语控更丝滑。

华尔思定制的AI语音声学模型基于思必驰人工智能技术,主要包括语音识别、语音合成和语音评测三个部分。

定制专属AI语音识别是将语音转换为文本的过程有更高的识别度,主要使用了专有声学模型、专有语言模型和搜索算法。首先,专有声学模型会将输入的语音信号映射到对应的音素上;然后,语言模型会利用文本上下文来找到最有可能的文本输出结果;最后,搜索算法会选择最优的文本结果输出。

定制的AI语音合成是将文本转换为语音的过程,主要采用了基于规则、基于统计和基于深度学习的方法。其中,基于深度学习的语音合成,可以通过对大量的真人语音数据进行训练,生成非常自然的语音。这种方法让整个语音的链路更加通顺。这样使得华尔思产品,语音识别度更高,语音唤醒率更高,语音误唤醒率更低,大大提升AI语音识别的体验感。
图片

展开全文
安装智能头条APP 看数小智行业点评

为您推荐

返回顶部