首页 / 市场 / 语音导航在数字对讲中应用解析

语音导航在数字对讲中应用解析

    一般的全数字可视对讲设备,如门口机、室内机,都会有液晶显示屏,分辨率达800×480像素,有的甚至更高,达到1024×600。彩色液晶显示屏显示操作信息非常方便。

    但是也有某些设备,如门口机为了适应北方寒冷的天气,不用TFT液晶显示屏,改用LED数码管显示。数码管只能显示数字和少部分字母,不能显示汉字;甚至象别墅门口机没有任何显示,连数字都不能显示,而全数字系统的设置比较复杂,需要给用户良好的操作体验,怎么办?我们想到了语音,用语音来导航用户操作。

    例如:OS-880D03款门口机,当在待机状态下,按“*”键,则语音提示:“一、请输入3位或者4位房号呼叫住户。二、呼叫管理中心请输入3个0,三.呼叫警卫员机,请输入3个9,四.音量调节:通话中按”4″键减小;”6″键增大;”*”键保存。五.通话中按”0″延长通话时间。六.公共密码开锁按9*,住户密码开锁按8*”。

那边如何实现语音导航呢?
    首先是语音文件的制作。语音文件的制作方法有两种,一是真人录音,一是用TTS(TextToSpeech)技术,将文本转为语音。真人录音的语感比较自然,但如果录音设备不好,背景杂音比较大,而且对播音员的素质要求比较高,普通话要字正腔圆。相比起来,用TTS技术则简单很多,只需输入文本,即可得到想要的语音文件。可以设定朗读者是男音还是女音,是青年人还是儿童,还可以选择粤语、四川话等地方方言。目前国内最好的TTS引擎是安徽科大讯飞的。

    语音文件的格式采用wav格式。WAV为微软公司(Microsoft)开发的一种声音文件格式,它符合RIFF文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持,该格式也支持MSADPCM,CCITTALAW等多种压缩运算法,支持多种音频数字,取样频率和声道,标准格式化的WAV文件和CD格式一样,也是44.1K的取样频率,16位量化数字,因此在声音文件质量和CD相差无几!

展开全文
安装智能头条APP 看数小智行业点评

为您推荐

返回顶部