首页 / 观点 / 思必驰CEO高始兴:芯片模组结合AIOS对话操作系统提升交互体验

思必驰CEO高始兴:芯片模组结合AIOS对话操作系统提升交互体验

2016年5月,大华股份旗下视联网品牌“乐橙”在杭州发布育儿机器人“小乐”。以“物联网+互联网”理念打造的智能母婴应用,从技术、内容和服务平台层面对育儿机器人产品进行定义。数智访谈对话小乐机器人语音技术服务商思必驰CEO高始兴探讨面向智能母婴细分市场的创新技术应用与销售渠道构建。

11

本期对话嘉宾:思必驰信息科技有限公司 CEO 高始兴 

5

数智网:针对于乐橙育儿机器人的儿童用户群定位,思必驰为其提供了怎样的针对性的语音交互解决方案?

高始兴 :“小乐”的应用场景与很多智能硬件的应用场景有所不同。从应用场景来看,“小乐”机器人非常典型,它是家居环境中的服务型机器人,能够逗乐儿童、分享知识。家居环境存在很多特点,包括噪声环境、儿童发音不准、儿童不在机器人旁等情况;儿童声音的声学模型与成人不同,需要专门建模;存在回声对消问题,我们在与机器人对话的时候,往往‘小乐’机器人在播放音乐、唐诗宋词,需要去对消它的声音;声源定位,儿童说话位置可能在机器人的前边、左边、右边,甚至在后边,机器人需要准确判定说话人方位。围绕这些技术需求,思必驰为‘小乐’机器人做了相关的场景化定制。

数智网:围绕近年来备受关注的机器人家庭智能化应用,思必驰在语音交互解决方案方面有何独到之处?

高始兴 :思必驰专注智能硬件领域,提供智能语音解决方案。目前思必驰主要提供两大产品方案,一是AIOS,就是智能对话操作系统,基于主流的操作系统,整合语音的相关技术、对话逻辑和后端服务。该方案在不同的领域有不同的服务,诸如车载、家、机器人等场景应用。另一方面是硬件模组、芯片模组。例如乐橙育儿机器人,我们采用了一个“环形6+1远场麦克风阵列”,该阵列能够有效地提升交互的效率和性能。在断网的情况下,该阵列可使用智能语音的本地功能,实现基本的交互操作。此外,通过芯片模组结合AIOS对话操作系统可大幅度提升交互效果,因为单纯的软件操作算法也需要强大硬件模组的支持。

数智网:您如何看待语音辨识技术在家庭机器人领域的应用前景?未来真正实现人工智能的深入落地,还需要走过哪些发展阶段?

高始兴 :当前人工智能处于感知智能阶段,就是人机交互可以实现控制、简单查询。但是,随着人工智能或智能硬件、物联网的继续发展,服务多元化是必然方向。对于机器人而言,不仅仅是简单控制和查询,而是带来越来越多的服务,就如同我们的手机一样,功能越来越丰富。所以下一步,我认为对话非常重要,在一个垂直的领域,人和机器的对话就像人们的自然对话一样,允许打断,允许纠正,语义模糊时,机器人会去问,知道怎么问,知道问为什么,最终高效地帮用户完成任务。此外,多模态交互的结合会促进人工智能的发展,未来的人机交互在智能硬件、物联网端逐步会将多模态交互结合起来,交互体验也会越来越好,像乐橙的机器人,它既用到了图像识别也用到了语音识别。未来的智能设备可能还需要更多模态交互,采用多种人机交互技术,如语音识别、图像识别、人脸识别、虹膜识别等等。从感知智能到认知智能,需要智能语音交互技术及其它交互技术的发展支撑。

展开全文
安装智能头条APP 看数小智行业点评

为您推荐

返回顶部