思必驰CEO高始兴：芯片模组结合AIOS对话操作系统提升交互体验

2016年5月，大华股份旗下视联网品牌“乐橙”在杭州发布育儿机器人“小乐”。以“物联网+互联网”理念打造的智能母婴应用，从技术、内容和服务平台层面对育儿机器人产品进行定义。数智访谈对话小乐机器人语音技术服务商思必驰CEO高始兴，探讨面向智能母婴细分市场的创新技术应用与销售渠道构建。

本期对话嘉宾：思必驰信息科技有限公司 CEO 高始兴

数智网：针对于乐橙育儿机器人的儿童用户群定位，思必驰为其提供了怎样的针对性的语音交互解决方案?

高始兴：“小乐”的应用场景与很多智能硬件的应用场景有所不同。从应用场景来看，“小乐”机器人非常典型，它是家居环境中的服务型机器人，能够逗乐儿童、分享知识。家居环境存在很多特点，包括噪声环境、儿童发音不准、儿童不在机器人旁等情况；儿童声音的声学模型与成人不同，需要专门建模；存在回声对消问题，我们在与机器人对话的时候，往往‘小乐’机器人在播放音乐、唐诗宋词，需要去对消它的声音；声源定位，儿童说话位置可能在机器人的前边、左边、右边，甚至在后边，机器人需要准确判定说话人方位。围绕这些技术需求，思必驰为‘小乐’机器人做了相关的场景化定制。

数智网：围绕近年来备受关注的机器人家庭智能化应用，思必驰在语音交互解决方案方面有何独到之处?

高始兴：思必驰专注智能硬件领域，提供智能语音解决方案。目前思必驰主要提供两大产品方案，一是AIOS，就是智能对话操作系统，基于主流的操作系统，整合语音的相关技术、对话逻辑和后端服务。该方案在不同的领域有不同的服务，诸如车载、家、机器人等场景应用。另一方面是硬件模组、芯片模组。例如乐橙育儿机器人，我们采用了一个“环形6+1远场麦克风阵列”，该阵列能够有效地提升交互的效率和性能。在断网的情况下，该阵列可使用智能语音的本地功能，实现基本的交互操作。此外，通过芯片模组结合AIOS对话操作系统可大幅度提升交互效果，因为单纯的软件操作算法也需要强大硬件模组的支持。

数智网：您如何看待语音辨识技术在家庭机器人领域的应用前景？未来真正实现人工智能的深入落地，还需要走过哪些发展阶段?

高始兴：当前人工智能处于感知智能阶段，就是人机交互可以实现控制、简单查询。但是，随着人工智能或智能硬件、物联网的继续发展，服务多元化是必然方向。对于机器人而言，不仅仅是简单控制和查询，而是带来越来越多的服务，就如同我们的手机一样，功能越来越丰富。所以下一步，我认为对话非常重要，在一个垂直的领域，人和机器的对话就像人们的自然对话一样，允许打断，允许纠正，语义模糊时，机器人会去问，知道怎么问，知道问为什么，最终高效地帮用户完成任务。此外，多模态交互的结合会促进人工智能的发展，未来的人机交互在智能硬件、物联网端逐步会将多模态交互结合起来，交互体验也会越来越好，像乐橙的机器人，它既用到了图像识别也用到了语音识别。未来的智能设备可能还需要更多模态交互，采用多种人机交互技术，如语音识别、图像识别、人脸识别、虹膜识别等等。从感知智能到认知智能，需要智能语音交互技术及其它交互技术的发展支撑。

展开全文

安装智能头条APP 看数小智行业点评

为您推荐