从实际体验看,因为有人工智能的算法支持,智能音箱对语言的理解让人惊讶,无论是问“今天热吗?”“今天会下雨吗?”还是“今天气温是多少摄氏度”,市场上的主流智能音箱均能理解这是在询问天气,并可根据不同的问法来优化答案。阿里人工智能实验室负责人陈丽娟表示,中文语音交互难点在于中文的语义理解,人工智能的算法支持让中文语义理解引擎能够对常用的定时、提醒、天气、购物等语言内容优化。“天猫精灵仅在天气预报上就能够理解786种中文问法。此外,对北方语言的儿化音,小朋友的叠字,包括吞字、缺字、口头禅,这些都可以通过深度机器学习来优化。”
“够聪明”的智能音箱还具有一些意料之外的功能。比如,天猫精灵可以直接与用户的支付宝账户打通,利用声纹识别为手机充值,并可以通过拨打电话帮助寻找用户的手机,问问音箱则在多轮交互上表现良好,比如同样是问天气,就可以直接问“北京天气如何?”“那石家庄呢?”“那后天呢?”它都知道你在询问天气。
此外,考虑到用语音控制且门槛低的特性,智能音箱还把不识字不会操作智能手机的儿童也视为其目标用户。讲故事、唱儿歌、说笑话……大部分智能音箱具备了种种与儿童互动的功能。小米AI音箱甚至专门设计了一个“听听它们怎么叫”的功能,当你询问“大象怎么叫”,它就会播放出大象的叫声。
语音交互“演兵场”
智能音箱能够实现的功能颇为丰富,但做一款畅销的产品,并非巨头们集体入局这个市场的最主要原因。“互联网或语音技术公司醉翁之意不在酒,他们的算盘是用智能音箱来推广自己的语音交互技术。”人工智能服务商思必驰首席市场官龙梦竹说。
的确,如果说智能手机的触摸屏改变了人与智能设备的交互方式,那么语音交互则被认为是下一代人机交互方式,智能音箱就是语音交互的第一个入口级产品。出门问问创始人李志飞表示:“人工智能和语音交互是灵魂,但需要为灵魂找个载体,尽管这个载体不见得就是音箱,但智能音箱相较之下最容易推广。”
智能音箱其实是科技巨头们语音交互技术的“演兵场”,如果有一天人们抛弃了手机换了新的智能设备,语音交互技术将更有用武之地。也正因如此,包括科大讯飞、图灵机器人、思必驰等语音识别领域的人工智能技术头部企业也纷纷参与到这股热潮中,比如联想智能音箱的语音技术来自图灵机器人,天猫精灵的语音技术来自思必驰。