声姿 | 天猫精灵X1携手思必驰,阿里入局智能音箱

  2017-08-11 13:46:41
7 月 5 日,在位于北京鼓楼的时间博物馆,阿里巴巴 Ai Labs 举办「未来,开口即来」新品发布会,宣布推出该部门第一款自主开发的智能音箱「天猫精灵 X1」,其售价仅为 499 元,其语音交互技术综合采用了来自思必驰的语音识别、语音合成、算法降噪、环麦阵列,以及阿里 AliGenie的NLP和声纹识别等。它能够理解中文语音指令,通过语音交互实现购物、播放音乐音频内容、玩游戏、查天气、问百科、充话费、控制天猫魔盒等功能,短期内仅面向中国市场发售。
 

图1
 
阿里巴巴人工智能实验室负责人浅雪,特别谈到了开发音箱的产品设计理念:「在家庭环境下使用的一款产品,不应该是外观很大、只有大声音的智能设备,这是我们对这款产品的第一个思考,另一方面,语音交互这种方式将无所不在,做得越来越小,才是语音交互助手终极追求方向」。
 

图2
 
在语音交互前端技术方面,“天猫精灵 X1”采用了思必驰环形六麦阵列技术(AISpeech 6mic)。在顶部的六颗高灵敏麦克风有助于收集来自不同方向的声音,从而更容易在周围的噪音中识别出有用的信息,实现360°全角度拾音效果和5米远场交互。思必驰作为项目合作方,在这款音箱中提供了环形六麦阵列、语音识别、语音合成、回声消噪及语音增强等技术方案。该款产品的NLP、声纹识别等技术则来自 AliGenie,它集成了阿里巴巴积累多年的自然语言处理、人机交互等技术。
 
环形麦克风阵列近期得到了较多的关注,在智能音箱类家居产品中,环麦成为宠儿,一是由于它能够满足家居环境下远场交互的需求,二是由于它能够帮助智能音箱、智能中控、机器人等需要全角度拾音的智能硬件产品实现更好的收音效果。思必驰2015年即推出了国内首款环形6+1麦克风阵列,现已全面升级至环形6麦,算法更优化且成本更低,目前在智能机器人和智能音箱领域有较为广泛的应用。
 

图3
 
在外形设计上,天猫精灵X1采用了常见的圆柱形设计,有黑白两种配色,高度为128mm,直径为82mm,体积小巧。在硬件配置上,天猫精灵 X1采用了业内首颗 SmartAudio专业处理芯片,相比此前市面上的主流芯片,处理效率提升25%,功耗降低32%。系统软件方面,采用了一键声波配网技术,这让天猫精灵 X1 不到 10 秒就能连上网络。而配网对智能家居来说,非常有挑战性,目前大部分产品配网时间平均大于 30 秒。
 

图4


图5
 
从产品功能方面,天猫精灵X1内置阿里第一代中文人机交流系统AliGenie,相当于一个“你的小秘书”,支持效率工具、订日程、备忘提醒;音频音乐播放;购物助手支持话费充值、订外卖;日常生活用品购买;健身教练支持倒计时、卡路里查询等。在发布会的第二现场,王自如和该智能音箱设备进行了“一个苹果的热量是多少”、为手机充值、购买可口可乐等对话及功能演示。其背后拥有阿里体系庞大的内容资源,可为用户提供丰富多样的服务。
 

图6