中新网 | 七巧玲珑:思必驰DUI开放平台快速定制AI语音freestyle

  2017-09-29 11:22:44

【摘要】在AI时代,语音交互技术进入爆发式增长阶段,人工智能时代人机交互方式趋向多模态交互融合,语音、图像、手势正在成为AI人机交互主流方式。思必驰是国内知名的人工智能语音企业,近期针对个人/企业开发者,推出了DUI开发平台,全面拥抱对话智能,快速赋能智能硬件。
 
思必驰在对话工场云平台及AIOS对话操作系统的基础上,在经历了长达一年多的策划和模块化尝试之后, 2016年初,思必驰DUI平台项目正式启动,由VP赵恒艺全面负责,成立平台事业部,集结百余名优秀的研发人员进行了为期半年的封闭研发,DUI开放平台在2017年7月7日正式亮相首秀,开启系列内测沙龙,在深圳、北京、苏州等地举办开发者实战营活动。
 
8月19日,思必驰DUI开发者实战营苏州站开启,来自AI各领域的开发者、资深人士等齐聚独墅湖畔创意产业园,分享经验、实操体验,现场氛围十分火热。DUI开放平台现仍处于内测阶段,将于9月7日正式在京发布,全面开放。
 
 

图1 思必驰DUI开发者实战营(苏州站)现场
 
专注AI语音的持续创新力
 
近期,阿里智能音箱天猫精灵X1、小米AI音箱小爱同学、小米板牙智能后视镜、联想智能音箱、联想65i3智能电视等产品的发布,让思必驰语音受到了行业瞩目,这些产品均应用了思必驰语音交互技术,通过任务式对话,实现流畅的语音交互。思必驰领先的语音研发技术和转化应用能力受到了行业的认可。此前,思必驰首席科学家俞凯教授曾表示,思必驰是技术驱动型企业,拥有持续的大规模的创新型的技术研发能力作为支撑,这是思必驰的优势所在,将底层研究真正和产业问题深度绑定,会产生更大的价值。
 
现场,思必驰研发总监张顺对思必驰语音技术做了全面的阐述。
 


图2 思必驰研发总监张顺
 
张顺表示,思必驰在识别、远场、降噪、语义、合成、问答、对话等方面拥有核心技术优势,例如,通用模型识别率已达97%以上,其中VDCNN模型,在噪声环境语音识别的业界基准库Aurora4上,取得了7.09%的词错误率。相比于世界其他机构目前10%左右的最好结果,有一个大幅度的明显优势。远场交互技术突出表现在环形6麦阵列上,可实现5米远场交互,识别率达92%。实时交互无延迟、自定义唤醒、多场景覆盖等优势,让思必驰语音在车载、家居、机器人等智能硬件领域的市场占有率不断攀升。
 


图3 思必驰核心语音技术
 
伴随着语音应用的不断拓展,也暴露了一些应用的难点和挑战。张顺从感知智能、认知智能、工程开发三个角度出发,结合思必驰当前的业务布局与应用,分析了目前语音交互技术在实践中面临的挑战。张顺表示,这些问题可挑战是思必驰与客户共同打磨产品的过程中认识到的,思必驰将通过DUI平台开放核心技术,为厂商提供可超高度定制的语音技术,直面语音应用的挑战,快速赋能智能硬件。
 
DUI开放平台:自由定制,随心所欲
 
思必驰DUI开放平台是一站式对话定制开发平台,为物联网、移动互联网和互联网的开发者提供单项技术服务和完整的、超高度定制的智能对话交互解决方案。关注语音交互的每个环节,同步定制对话和语言模型,提供完全自主的一体化方案。
 


图4 思必驰产品经理张计锋
 
思必驰产品经理张计锋介绍到DUI是一个落地平台,旨在针对所有个人/企业级开发者在语音交互方面的痛点,快速实现语音技能的开发。开发者可基于产品用户定位和行业特性灵活配置技能,进行深度定制开发,从传统的有定制需求、找厂商、谈合作的长周期模式转向跨团队协作,实现所见即所得的开发过程,保存通过后配套即可实现测试。以语音交互为入口渗透AI生态,DUI技能商店是一个开放的生态。
 
现场,思必驰团队亲自示范如何创建技能,并邀请了现场20为开发者实战体验。
 


图5平台定制现场实操体验
 
在实战过程中,精巧、敏捷、轻量的玲珑系统作为终端接入解决方案,为DUI平台提供多种运行环境的支持,包括安卓、iOS等。技能开发,终端成果展示,可形成闭环,完整展示用户定制的成果。可视化数据系统则可采集和存储基础语音交互数据,进行分析和可视化处理,为DUI平台提供运营支撑和监控。此外,用户画像的参照维度,最终通过数据支撑决策,推进平台落地真正为用户服务。
 
此外,接口资源是DUI平台的重要部分,可为开发者提供接口资源信息查询和展示,以及快速查找,同时,为接口资源提供方、DUI平台、平台开发者以及终端用户四种角色,构建良性生态。
 
9月7日思必驰DUI平台发布会蓄势待发
 
据现场介绍,思必驰DUI开放平台将于9月7日在北京正式发布(详情请关注微信公众号“思必驰对话工场”),而此次苏州站实战营也是该平台正式发前的最后一期实战营。发布会上,思必驰将全面曝光DUI平台四大系统及最新战略合作动态,思必驰CEO高始兴、首席科学家俞凯,以及来自互联网巨头、知名AI企业、权威学会的领袖们将共同出席大会,探讨人工智能的未来。
 
语音为人机交互带来了全新的变革,思必驰DUI平台开放核心语音技术,全面拥抱AI,快速赋能智能硬件及传统行业,我们期待AI语音的飞跃发展,其应用与落地,必将谱写AI时代的全新的变革与进步。