DUI | 思必驰DUI正式发布,赋能智能终端开启对话时代

  2017-10-09 23:41:54

大音希声,AI IS DUI,  2017思必驰DUI开放平台发布会于9月7日在北京歌华开元大酒店举行,近千余名开发者和行业资深人士、权威媒体莅临现场,思必驰CEO高始兴、首席科学家俞凯、VP赵恒艺、VP初敏在发布会上做了重要发言,翘首以盼的DUI平台终于正式发布。发布会现场,还隆重邀请到联想、富士康、大华股份、海知智能、声智科技、助理来也等嘉宾参与,共同勾勒出一幅完整的AI生态画卷。
 

图1
 
思必驰,在多年智能语音技术基础上,以Dialogue为核心,结合GUI和VUI,自主研发了一站式对话定制平台——DUI,为开发者提供超高度定制的人机对话解决方案,为传统厂商实现智能升级,为创新企业提供核心交互能力。此前DUI平台开启了为期两个月的小型开发者内测沙龙。9月7日下午18:00,思必驰 DUI开放平台开放注册正式开启。
 

图2
 
DUI全链路智能对话开放平台,助力企业和开发者的AI升级
 
思必驰DUI平台由VP赵恒艺牵头,集合100多名铁军队伍,历时近一年倾情打造。DUI致力构建车内、家中、用电脑、玩手机等智能产品、技能的运用场景,支持自由调用图文、列表、音乐、内嵌网页等进行多模态交互,提供从唤醒、识别、语义理解到对话管理和输出、TTS的全环节技术的超高度定制;实现用户无感知的秒级在线热更新,可视化大数据和运维中心能够帮助产品快速决策、优化体验。
 
在物联网大市场环境下,用户的需求很急迫,而AI行业里的所有企业,都面临着同一个老大难问题:快者为王的时代,如何抓住用户痛点,快速推出个性化且实用的产品体验,占领先机。在过去,大部分的智能人机交互方案都采用固定方案,或者按需定制。固定方案的体验千篇一律,而定制效率又无法满足产品迭代的速度需求。语音交互的链条很长,从拾音、识别、理解、反馈、合成等一环扣一环,常常改动一个细节则会牵引整体优化,从而投入大量的时间、精力、财力。赵恒艺总结,从技术输出到产品输出的落地,从标准化体验到细作的精品的升级,在这个过程里,技术提供商的实际定制效率与B端客户对产品个性化和版本迭代的需求,两者无法达到平衡统一,这是当前行业的主要矛盾。
 

图3
 
基于此,DUI给出的答案是:定制规模化
 

图4
 
DUI开放了所有的技术定制空间,支持从唤醒、语音识别、语义解析、对话管理等一系列模块的定制,支持跨领域、跨技能的对话交互,对内部技能和外部技能都提供同等的支持。人机对话的目的是最终的任务导向。技能定制是DUI的核心环节。目前,DUI已经与众多第三方内容确定了战略合作,从服务端保证个性化需求和最终结果输出。
 
DUI在通用的语音识别模型至上,把所有的技能都独立训练成不同的个性化语言模型。任何人都可以在DUI平台上去定制开发属于自己的技能体验,也可以按需调用DUI技能商店里的其他开放技能。这个语言模型训练的时间很短,云端发布后马上就可以使用,大概几分钟就能完成产品的体验升级。
 

图5
 
发布会现场,赵恒艺还介绍了DUI独有的创新四大系统:玲珑、天机、青囊、紫微,四大系统的高效协作,能够保障DUI开发者在平台的持续有效使用。
 
玲珑系统:一颗百样七巧心。

定制的对话系统最终要落地到硬件终端,包括手机APP、电视、音箱、微信、网页等。玲珑系统就是去做跨平台的转接。得益于玲珑系统,目前DUI支持Android、Linux、iOS、RTOS一系列的系统,提供云+端技能的混合定制,保证离线环境下的基本功能使用,而在线更新也能够做到秒级热更新,不用重新下载也无需系统更新,DUI平台上的一次click即可完成所有流程。
 
紫微系统:神谋与妙算兼得。

DUI是以对话交互为核心的平台,而对话的最终目的在于让机器明白任务意图,因此需要大量的第三方内容和服务最为后端支撑,才能满足用户的个性化需求。这里的内容和服务,包括音乐、天气、股票、旅游、O2O、导航等第三方资源。紫微系统则是负责对这些内容进行对接,以及接口标准化的封装,并兼容AVS服务,让开发者能够方便地完成调用和配置。
 
青囊系统:运筹帷幄胜千里。

这是负责DUI服务力和研发支撑的子系统。青囊负责记录和跟踪开发者反馈的问题、后台的bug修复和更新、以及跟踪开发者的使用情况(产品和技能),并随时系统内保持优化,极大地缩短了从发现问题到解决上线的闭环联调,便于平台整个研发体系和流程的打通和管理,保证DUI的良性发展。
 
天机系统:给你大数据的爱。

天机是DUI平台的洞察力系统,提供可视化大数据,实现用户画像和智能化推荐,同时给开发者一个详尽的、可按需定制的用户任务结果数据(识别错误/解析错误),并给予现场还原和解决办法建议。
 

图6
 
此外,DUI平台产品经理孙志伟在发布会上,现场演示了技能的创建和应用效果,流畅的体验引发场内轰动。数据显示,发布会当天,平台注册用户激增数百名。
 

图7
 
战略定位升级、技术引领创新,DUI打造流通生长的对话智能 
 
思必驰于四年前2013年9月7日,在北京发布了国内第一个口语对话平台:思必驰对话工场。而那时候整个移动互联网生态刚刚起步,对话工场对于大部分移动开发者来说,还是太超前。2015年,思必驰推出AIOS并扶持了软硬一体化的产品——车萝卜HUD,开始进行物联网场景化探索。物联网和人工智能这两年进入飞速发展时期,人机交互成了切实的刚需技术。2016年年初思必驰立项,开始面向物联网的对话系统探索,2016年年底正式立项DUI平台。
 

图8
 
在发布会现场,思必驰CEO高始兴从行业发展、战略合作、资本等角度,与现场参会者分享了思必驰的发展和未来的AI生态战略。
 

图9
 
他表示,2014年思必驰转型后开始专注物联网生态,有赖于众多客户、合作伙伴的信任,赋能了无数智能终端。技术性创业一定是一个厚积薄发的过程。思必驰希望打造极致的用户体验,从单个场景化的交互体验出发,逐步延伸至越来越多的场景和行业。目前思必驰在车联网的后装市场已经达到了60%的市场占有量;今年最火的智能音箱领域,思必驰已赋能阿里天猫精灵、小米互联网音箱和小爱同学、联想智能音箱等众多知名公司产品;在最近逐渐风起的故事机/机器人领域,思必驰目前已拿下众多一流代表客户,包括大华股份、火火兔等,争取年底实现智能玩具市场AI赋能第一。
 

图10
 
目前,整个物联网大市场,呈现以“融合、创新、重构”为特点的发展趋势。物联网去中心化是大趋势,但以用户为核心、以端为载体、场景化融合会加速。围绕用户的场景与行业融合带来的场景服务、场景数据、场景闭环等会带来诸多机会;物联网下新交互、新用户、新数据、新场景的产生,催生更多的产品创新、技术创新和应用创新;行业的边界会模糊甚至被打破,得以重构很多新的商业机会。基于此,未来的人工智能有很多的挑战也有很多的机遇,对思必驰而言,当前最重要的则是做好自身的定位,战略的配合和执行的落地。
 
此外,为了坚实DUI的基础,扩展未来的生态版图,思必驰已经完成了很多战略升级,包括:
 
1. 在元禾资本、富士康、清华控股等LP的支持下,2016年成立了驰星创投,专注人工智能交互产业的早期项目投资。截止目前,已成功投资或孵化七家企业:车萝卜、慧声、先声教育、AITEK、SIGMOID、爱医声、RT-Thread。

2. 2017年8月,初敏博士加入思必驰,组建从基础研究到应用落地的北京研发院,负责对话技术的研究和工程化工作。

3. 在苏州市政府和工业园区的支持下,思必驰联合上海交通大学成立苏州人工智能研究院,促进产业化升级和创新。
 

图11
 
发布会现场,思必驰首席科学家俞凯从前沿技术角度剖析了DUI的技术核心理念:能流通、能生长的对话智能。
 

图12
 
智能语音对话式人机交互,这是一个不可逆的时代变革趋势,从亚马逊、微软、谷歌、苹果,都在不断去适应这个趋势。思必驰是引领中国对话智能发展的领军企业之一,自2013年起,在产业最早系统性提出,并一以贯之的专注推进对话智能的概念、技术发展及应用。不管是技术上还是体验上都有很多比肩国际的可圈可点之处。在抗噪语音识别领域,VDCNN算法模型在Aurora4测试集合上,思必驰取得了7.09%的单系统国际最低词错误率,相比于之前的世界最好结果有大幅明显提升; PSD快速解码使识别搜索速度提升了5到7倍,结合新的建模单元调整,综合的解码搜索速度提升达到了20倍。在语义理解方面,采用双向LSTM神经网络,加上聚焦机制,也取得了标准测试集当中最高的精度。在对话、状态、跟踪当中,采用循环多项式网络(RPN)技术,在领域迁移的任务中也取得国际领先的性能。这些技术进步会随着DUI发展而逐渐被用户所感知。
 
相较于其他类似平台,DUI的特色是高水平的个性化体验。从技术角度,支撑其领先的技术优势在于:大规模定制化的对话智能和源源不断输入的创新前沿技术,即流通、生长的对话智能。好用实用的技术不应该只是一个静态的显现,而是可以面向不同环境、特定场景、定制领域而有量体裁衣般的舒适之感。DUI正在持续进行基础技术创新,把诸如语义迁移学习、深度强化学习、自适应技术等都运用起来,保证DUI平台未来的“流通与生长。
 

图13
 
All In 物联网,思必驰DUI让万物言语,多方共赢
 
在9月7日发布会现场,思必驰还邀请到联想集团智能设备研发高级总监张德魁、富士康B次集团软件技术总监向能德、硬件技术总监谢亮,大华股份副总裁梁磊,作为合作客户代表,分享了思必驰的合作和未来计划。
 

图14
 
联想与思必驰一直保持深入的合作关系,从电视、音箱到PC、平板均采用了思必驰语音技术。张德魁表示,未来联想将与思必驰基于DUI进行深度合作并构建联合运营关系,打造更加个性的,整合性强的,服务于联想更多设备的语音平台。富士康则寄语DUI以“软硬结合的开放式合作”引领智能体验,帮助更多的传统互联网和电子产业完成升级改造。大华梁磊则表示,思必驰为大华数款智能家居设备提供技术支持,未来希望能够携手拓宽领域,在金融、安防等方面进行更多合作。
 






图15、16、17
 
另外值得一提的亮点是,9月7日DUI发布会也是初敏博士加入思必驰后的首次公开亮相,在题为“竞合发展,生态未来”的圆桌论坛上,与CSDN董事长蒋涛、助理来也CEO汪冠春、海知智能CEO 谢殿侠、 声智科技CEO 陈孝良等业内知名人士,共同探讨人工智能语音交互的未来发展。
 

图18
 
近两年,国内大概出现了将近70家语音语义类的创业公司,其中不乏有单点领域突出者,比如专注知识图谱和技能交互的海知智能、主打声学智能和远场交互的声智科技,主打垂直领域个人助理服务的助理来也,希望能够突破领域、提升体验。而对思必驰而言,在现在乃至未来很长的时间里,人工智能语音交互是没有办法做到开放通用的,要解决不同场景不同用户的需求,靠一己之力也是比较艰难的事情。
 
初敏老师表示,语音交互目前是一个封闭生态,而一人之力难成大事,对一家单打独斗的企业也是一样。行业起步,场景逐渐放开,个性化需求呈现指数级增长,要想打破瓶颈和天花板,势必要开放,要合作,要互助互益。开放的生态也有难度,在于标准和规范。而标准和规范,也并非一家之言,需要集合行业的力量,结合产品和用户需求而定。这也是未来大家需要一起去讨论的方向。
 
人工智能可见的未来,是基于整个人类社会,包括用户、场景、端、行业的爆发性增长。市场初建,在当前阶段,开放生态显然更具价值。思必驰DUI所打造的是一个开放的、第三方的技术支持平台,并非OS闭环,而是支持很多个不同OS的生态平台,既支持应用型AI企业,也支持技术型AI企业。良性有序的市场竞争格局,有利于行业的长远发展,我们所希望做的,是携手最广阔的合作伙伴共同快速发展、共享机遇红利。
 
思必驰DUI全链路智能对话定制平台,已于2017年9月7日下午18:00正式开启对外注册。
 

图19