2016年12月8日,第九届TC汽车互联网大会进入第二天,精彩继续!以下为思必驰信息科技有限公司副总裁雷雄国主旨演讲。

思必驰雷雄国:语音作为车联网交互前装更具稳定性-第1张图片-零帕网

雷雄国:感谢建宇。

从昨天到今天听了非常多的嘉宾的演讲,有来自车厂的,Tier1的。未来车厂怎么跟互联网结合的商业模式。未来我们的车怎么去运用。

思必驰是做人工智能的一家企业,基于人工智能这个方面我们也从我们的角度跟大家一块儿分享一下我们对于互联网汽车以及车联网这一块儿的想法,以及我们做的一些工作。

说到语音交互大家可能会比较熟悉,在车载这一端的语音交互有两种大的形体,第一种像苹果跟Google,更多的是在移动互联网的时代怎么跟车去获取更多的互联网服务,这种形态在昨天博世的演讲中也有提到,这种形态更多地是站用了手机的信道,我相信未来车一定是一个独立,能够连接一切的设备,或者是一个独立的终端。

对于这种趋势下,未来的语音交互一定是脱离手机的,这就是在云端也开始做基于语音的人机交互。在这上面除了传统,大家都比较熟悉的Nuance为科大讯飞,思必驰是作为创业型的公司,在车载这个领域也耕耘了好几南时间,但是怎么样去把语音交互这件事情做好一直是我们在思考的问题,包括怎么样去切入。

我们最开始做的时候我们也跟车厂、Tier1公司沟通过,最初我们发现思必驰开始的时候不适合做前装,第一创业团队,第二前装的周期,第三体验性的东西,敏捷开发。怎么把互联网的快速推进的改善体验的思路真正落实到快速的产品迭代里面去,所以我们也选了自己的道路,我们希望能够从后装的角度逐渐把用户的交互体验做好,逐步地切入前端的设备

从我们后端目前接近200万的用户数据来看,用户在语音交互的时候用的什么功能会比较多呢?一类是服务,这一类的服务我想大家会比较感兴趣的一个是导航,另外一个音乐跟电台,这个比例非常高,下面我回把我们后台的数据跟大家做分享。

慢慢随着车联网服务的不断兴起,包括车联网各种各样的创业团队以及我们大的方案公司的推进,所以我们未来在LBS上面,在一些车载行业的O2O的服务上面,包括昨天斑马提到的我们未来自驾游一些非常有趣的视频或者是图片分享,这些交互在未来会是大的趋势。

另外就是对车本身或者设备的控制,这些控制能在整个使用的体验上给用户极大的体验的。提升第三个就是在整个语音交互的这一端,最终应用的终端形态是多种多样的,在后装用的比较多的是后视镜,前端更多地是在车基。还有新型的设备在整个的体验上会比较好。

这个是针对我们后装数据的分析,这个非常有意思,我前两年在做移动互联网报告分享的时候发现我们手机端的用户95%以上在闲聊,在调戏。但今天在车载的领域我们发现75%以上在干正事儿,语音交互解决了用户的痛点需求,在这些场景上面能够帮助用户完成他的任务,所以这里面75%以上的对话的任务,比如说我们要做一个导航,从你最开始打开导航到最终选择路径以及在导航的过程中可能需要去更些设置,这些在语音操作的过程当中已经运用的非常频繁,包括电台、音乐。我们在开车的过程中,怎么样才能够找到我们自己喜爱的电台,喜爱的音乐?这些事情对于用户来说一直是没有解决的问题,所以在这些过程当中很多用户的交互能够反映出实际的用户终端的核心诉求。

第二大类就是一些答案非常固定的问答式的对话,这些就是查一些天气或者是股票的信息,占的比例不大。10%是闲聊,这个跟我们以前的产品形态使用的比例是完全倒过来的。

现在从我们接触的一些客户或者是我们的合作伙伴的反馈渠道来看语音识别的现状,可能大家都会觉得语音是作为未来人工智能非常大的应用,快速落地的点,也是未来所谓的IOT或者是物联网的新的入口,这个都没错,特别大的概念。但是落实到真正要去做这件事情的时候,语音识别还是有非常多的问题,特别是在车载这个环境下要深入地解决这个问题,第一个问题就是我们现在很多的,特别是前装的一些车的语音交互不能够纠正,不能够纠正的核心问题在哪儿呢?就是识别率再高也没有用,我们前两年出了一个视频应该是黑安吉星,纠正哥的视频,识别率在很高的情况下同样会闹非常大的笑话,这个怎么解决呢?就通过机器,我可以随时打断你,我可以指正你在什么地方说错了,这是目前在语音交互里存在的最大的问题,同时针对这一端我们有一个非常核心的问题要去解决,要实现这种纠正,要实现这种打断需要在硬件上,包括回音消除上做比较大量的技术的攻关,我们也是纯软件的整体解决方案。这样我们能够做到比较高性价比的方式来解决这个问题。

第二个反馈比多的问题是什么呢?不聪明,或者是比较死板比较机械,这里面包含两层意思,第一次是用户在说的时候必须按照机器制定的指令来做一些东西,实际上人跟人交互是非常随意的,怎么样做这种非常随意的?这里面不仅仅是语音识别,还是容易理解,包括我们在2年前把语音理解这一部分在后装市场做的非常好的体验。在车载的场景下能够解析到意图之后自动地搜索周边的餐馆,包括汽车没油了,说出的是用户的痛点需求,并不一定按照机器说。

第三就是操作非常复杂。我们知道前期设备在翻控上会有麦克风的物理按键,但是大部分是在屏幕的上方有一个虚拟的按键,这在操作过程中是非常不方便。另外就是我们整个车载在推进的过程当中有很多APP,比如说高德地图,内置了APP,但是我们上升到交互的层面来看,语音交互一定是在系统层面去做的事情,所以整个的体验在内置这一层会比较受限。

另外,我们现在也在后装市场推出了比较大的体验的改进,你可以把语音识别内容一起说,你想说什么直接说完就有非常好的反馈。

刚才聊的比较多的是语音在交互这一端的问题,其实我们在做整个业务的过程中有一些跟合作伙伴深入的交流,我们发现在前装跟后装对于语音交互这一端的诉求不太一样。

我们先说说后装,后装这一端我们接触的更多一些,举个最简单的例子,现在很多的东西可以通过设备或者是通过渠道的方式,能够在渠道出货的时候,你的语音交互功能能够推动整个设备的出货量,这是一件非常非常有意思的事情,消费者会愿意去因为语音交互的功能买后视镜或者是买车基,或者买HUD,在之前是不太可能出现的,所以后装的客户会对交互的体验要求比较高。

前装也有接触一些合作伙伴,昨天结束之后我们打了一个车,这个车的师傅就问我们今天我们主会场是不是有荣威的互联网汽车,他不懂互联网汽车,但是他特别喜欢这个车的外观,同时他会比较关注车型的具体参数以及舒适度,包括能耗这些东西会去主导他选汽车的车型。

所以在前装更多还是通过汽车本身的传统方式。语音作为一个交互方式是后续的语音交互的提升,所以从这两端的需求来看,我们能够看到前装可能更关注稳定性,更关注与刚需这一端。

在后装渠道有非常多的合作伙伴会比较强调一些我要有比较好玩功能点,或者比较新鲜的概念去推动产品销售,这一些并不一定是消费者所需求的核心痛点,这一类还不是我们认为的提升干虚以及提升体验的地方,真正需要把前装和后装优势的需求以及对于关注的重点结合在一块儿。

第一,稳定。稳定压倒一切,在车上语音交互解决最大的核心痛点就是安全,如果语音交互不稳定的话安全会受到威胁。

第二个就是刚需,这样的产品才会得到用户的使用,才会经常去用。

第三,适当地增加乐趣,这个可能会对消费者有受欢迎的因素。

这就是我们思必驰在做VUI所追寻的三个准则。

在整个产品这一端有需要用到非常多的技术,详细的东西我就不一一说了,在这一端主要是核心强调的我们把语音识别的技术通过云加的方式能够在网络不好的时候达到策略。

通过软降噪的方式把影响降到最低。我们在国际的比赛当中最难的数据库也取乐了在国际上第一的水平,错误率是在7.1%的。

另外一个是语意理解的准确率,能够让人感受的比较直接的感受是语意理解的感受力提升,每个人在表达同一个意思的时候你的需求都会得到比较大的满足,这个会对体验得到非常大的提升。

除了技术之外我们可能还需要对接第三方的合作,这些包括图三,需要从技术层面、交互层面做比较深度的吻合,另外就是音乐和电台,第三就是社交,思必驰是国内第一家提出来把车载做比较深的融合,所以现在在车上面使用微信还是能够解决很多的安全问题。

我们简单介绍一下思必驰在市场上的一些合作伙伴我们现在重点在后装这一端,300多家合作客户大概有90%以上是前装客户,我们也在完善体验上的东西。

思必驰是我们现在在人工智能的领域生根智能硬件领域的公司,其他领域都不做,在这个领域上面我们选择了智能车载、家居、机器人三个子方向,提供AIOS的语音操作系统,提供AICHIP的语音芯片,我们把第三方的对接、内容服务都整合在AIOS的系统里面去这样对我们的合作伙伴来说对接会十分方便。

最后麻烦工作人员帮我们放一下视频,谢谢!非常感谢大家,希望未来思必驰能够服务大家,谢谢!