2024年11月22日 星期五

车载智能语音 好多人都做错了

发布时间:2015-05-26 11:22:49  来源:车音网  作者:佚名  责任编辑:王庭

  从点击到触屏,再到语音,技术的升级也见证了人机交互从一个时代走向另一个时代。随着人们需求和认知得到提升,越来越多的人认定,语音是未来智能化的方向,一大批企业也杀入了这一领域。但在鏖战之余,一个问题也浮现出来——我们应该做什么样的语音产品,该如何满足消费者的需求?在5月21日举行的“盖世微课堂——智能语音产品在汽车上的应用与发展趋势”活动上,车音网联席CEO王力劭与苏雨农,就向300余名业内人士分享了车音网对智能语音未来发展的看法。

  有取有舍 好用才是王道  提到车载智能语音产品,人们头脑中的第一印象一定是“高科技”。不过就像大多数学者对“技术决定论”的批判一样,智能语音的高大上,并不意味着它能独立于人的意志而存在。

  “语音技术出身的科学家及车载产品经理,可能会陷入技术化的思维”,车音网联席CEO王力劭坦言。正如他所说,语音技术的应用会面对类似感性思维和理性思维的困扰——到底是根据“我有什么然后做什么”的思维,还是用户的需求来做产品。在这一点上,车音网的看法很明确,智能语音产品真正要解决的痛点并非技术本身,而是对需求的把握。用户所要的,并非技术多么高级,而是这个技术能否按照要求去完成任务。

  在目前的车载语音产品开发中,语音的“识别率”往往被放在了核心位置上。但在车音网看来,服务的“达成率”才是真正的硬指标。而车载智能语音产品要真正做到人性化,需要聚焦的一个重点问题就是应用场景。在适合的场景下,语音才能发挥它最大的效用。车音网联席CEO苏雨农谈道:“语音并非万能,作为便捷的工具,语音所能实现的功能应该更聚焦、更有保障。在很多情况下,语音产品并非不能识别用户的指令,而是没有必要识别。”例如,在车载环境下,拨打电话这样的功能就是合适的应用场景,而用语音开关车窗,用户体验就远远不及使用机械按钮的方式。在访谈中,苏雨农和王力劭表示,产品的设计不能陷入技术化的思维,要真正考虑用户对语音的核心需求,必要时甚至要用上“去语音化”的解决方案。

  车载智能语音产品 未来的技术重点是什么?

  无论是“去技术化”的思维,还是“去语音化”的解决方案,都是在产品素质过硬的基础上,对用户需求满足的更深层思考。无论如何,智能语音产品都离不开对技术的修炼。尽管车音网建立于2008年,但其技术团队早在近20年前,就开始了语音识别技术的研发。对于智能语音技术的发展方向,车音网有着自己的心得。

  首先,语音识别与硬件密不可分。要想实现完美的用户体验,简单地把语音识别引擎和硬件车机绑在一起是不够的。麦克风阵列排布以及车机设计,都会影响语音识别的效果,而这也是未来语音识别重点探索的方向。为了让语音识别更加精确,降噪技术、后台引擎垂直度以及训练与车载环境的结合度,也都是需要注意的。

  其次是语音识别的容错性。具体说来,它分为对声音的容错与对信息的容错。现实生活中,对于突如其来的噪音以及无意识的口误,语音技术能否结合搜索技术并做到容错是非常关键的。此外,语音技术还要能够听懂各地方言或各种表达方式。对于用户而言,往往会追求多样性,包括使用过程中偶然状况的多样性以及场景的多样性等,针对上述多样性,容错技术也显得尤为重要。

  另外,语音技术完成识别之后,还需要进行自然语言处理(NLP)和搜索,通过对自然语言的处理和理解,加上搜索技术和正确的返回信息,一个巨大的数据库或知识库得以形成,这种数据库或知识库可以针对语音识别的结果提供反馈信息。在用户看来,既然说的话被识别,其返回来的结果就应该正确,而不会去纠结识别出错抑或搜索出错,因此自然语言处理和搜索这两项技术的成熟度,也直接影响了语音识别技术的反馈结果。

  第四,云系统将会成为未来的主流趋势。随着移动网络带宽不断提升,资费逐渐降低,云系统的优势将逐渐体现。依托大服务器群、大模型、大并发,云系统能提供更好的语音识别能力和语义分析能力。而嵌入式芯片因为设备局限性,提升能力有限。不过,王力劭也提到,目前云端与本地混用的模式是可行的,例如打电话的场景,本地化的解决方案就能很好的满足需求。

  最后,从设计体验角度来看,目前对于技术出身的设计者往往是从自身设计角度出发,只关心语音能做什么,从而导致语音设计存在一定的问题。任何语音识别的模型都存在一定的局限性,而且语音技术本身是一项概率技术,即使该技术能够做到精准,外部的不可抗因素也可能会导致语音识别失效。设计者应该更多地以用户的应用场景以及应用需求为出发点,去开发及设计语音产品。

  智能语音应如何盈利?

  盈利模式是维系一个产业发展的命脉。无论智能语音如何梦幻,没有盈利模式,它也只能是空中楼阁,如水中月镜中花,最终化为乌有。

  纵观所有行业,目前盈利模式主要分为传统模式以及互联网模式两种。两种模式的根源主要是围绕从技术出发还是从盈利角度或未来价值实现角度出发点,具体的模式主要分为产品售卖、服务租赁、影响力寻租,以及“东边不亮西边亮”式,即从其它领域获得更高的收益值。

  在语音识别的应用中,如果不能将其影响力传递给使用者,那么语音技术和语音平台如何去谋求长远的利益转化,值得我们思考。解决方法分为两种:

  ·将语音作为一种手段,重点垂直扎根于行业中。

  ·从语音技术本身去谋求赢利,将免费开放平台转化成最终利益。

  车载智能语音的哲学

  可以说,近年来车载智能语音的研发与应用已经变成了一股浪潮。企业的蜂拥而上,让这一行业显得格外繁荣。但在苏雨农和王力劭看来,我们应该十分清醒地看待智能语音的发展,切实将用户需求放在首位,摒弃为技术论的思维,才能为消费者奉献出他们想要的产品。

  “总之,我们要善用语音,慎用语音,垂直聚焦,体验为上”,王力劭总结道。或许,这就是车载智能语音产品的真谛。

  • 股票名称 最新价 涨跌幅