你不觉得「车载语音」越来越 skr 了吗?

· Jun 10, 2020 333

不难发现,现在「车载语音交互」的体验越来越完善。它不仅能完成更多的指令,而且能和我们进行情感交互,甚至还懂得一些基本的伦理纲常。 那现在语音体验发展到哪一步了?实现这样的体验都有哪些路径?这些路径之间有什么不同?为什么我们的体验越来越好?下面我们带着疑惑,一一讨论这些问题。 现在的语音系统体验怎么好了? 首先语音的基础能力更强了。 之前虽然能完整跑通 ASR、TTS 这些流程,能实现一些简单的 NLU/NLP 能力,但体验有很多漏洞,比如有可能识别失败,指令完成缓慢,交互逻辑不合常理等等。现在来看,这些基础能力正变得更强,基本可以称得上是一个「有价值的工具」。 具体表现有,能够支持打断,支持多轮对话,支持上下文理解,支持中英文混合理解,可以自动纠错,支持免唤醒,误触率降低,反应速度增加,能够识别更轻的声音,能够输入更长的对话,能够理解一条语音多指令,能够理解一些普世的伦理逻辑…… 说到底这些基础能力只是一种交互模式,是一种手段,真正要实现价值需要结合应用和生态。所以现在的车载语音还将触手伸向了更多领域: 1. 将语音和软件功能结合。比如和操作系统结合,和地图导航结合,和车机上所有的应用生态结合,和市面上主流的 Feed 流结合。举个例子,你可以说「屏幕亮一点」,「回到主页」,「打开 XX 地图」,「我想听周杰伦的歌」,「搜索附近的充电站」,「苹果今天的股价是多少」,「林则徐是谁」等等。和多种应用结合其实是个很大的突破,可以想想,至今 Siri 都不能完成「我要听 XX 的歌」这样的指令。 2. 将语音和硬件设备结合。这里是指控制车内的一些硬件,比如开闭空调、车窗;和其他的智能设备结合,比如车控家,智能手表等等。 另外近几年还衍生出了虚拟助手的概念。这对完成指令本身没有帮助,但在感性层面,它往往非常能打动消费者。一个合适的虚拟形象,往往会成为这套车机系统,甚至这款车的加分项。 同样的语音体验,不一样的实现路径,不一样的想象空间 可喜的是,现在确实已经有一部分车型,或完全或部分实现了上面这些功能。但它们的实现路径其实不太一样。下面我介绍 3 种。 1. 使用 BAT 的车联网方案,搭配对应的语音能力。 肤浅来说,现在车机系统最明显的表现就是搭载各项互联网应用,比如高德地图/QQ 音乐/车载微信/爱奇艺等等。所以 BAT 现在都有一套比较通用化的自家生态方案,里面有不同的功能模块,OEM 可以选择「打包上车」,这其中就包括车载语音系统。 自家的生态,配上自家的语音,那肯定体验会更好一些。拿腾讯来说,他们推出了微信车载版,在腾讯叮当提供的语音下,我们收发微信语音非常流畅。另外腾讯还有一个产品叫「腾讯随行」,配合腾讯叮当收发微信位置,打开小程序,也很流畅。「爱趣听」也是一样。 当然,腾讯也会辅助开发系统,给予 Feed 流支持,做一些 NLU 的开发,所以和腾讯合作的车机系统(比如哈弗 F5 搭载的 Fun-Life)基本都能实现我们上面说的那些功能。同理,百度(DuerOS)和阿里(斑马系统)的方案也可以。 不过,虽然 BAT 都能实现上述功能,但他们还有一个共通点就是基本无法实现「全流程开发」。也就是说车内基础的 ASR 和 TTS 能力可能是由其他语音供应商提供,而 BAT 负责语音控制生态以及其他相关 NLU 的工作。 当然,这并不是说 BAT 没有实现 ASR 和 TTS 的能力,据了解有些互联网大厂已经开始做相关的技术储备。只是语音交互是一个从前端降噪-语音触发-识别-理解-语音反馈的长技术链,而科大讯飞、思必驰、纽昂司等老牌语音公司,在 ASR 和 TTS 这种基础语音能力的工程化交付上有更多的经验,所以大家各司其职,合并合作,其实是更有效率的做法。 2. 不把语音当产品,而把语音当平台。 我们在《奇妙车机情报局》还测过一个产品,是博泰开发的擎 Mobile。当时确实给到我比较舒适的体验。(这里不谈论它的产品路径,只谈语音功能的实现。)它的识别速度很快,纠错能力较好。可以一边听,一边说,一边执行命令,还可以随时打断。我可以说话声音很小,也可以说很长一段话。它可以清晰识别,然后摘出长对话里的多个语音命令。 据了解,如果车载语音仅依靠供应商,那用户的指令从触发,到识别,到理解,到反馈,再到执行,是一个脱离的过程,反应时间自然就长。而博泰认为,车载语音不只是一个技术产品,而应该是一个涉及到整车的电子电气架构、车辆信息安全以及车辆数据闭环的「平台」。 所以擎 Mobile 是一套集成了芯片、硬件、软件、云端和生态的平台化产品。 以导航功能为例,它会在识别指令的同时,直接抓取关键字上传到地图引擎。比如我说「导航到北京机场 T3 航站楼的停车场接个人」,关键词是北京、T3、停车场。关键词抓完,导航实施执行。所以有可能我话没说完,云端已经开始计算执行了。这是集成的好处。 当然这个产品也并不完美,在我当时的体验下,虽然语音有很极致的体验,但它和其他应用生态的结合和适配比较一般。另外未来博泰如何把相关能力输出给 OEM,我也暂时打个问号。 3. 自己定义语音交互框架。 近期小鹏汽车的新车型 P7 火了(不是着火了),最亮眼的部分之一就是它的车载语音。 识别速度很快,功能结合深入,对话逻辑自然幽默,语音助手的新形象也更高级了一些,而且语音反馈的女声实在是很甜美。这其实能表明,AISpeech 和 Xpeng in House 把 ASR 做的扎实,TTS 优化地好,NLU 也做了比较深刻的训练。 值得一提的是,P7 的语音交互框架是小鹏自己搭建的,所以它也不只是个简单的产品,而是个平台。它可以在初期就构建很多深层的功能,让车内的数据联动起来,同时对数据安全和用户隐私进行保护和封锁。也正因为功能是自己定义的,所以用户数据自然也就跑到自家口袋里来,这就让运营用户成为可能。 相对 BAT 提供的语音能力,小鹏汽车有完全自主的产品定义权;相对博泰,小鹏汽车有产品做支撑。P7 的语音系统确实是一个占优势的产品。 另外,再说说说自己搭建语音交互框架有多重要。我举个反例。近期我们体验了一套传统豪华品牌下全新换代车型的车机系统。这套语音系统的框架是德国定义的,语音供应商分别有两家,一家是纽昂司,一家是国内供应商(我们暂且称它为 XX),同时它还接入了天猫精灵的能力。 纽昂司和 XX 都承担了 ASR 和 NLU 的任务,算是并行关系,所以用户输入任何一个指令,这俩通道都要跑一遍,最后它俩统一口径实行指令。一旦谁慢了,就要互相等着,所以这套语音的执行速度较慢。而且它的 TTS 有拖音现象,据说是历史遗留问题,是上代车型上的老方案,所以只能如此。再说天猫精灵,它并不会自然唤醒,而是你要对唤醒的语音说一句「你好,天猫精灵」,它才会出现。 这么看来,这个语音交互框架是挺乱的,但大厂认可自己的节奏就行。而且倒也不是说要一味的激进,因为不是每个大刀阔斧的产品都是成功的。所以,激进还是保守,后果都要自己承担。 为什么现在的车载语音系统变得好用了? 车载语音的完善,供应商和 OEM 都做出了努力。 从供应商方面来说,早期的语音供应商并没有开箱即用的语音方案,都需要大量对接、磨合。现在各家方案在工程化上解决问题越来越多,实用性也就越来越好。具体表现就是各个技术环节的指标都有量的提升(这里包括抗噪、识别、理解)。 在 OEM 方面来说,语音的交互框架更完善,从以前的单工单轮交互逐渐往多轮连续对话能力升级,对话更自由;NLU 的泛化支持更充分,语音识别更准,对话逻辑更自然;功能应用更丰富,更实用,语音和各功能的融合更深入。 简单来说,软硬件技术的升级,让机器能听清我们说什么;更丰富的语料和更完善的语音模型,让我们能听清机器说什么;同时上车的功能更多更实用,能满足我们更多车内的需求。以上。 总结 谈起语音进入汽车,可能要追溯到 10 年前。如今 2020 … 继续阅读

江淮大众、苏宁汽车布局汽车智慧零售,为什么选博泰当合作伙伴?

· Jun 10, 2020 333

6 月 10 日,江淮大众与苏宁汽车、博泰悦臻通过云直播的形式,共同宣布启动思皓品牌战略联盟。 三方的联盟将基于新型场景化的销售模式,打造电动汽车智慧零售,并在多个领域展开业务合作,为消费者带来全新的电动出行体验。 同日,思皓汽车旗舰店于苏宁易购平台正式运营,并通过苏宁易购 618 百亿补贴大促活动,为消费者带来多重福利。此外,江淮大众携手苏宁汽车打造的首家苏宁广场思皓 e 栈于杭州落成,并将于 2020 年内拓展至 55 家。结合博泰悦臻的数据生态和平台运营优势,思皓品牌将实现多场景闭环运营及数据贯通,进一步提升客户电动出行体验。 江淮大众、苏宁汽车、博泰悦臻分别是整车、零售、科技领域的行业领先企业,此次三方战略合作,将基于场景进行新型销售模式的探索,这一创新无疑将在新经济时期给汽车行业带来一场震动行业的商业变革。 江淮大众和苏宁汽车的逻辑 作为国内首家专注于新能源汽车的合资企业,江淮大众始终致力于打造以消费者需求为中心的电动汽车营销生态。思皓品牌将通过线上线下多场景闭环运营,提升流量汇集、线索分发、销售转化等业务效率,解决消费者多种顾虑,为消费者提供全新的购车、用车体验。 此次与苏宁汽车、博泰悦臻的联盟,是江淮大众继思皓 E20X 凤凰里程项目之后,探索创新零售模式的又一里程碑。江淮大众逐步实现从传统汽车销售模式向电动汽车智慧零售的转变,为电动汽车企业长期可持续发展奠定基础。 江淮大众汽车有限公司总裁李明表示:「 江淮大众始终致力于成为电动汽车创新销售模式的先行者。通过此次联盟,江淮大众进一步拓展了消费者体验场景,将为消费者带来选车更高效、体验更全面、运维更及时的电动出行新享受。」 苏宁汽车作为苏宁集团布局出行领域的全资子公司,致力于满足一站式出行服务平台,打造的是智慧零售模式下的汽车生态圈。背靠苏宁集团的优势资源,开放共享数据云、物流云、金融云并赋能合作伙伴,利用线上线下双渠道优势和强大的互联网技术,苏宁汽车打造了以品牌推广、产品销售、线索分发、用户体验、数据整合、会员运营、裂变传播等为一体的创新营销模式。 经过不断的探索,苏宁汽车优化出全新的「1+1+X+Y」 业务模式。两个「1」 分别代表品牌现有渠道和以苏宁易购品牌旗舰店为主的社区平台以及社群营销。「X」 则代表多样性的线下漏斗型的汽车门店形态,「Y「 则代表苏宁名企购、苏宁城市购、苏宁体育、苏宁文创等全生态资源、场景赋能。通过这种模式苏宁汽车能实现低成本高效率地获客。 本次战略联盟苏宁依托成熟的零售经验,双线融合的优势,线上旗舰店、线下门店的互通,集团各生态资源的强势加持,形成高效、良性、极具行业优势的经营闭环模式,实现业务效率与用户体验的完美结合。 时下正值苏宁易购 618 百亿补贴大促风暴爆发期,本次大促苏宁汽车联合众多车企推出 5 折车、大额购车券、购车补贴等助力汽车消费。江淮大众思皓品牌旗舰店也已在苏宁易购平台上线运营。针对此次大促,三方联合推出思皓品牌旗下的首款 A0 级电动 SUV E20X,参加苏宁的百亿补贴抽奖活动,购车至高可享 4.5 万购车补贴。 为什么是博泰? 博泰悦臻作为中国领先的科创企业,致力于打造整合车载、互联网、手机三个部分的以汽车生活服务为核心的跨平台体系,为广大客户提供极致用户体验的产品,助力车企创造全新商业模式。基于博泰悦臻与江淮大众-苏宁汽车的多年良好关系,诞生了此次深度生态融合的落地。 在新四化背景下,除了刚性需求,消费者对汽车的期待早已不再是单纯的交通工具,而是追求幸福的第三空间,是一种全新的载体,一个智能的移动空间。整个汽车产业的发展方式和发展效率也产生变革,在新生态下,未来汽车产业的分工将更趋于细化,单个企业难以形成有效的竞争力,谁能够抢先将深度生态融合做到真正落地,谁就抢占了未来汽车市场的先机。 在车联网领域深耕多年的博泰悦臻以「 擎」 系列等一系列车联网产品在行业拥有良好口碑之外,结合博泰悦臻对车联网方面数据的累积和理解,在基于场景的全智慧零售购车模式上也率先走出一条自己的道路。虽然汽车销售行业和快消品行业存在的一些差异,如汽车的决策周期时间比较长,决策周期比较慢,跟踪期比较长。但只要能解决客户在线上信息的传递和资金支付,以及沟通理解的过程,那么在线上形成一个闭环的销售是可行的。 此次与江淮大众、苏宁汽车的合作中,博泰悦臻提供了更多具有前瞻性的落地整合服务,包括解决里程顾虑,服务顾虑,充电顾虑,二手车顾虑,金融顾虑;提供旗舰店,销售网络,订购热线,小程序,微信号等线上运营;基于技术平台能力构建虚拟中台业务,AI 智能销售系统等。 「 对于目前汽车行业销售的现状而言,现有的客户群怎么帮助升级换代,变成江淮大众思皓品牌的终身粉丝;如何挖掘新客户等,整个过程都需要数字化营销手段来解决。博泰悦臻思考的是利用大数据能力,形成用户画像,在营销领域最终实现快速精准化的营销。」 博泰悦臻董事长应宜伦介绍,「 对于智慧零售来说,如何发挥生态数据构建和中台运营能力,连接汽车企业、电商销售平台和客户,形成闭环高效低成本的汽车零售运营服务体系也是十分重要的。今年我们会继续和苏宁汽车在线上推进的基础上,开展一些线下合作,并在此基础上开发 AI 智能销售系统,帮助江淮大众进一步快速实现转化。」 三驾马车齐头并进,共同探索汽车行业的智慧零售,此次尝试或将吹响中国乃至全球汽车的变革之音。