当小鹏汽车的语音被捧上天后,我想说……

· Oct 29, 2020

每年的 10 月 24 日,小鹏汽车都会举办一场技术解读的活动,今年也不例外。

在今年的技术日上,小鹏汽车展示了自己最新的「全场景语音」功能。活动过后我们就在各大平台就看到了诸多 KOL 在夸赞这套产品,用词包括「全球第一」、「最」这种违反广告法的字眼。

同时 C 端用户的反响也很强烈,小鹏汽车的这次宣传的确触及到了相当多的智能电动车用户和爱好者。有些用户发弹幕或者评论说:手里的特斯拉突然不香了;蔚来车主表示十分羡慕;体验确实比理想好;科大讯飞这么牛吗(但其实这套语音还不是科大讯飞提供的)……

总之,好像一时间大家都认同小鹏汽车的这套语音简直好到爆了。

这句话我也认同。但在《奇妙车机情报局》评测过 40 余款智能座舱产品后,我还想补充两点:1. 目前也有其他品牌的产品搭载了这些功能,小鹏汽车不是首创;2. 在车载语音领域,和小鹏汽车互为竞品的不是只有造车新势力。

小鹏汽车更新了哪些音功能?

先来说说小鹏汽车发布了哪些新功能,简单来说有四个:多轮对话、语义打断、双音区锁定和可见即可说。

多轮对话是指在一次唤醒后,可以连续和小 P 对话多次,更接近真人对话效果。最直观的体验就是,用户不用多次说唤醒词了。

语义打断是指用户可以随时打断语音播报,发出新的指令。再配合我们刚说的多轮对话,就会是一种更高效的类人类对话,也解决了很多 TTS 啰啰嗦嗦的毛病。

双音区锁定是指在一场连续对话中,谁唤醒小 P,小 P 就和谁一直对话,别人无法干扰。也可以理解为,它不支持抢麦,比如主驾唤醒小 P,副驾的指令小 P 不会收录。

可见即可说是指屏幕上显示的文字选项,用户直接说出来,系统就会自动选择,类似虚拟点击的原理。这个功能可以让用户实现完全脱手,但还不能完全脱眼。

具体可以看我们前几天的报道文章。

4261603974235_.pic

我想说的是……

小鹏汽车更新的这几个功能确实让体验更上一层楼,产品好用这一点毋庸置疑。但我发现市面上还有不少和它体验相似的新车,而且并不限于造车新势力。

虽然我们常说,目前智能座舱的发展还在起步阶段,但从这两年的进程来看,车载语音领域的技术发展和落地其实非常快,甚至每个季度都在发生变化。

今年年初,我写过一篇文章叫《车载语音越来越好用,原因有这些》。当时就发现,今年落地的智能座舱产品,语音交互能力都有了大幅提升。

具体来说,包括哈弗、吉利、福特和荣威等品牌,能不同程度实现以下大部分语音能力:包括支持打断,支持多轮对话,支持上下文理解,支持中英文混合理解,可以自动纠错,支持免唤醒,误触率降低,反应速度增加,能够识别更轻的声音,能够输入更长的对话,能够理解一条语音多指令,能够理解一些普世的伦理逻辑……

同时在那篇文章里我也分析了原因,大概就是各车厂和供应商们这两方角色的共同努力。

从供应商方面来说,如思必驰、科大讯飞、BAT 等各家的工程化方案越来越成熟,各个技术环节的指标都有量的提升(包括抗噪、识别、理解等);在 OEM 方面来说,语音的交互框架更完善,对话逻辑更自然高效,功能应用更丰富等等。

当时我们之所以能写出这篇文章,就是因为在那时我们发现了上述汽车品牌的语音交互体验,都有了很大的进步。而且这些产品更早的搭载了这些功能,体验却和如今的小鹏汽车没有明显的差距。

哪些具体车型也有这些功能?

我大概举几个例子,说明一下其他汽车品牌的语音交互能力。

这次小鹏汽车主推的语义打断和多轮对话,2021 款哈弗 F7/F7x 也可以实现。而且腾讯云小微提供的全双工语音技术,在我语速比较快,声音比较小的情况下,依然能快速识别。

截屏2020-10-29下午8.26.08

再来说可见即可说,今年 4 月我在全新别克君威 GS 上最先体验了这个功能。而且百度也可以提供其他语音能力,比如福特探险者就可以实现不少高阶语音功能,包括自动纠错、支持打断,中英文双排、多轮对话、上下文理解、情感交互、泛知识交互等等。让我感觉比较爽的是,它的对话结束机制很干脆,不啰嗦。

截屏2020-10-29下午8.30.29

最后说下双音区锁定,搭载了最新斑马 VENUS 系统的荣威 RX5 PLUS 也可以实现,而且它搭载的是支持 90 秒连续交互的全双工语音系统,由达摩院、思必驰和科大讯飞共同研发。达摩院提供前端算法、唤醒,思必驰提供语音识别能力,科大讯飞提供 TTS 音色。它支持连续对话,免唤醒、语义打断、上下文理解、中英文双排等等。

_DSC0257

博泰也有一款针对车载场景研发的语音 AI 平台,它是一套全链路语音解决方案。之所以说它是一个平台,是因为它支持不同的 ASR、NLU、TTS 能力接入,从架构设计上支持可插拔的切换能力。

它除了能实现多轮对话、上下文理解、全双工、免唤醒、所见即可说、声源定位、多屏交互、声纹识别等,还在复杂场景下的自然语音对话逻辑下了很大功夫,能理解更复杂的指令,包括否定说法、多条件叠加说法、间接意图说法以及间接话术。我们在去年年底测试了这个产品,当时给出了不低的评价,具体可以参考《奇妙车机情报局》的往期内容《博泰擎 Mobile 评测:手机车联网会是车联网的未来吗?》。

截屏2020-10-30下午4.37.17

……

因此,小鹏汽车这次更新的相关语音能力,其实在其他产品上已经不同程度的搭载。所以,我们中国不仅只有小鹏汽车这一家汽车品牌有如此体验的智能语音产品,其他品牌的技术优势也有待用户去发现。

小鹏汽车仍然有独特的优势

我们都知道,功能能否实现是一方面,体验好坏,或者是否有自己的调性又是一方面。

无论是如科大讯飞、思必驰还是 BAT 的语音供应商,即便它们有定制能力,更多也还是在输出通用的工程化交付产品。

车厂如果想在语音上形成差异化,还是要自己搭建语音交互框架,自主定义用户体验。小鹏汽车的优势就在于此,因为自主搭建了语音交互框架,所以它不只是个简单的产品,更是个平台。

而且我们从之前小鹏汽车的语音版本也能看出来,它的语音功能其实和系统,和整车都有很深的连结。而造车新势力比传统车企更看重智能化功能的传播,当然,如果传统车企不服,那我们换个说法:造车新势力比传统车企更懂得如何传播自己的智能化功能,并且精准触及到他们想触及的圈层。

知道怎么传播,知道找谁传播,知道传播受众是谁,要在汽车智能化的传播上做到这三点,传统车企可能还需要时间去领悟。而这也对车企的公关传播团队提出了更高的要求:真的得懂点儿自家产品和技术。

总结

小鹏汽车这次更新的「全场景语音功能」确实体验很好,跻身国内第一梯队完全不会有争议,关键是这次技术日在 C 端用户群体的传播效果也很好,给小鹏圈了一波潜在购买用户。

总之,这篇文章的目的,是让更多人知道小鹏汽车语音好用的同时,还能了解到我们身边其实还有其他好用的语音产品。

另外最后留一个彩蛋:小鹏汽车之所以选择 10 月 24 日作为技术日,一方面是因为当天是程序员日,这从侧面说明小鹏汽车坚持从软件层面定义汽车。而另一方面呢,何小鹏的儿子其实也是这一天出生的。

0


Related Posts 相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注