重写版 FSD 下放的几个关键词:体验、涨价还有未来

· Oct 23, 2020 333

互联网下的记忆真的太短了,昨天早上大家还沉浸在特斯拉「 牛逼」 的财报中不能自拔,到了下午,这个「 热点」 就过时了,开始追另外一个热点,主角依然是特斯拉,只是讨论对象换成了特斯拉的 FSD。 这里简单解释一下什么是 FSD。特斯拉将其 Autopilot 分为两部分,一个是基础版基础版辅助驾驶功能,包含了目前主流的 L2 功能,目前是全系标配;另一个是 FSD(完全自动驾驶能力),提供更进阶、功能可扩展的辅助驾驶功能。 故事缘由还是从今年 8 月说起,马斯克在 Twittet 上表示:FSD 将会迎来一次大的更新,这个提升不仅仅是简单的功能更新,而是对 基础架构进行了重写 。同时透露,自己的车上已经安装最初始的版本, 从 家到公司全程开启,几乎不用干预。 依照这个话术, 重写版 FSD 将拥有接近 L4 的功能的体验。 这怎么能不让大伙儿兴奋? 就在昨天的财报会议上,特斯拉透露,重写版 FSD 的 beta 版本已经向部分用户进行了下放,下午,油管上几段关于特斯拉重写版 FSD 实际体验的视频开始疯传,我们一起看一下这段视频,看看重写版 FSD 究竟达到了怎样的水平。 接下来,enjoy。 重写版 FSD 的实际体验 在视频中,我们能看到,特斯拉将计算机视觉识别、感知的全过程直接展示在屏幕上。嗯,真的是相当 beta。当然,后续界面肯定会做优化,做成类似现在的 UI。 这里再多说一句,很多人怀疑视频的真实性,我觉得是真实的可能性更大一些。下面这张图是特斯拉在财报中展示的特斯拉神经网络如何识别交叉路口的图片,和视频中的视图相似度极高。所以应该就是实车体验视频。 从视频中我们能看到,在行进过程中,特斯拉车子会对车道线进行分割,同时用不同颜色的线条进行分类,对于车子的分类则是以方块进行标注,当下自动驾驶企业大都以这种方式进行物体分类以及标注。 此外,能够看到的是,虽然是夜间,但是特斯拉对于路上物体、车道线等的建模还是比较细腻额,同时给出预测引导线,预测和规划车子下一步动向。 而在这张图中很好的展示了车子对于交通标识的感知识别能力,同时能够做出相应反应。 虽然特斯拉说自己不用高精地图,也不用激光雷达实现更高维度的自动驾驶能力,但是视频中也透露出了另外一个信息,特斯拉在用自己的做的地图来做辅助驾驶。 此前,特斯拉 AI 总监 Andrej Karpathy 表示,特斯拉采用的是伪激光雷达的技术,可以预测每一个像素的深度,然后进行投射,以这种方式达到类激光雷达的效果。从视频中的地图特征来看,还真有点激光雷达 3D 点云的意思,这也让我们一窥特斯拉自己的地图究竟长什么样子。 这是另外一个例子。重写版 FSD 独立完成了无保护左转,而且对于来车,能够准确识别,同时做出反应。 要知道, 在自动驾驶中,无保护左转是最为棘手的事情之一, 你要面对复杂的车流,判断对象来车的车速,对车子速度、姿态进行调整,同时还有各种不同交通标识的干扰,这些都对车子的感知、规划等方面的能力有很高的要求。 这也是包括自动驾驶扛把子 Waymo 在内的一众无人驾驶公司都在攻克的项目。 特斯拉通过视觉的方式以一个 L2+的辅助驾驶,将之实现,这个真的要点赞,特斯拉还是很牛逼的。 同时能够看到的另外一点是,重写 FSD 的 beta 版的驾驶决策做的还是相对比较保守,在完全停下之后,与前车的距离,目测还能放下至少一台车。 不过,这也与马斯克在财报上的态度一致:「我们开始(应该是指重写 FSD 下放)的进度会非常缓慢,非常谨慎,因为世界是一个复杂而混乱的地方。」同时,需要注意的是,当时的路上车辆很少,很适合自动驾驶车辆去跑,所以,重写版 FSD 的真正实力如何,还真不好说。 由于目前我们手头能够拿到的样本很少,所以对于特斯拉 FSD 的分析也只能点到为止。但是按照马斯克的说法,可能会在这个周末或者下周初给到更多人 ,然后逐步升级。 此外,在 FSD 重写背后,特斯拉还有另外一个大杀器:自研的专用于神经系统训练的计算机,名曰:「Dojo」。 目前已知的是,Dojo 这个「怪兽」并不是放在车端,而是位于服务器端,用于提升训练速度,并完成自我学习成长,无需对单个汽车进行升级(改造)。 虽然 Dojo 还没有开发完成,但是似乎已经可以投入应用。随着重写版 FSD 更大规模的下放,特斯拉将拥有更多的数据喂养这头「 怪兽」,提升自动驾驶能力。同时,其也在财报中表示, 这次重写将允许特斯拉释放其余的驾驶功能 。 So,重写版 FSD 所拥有能力不止现在这些,马斯克同样看到了其背后更大的价值。 涨价 就在昨天,马斯克宣布,在 FSD 测试版限量发布后,FSD(完全自动驾驶能力) 价格 (新购或升级) 将在下周一上涨约 2000 美元。也就是从目前的 8000 美元涨到 10000 美元(中国区 FSD 目前不会涨价)。 从刚才的那些关于 FSD 的描述来看,涨价是必然的。每次附带新功能上场的时候,都是 FSD 涨价的时候。 今年 5 月,马斯克发了一条推文,正式宣布将从 7 月 1 日起把 FSD 的订阅价格从 7000 美元提高到 8000 美元,同时马斯克补了这么一句:「FSD 的价格将会继续上涨,因为在获得监管部门的许可之后,FSD … 继续阅读

全语音车载系统:小鹏 P7 车机的杀手锏?

· Oct 23, 2020 333

​​在昨晚,小鹏汽车开始为 P7 用户分批推送 Xmart OS 2.1.0 更新。在这次更新里,除了加入大家期待已久的辅助驾驶功能,还有一个关于车机的重要改变——语音交互的提升。 具体来说,就是加入了全场景语音功能,或者叫「全语音车载系统」。用小鹏官方描述来解释:「用户手动开启该功能后,语音助手可以支持连续对话、可见即可说、语义打断、双音区锁定等语音交互功能,提升人机语音交互便利性。」我在广州提前一天体验到了这套新的语音交互,先说结论:加入了上述这些能力以后,小鹏 P7 的语音交互已经可以跻身市面一流行列。在体验现场,以电动星球 NEWS 蟹老板为首的几位媒体人,都对 P7 的语音交互给出了非常好的评价。具体可以看蟹老板和常岩今早发布的视频。 具体是个什么情况?我们把上述几个能力按顺序加以介绍。 连续对话: 也叫多轮对话。原先,小鹏的语音交互每一条语音指令输入之前,都需要说一句「你好小 P」来唤醒。升级之后,在连续对话时,可以实现免唤醒词操作。如果系统在 20 秒之内没有识别出语音,那么就意味着此轮对话停止,需要再次使用「你好小 P」来唤醒。 新版本系统里的多轮对话并不局限于屏幕当前功能模块内,而是可以支持垮功能的全局操作。比如,在操作导航时,你可以紧接着让系统去播音乐、调车辆设置等。 可见即可说: 这个能力主要是指,在中控大屏上显示出的文字,你都可以通过语音的方式进行操作。比如,屏幕上出现了一个歌名,你可以念出来,系统就会识别,然后播放。甚至是当屏幕上出现了一个「请阅读后点击确定」这样的按钮,你也可以说「阅读」俩字,然后车机自动完成点击这个按钮的操作。另外一个作用是,当你不确定你想操作的功能在哪个页面时,你可以用语音把那个页面调出来,比如你在导航页面说「氛围灯」,车机就会调出氛围灯设置页面。理论上来说,当这个「可见即可说」足够好用时,就可以解决车机菜单逻辑和层级复杂这一痛点。 小鹏的语音负责人告诉我,这个功能的实现目前主要是依赖的云端能力。 不过在逻辑上,「可见即可说」有一个 bug:这个功能的初衷或许是想让用户尽可能少的进行触摸操作,尤其是在车辆行驶时。不过,虽然解放了手,但没办法解放双眼。你的眼睛其实还是得看屏幕然后说出语音指令,所以也就无法完全解决「在开车时因为操作屏幕而产生安全隐患」的问题。 语义打断: 这个没什么可说的,就是你可以在语音交互时随时打断语音播报,给出新的语音指令输入。「语义打断」加上「连续对话」,就有了一种更接近人与人自然对话的感觉。 双音区锁定: 小鹏 P7 的语音支持多音区识别和操控,而双音区锁定能实现的是,在一场连续对话中,主副驾谁说出「你好小 P」的指令,连续对话就锁定到谁。比如,主驾通过「你好小 P」唤醒语音交互并进行连续对话,那么此时副驾的任何语音都不能被识别,也就减少了此时副驾说话对于语音交互系统的干扰。如果在这个过程中副驾想发布语音指令,就需要用「你好小 P」来让自己成为发号施令的那个人。 从我的体验来看,小鹏 P7 的语音系统在连续对话时,不会误识别那些不该被识别的正常交谈,这固然是连续对话优化的比较好,但双音区锁定也对此作了很大贡献。 其实小鹏的语音交互本来就有识别准确率高、反应迅速的优点,再加上这次升级的这些能力,确实是有了更大的进步,之前我们发现的问题比如不支持上下文理解,不支持大面积免唤醒,不支持可见即可说都得到了解决。就像开头所说,小鹏 P7 现在可以跻身市面量产车语音交互的第一梯队,甚至是前几名。接下来,小鹏需要做的就是把这个优势继续巩固,并且不断对语音交互加以优化。它绝对不是完美的,还有提升空间。 当然,P7 语音能力的提升,也跟小鹏做的大量自研有关。虽然语音识别的底层能力来自思必驰,但在此基础之上,小鹏做了大量的自主研发工作。举个例子,小鹏的语音负责人告诉我,当产品经理提某个需求时,一般会同时提给语音产品经理和 UI 产品经理,这相当于是把语音拿到了一个比较高的层级去对待。而另一方面,语音能力足够强,也能减轻 UI 和触控交互研发上的压力。 昨天在体验现场大家也提到,几家头部造车新势力都开始意识到语音交互的意义,并且准备投入更多的资源去进行研发。照着这个趋势来看,中国品牌智能电动车在语音交互上相对特斯拉的优势一定会越拉越大。​​​​