自动驾驶主流技术路线的重负与解决之道
2020-12-28 15:48:23
  • 0
  • 0
  • 1

2020/12/7 (戎鈛)

【摘要】

识别和定位是自动驾驶技术中非常重要的2个领域。由于现代公路的交通指挥系统设备是建立在人类驾驶车辆的基础之上,几乎所有路边标识和指挥信号都是文字、图形、形状和颜色等等由人类驾驶员依靠眼睛识别后执行。目前国内外绝大多数自动驾驶的研发者采用的都是人工智能的识别方法,但其识别正确率在当前和相对长期的将来都无法满足安全驾驶的要求。此外,目前车辆定位主要靠全球卫星定位系统加上各种增强方法并使用高精度地图达到车道级定位的精度,但经济和技术上代价太高。作者认为,随着自动驾驶级别的提高,这是一条重负越来越大而到最终可能是不可承受的技术路线。作者同时提出一条简单实用的技术路线。本文分析了本领域的技术和资本近况,提出了直接向车辆提供车道级定位、路边交通标识和指挥信号电子指令的道路设备与汽车自动驾驶方法,讨论了在经济上技术上实现本方法的可行性。 

前言

有人说,自动驾驶技术是交通技术领域的又一次重大革命[1],既然是“重大革命”,就绝不是只在现有的车上加上一些感知、计算、控制单元就可以完成的。又有人说,“除了特斯拉,现在所有自动驾驶汽车的另一大问题是无法倒车,…这也是Waymo跟克莱斯勒合作,要去设计新的车型(的原因)。因为必须重新设计整个底层架构,让这个车从设计开始就是为自动驾驶而设立的。”[2]。作者说:完全同意,但不够,路也要从设计开始就是为自动驾驶而设立的。 比如,已经有报道说:“中国也在尝试走捷径,另辟蹊径地发展车路协同,通过改进基建来大大降低对自动驾驶的技术要求。比如雄安新区可能会以智能城市的模板进行建设。这个模板中就包含了城市的自动驾驶设计,比如在道路上安装大量的传感器,道路设置时也更适合自动驾驶,这样技术难度会降低很多,因此不需要达到Waymo现在的技术,就可以实现自动驾驶”[3]。但我认为这还远远不够。在路上的改革,还有非常宽和非常深的领域可以开拓。举一个非常简单例子:取消跨越公路的人行道,在所有交叉路口设人行天桥或地道,用坚固的栏杆隔离车道与路边人行道,把行人和车隔离在两个世界。如果这样做,2018年3月份,Uber的一辆自动驾驶汽车在亚利桑那州Tempe市发生致命的交通事故就可以避免了。这当然是非常表面的例子。那么往深度的领域要如何改造道路?且听下文分解。

 I.     本文灵感的来源

许多年前我从哈工大自控专业毕业时,做了《机车驾驶自动化》的毕业论文。当我与哈尔滨铁路技术研究所的工程师们讨论机车行程精确测量时,先是有人提出:1.选择一种特别耐磨的合金做材料;2.用当时技术的最高水平加工一个圆周长尽最大精度等于1米的轮子;3.用力学理论计算一个这个轮子对铁轨的最佳压力把轮子安装在车头上,这个最佳压力保证该轮子在铁轨上只有纯粹滚动没有任何滑动,但又不会因压力过大加速轮子的磨损;4.最后就是累计轮子的旋转数,得出车辆的行程公里数。无疑,这是一个含有一系列高科技的思路(以下我们称为“学院派路线”)。但很快,另外一个方案被提出:在铁路沿线每10公里,设置一个公里数标杆,车辆经过该标杆时校准公里数。两个标杆之间用最普通的计程表指示加上即可(我们在后面称为“简实路线”)。当然是后面一个方案被采用。这个“最简单即是最好”的原则我记住一辈子,在最近我了解高精度地图(HDmap)研发的进展时,萌生了本文所提出的思路。

 II.   请不要把自动汽车驾驶技术神秘化

相信阅读本文的读者大部分都有开车经验。如果一个自动驾驶系统能够具有出租车司机的平均水平,即:向普通的GPS 导航仪输入目的地,在导航仪的指导下,知道目前车辆处于本次行程的大致位置(不必知道准确的经纬度),如车开到某条街上了,大约多少米之后的下一步是左拐/右拐/直行,知道自己现在所在的车道是否允许这种操作,如果不允许,则在可能的车况下调整到允许这种操作的车道上。在复杂的交叉路口上,根据适用本车道的红绿灯,在保证和前车安全距离的条件下通过交叉路口。在行驶过程中,出现危险的车/人等运动物体突然靠近时及时躲避和刹车,在得知前方道路拥堵时改变路径,等待导航仪做出新的路径规划,等等。自动驾驶系统只要能做到这种水平,加上它不会疲劳和严格按设计的算法进行判断,事故率应该比出租车司机的平均水平小2个数量级。有了这种水平,汽车自动驾驶应该可以全面落地使用了。

有人说,5G通讯技术是自动驾驶的基础。但也有专家不同意。例如,一位曾在华为工作十来年的通讯大咖说:“自动驾驶是被广泛误解为需要低时延的应用。你可以经常看到有文章说,低时延使得刹车距离更短,从而更安全。但是这要基于一个假设,就是刹车指令是通过5G网络从远程控制中心传送给汽车的。显然实际的解决方案不是这样。象刹车这种对时延和可靠性要求都非常高的指令,只能由车在本地产生,采用尽量短的回路。依靠网络传输的,是路线规划和路况信息这样的对可靠性和时延没有特殊要求的信息。Google汽车已经跑了几百万公里了,并不需要一个低时延的网络。甚至没有网络的时候,汽车也应该能跑,这是起码的要求。”[4]

III.  高精度地图是不是自动驾驶仪的刚需?

乍一看,应该是。我们看一下下面图1[32]的4车道的十字路口高精度地图。从南往北的

图 1

车辆到达十字路口前,根据下一步是左拐/右拐/直行,控制系统要知道车辆现在所在的车道是否允许这种操作,如果不是,就要在可能的车况下调整到允许这种操作的车道上。就是说,车辆定位应该是车道级的。我们知道,美国GPS卫星精度民用10米(军用0.4米),俄格洛纳斯10米,中国北斗2.34米[5],满足不了车道级定位精度的要求。现在大家都用各种方法提高定位精度,如CORS(连续运行参考站),RTK(Real-Time Kinematic)等等。这些方法可以得到厘米级的定位精度。如果知道了车辆厘米级精度的经纬度定位,再立即到高精度地图上一查,就知道了车辆在哪一个车道上了。还有另一类经常被人提到的自动车定位算法,如同步定位与地图构建(SimultaneousLocalization And Mapping,SLAM),就是车辆随时构建地图,同时利用已经观测到的环境特征确定在已有的高精度地图上与之匹配的位置作为车辆当前位置。看来,不管什么方法,都离不开高精度地图。 

但是,制作高精度地图是一件投资极大还需要无限期不断更新的无底洞工程。中国图商巨头高德表示,对于高精地图产品来说,制作地图只是完成了10%的工作,另外90%的实力竞争是在数据迭代更新上,例如为自动驾驶提供动态、实时的数据服务,如动态交通信息、智慧红绿灯等交通设施信息、施工等临时或突发信息等动态数据的更新。经过几年的努力,目前高德完成了覆盖中国超过32万公里(中国500多万公里公路)的高速及城快公路的高精地图数据采集。除了像高德这种专业制作之外,高精度地图也可以通过众包车辆来获取。代表性的极奥公司,通过三年的积累,它的数据众包平台已经覆盖中国300多个城市。如今,每天新增里程轨迹超过2亿公里,众包车辆将近1000万辆。 极奥最后生产出来的高精度地图包括了覆盖全国300多个城市和30万公里主干路网。可见,不管是高德,还是极奥,完成的高精度地图只是全国公路的大约1/20。[6]

为了在高精度地图的更新上完全实现「精度」和「鲜度」(实时性)两个目标,对专业制图公司,除非自己往死里砸钱让测绘车永不休止地跑遍祖国万水千山,否则,「众包」就是唯一可走的路。但「众包」可行的前提,是百万甚至千万级的数据收集终端设备覆盖量。另外的挑战是,众包制图没有行业标准。高精地图目前一直没有国家标准和行业标准[7]。更困难的是,高精度地图和国防息息相关,因此,在中国,高精度地图的采集和使用是受到严格限制的。尽管导航电子地图在公开出版、销售、传播、展示和使用前,必须进行空间位置技术处理,但我们的管理部门会允许毫无限制地向所有在路上跑的车辆提供全国范围的高精度地图吗?

其实,不论是人类驾驶还是自动驾驶,在繁忙的交叉路口,我们对车辆定位的经纬度的精确数值和周围的建筑物并无兴趣,我们感兴趣的是车辆对车道边线,人行道边线,STOP线,距交叉路口的距离,处于哪一条车道,是否允许车辆下一步的拐弯和直行等等。回到本文《I. 本项目灵感的来源》的思路,这些信息是可以通过我们在车辆行进的车道上放置一系列标识物(即下文中各种“编码反射镜”,详看下面解释)告知车辆的。例如,车辆现在所在的是第几车道,是左拐/右拐/直行哪种车道。这不就是最精确的“车道级定位”了吗?高精密地图还一定需要吗?有人会说,高精度地图可以为自动车提供的某些先验信息,包括道路曲率、航向、坡度和横坡角等,这些信息对于自动车的安全性和舒适性都至关重要。但这些信息是不需要“车道级精度”推送的,这种信息一般是某一段路段共享的,甚至包括当前时刻遇到暴雨/大雪/沙尘等恶劣天气,车载传感器很难感知到远处的障碍物、可通行空间等等信息,都是可以通过设置在该路段的信息中心的LTE-V2X通讯系统推送给到达该路段的所有车辆的。既无需高精度地图,也无需5G通讯。

特别是,对道路/车道的新增和废弃场合,只要在新增和废弃投入实行之前,在到达新增或废弃的道路/车道的入口前一定距离的有关车道上完成设置允许进入新增道路/车道或禁止进入废弃道路/车道的硬件(反射镜)或软件(局部路段的LTE-V2X信息推送,请看下面解释),道路/车道新增和废弃这种变更的信息可以在变更实行后瞬间通知到前来的车辆。这就轻而易举地解决了高精度地图完成投入使用后,还要投入更大费用的追踪更新工作上(如上述,制作地图只是完成了10%的工作,另外90%的实力竞争是在数据迭代更新上。)这是我们新方案与现有方案的天地般的差别呀!

 IV. 多层立交的大量涌现加重了目前主流技术的负荷

下面的图2[33],是重庆黄桷湾立交桥。该立交连接广阳岛、江北机场、南岸、大佛寺大桥、朝天门大桥、弹子石、四公里、茶园8个方向。高达五层、共20条匝道。当车辆在立交桥

图 2

或隧道区域出发时,一定要让导航仪知道车辆处于那一层。例如,从隧道的-2到0(地面),再到上例立交的+5层,这样,导航仪才能正确规划车辆的行程。如果车辆是在运行中进入立交桥或隧道区域,根据已经走过的行程,按理车辆应该被引导到它该到达的那一层的道路上。但前提是车辆定位精度、地图的精度和车辆在车道上的运行轨迹的控制精度都应该在0.5米以内。人类驾驶员用现在通用的GPS可以正确驾驶,是因为用眼睛可以控制车辆到大约0.5米以内精度,不致错误进出一个路口。自动驾驶如果达不到这个精度,一旦错误进出一个路口,需要在立交桥或隧道区域重新规划下面的行程,也一定要让导航仪知道车辆处于那一层。

的确,如前所述,高精度地图加上各种增强型的卫星定位有可能对车辆在地面的定位精度达到厘米级。但是一般GPS接收机,相对于水平误差2米,高程误差达20米[8],根本不能满足要求。于是,近年来,花样翻新的识别车辆高度的大量专利被提出,例如:根据气压来测量高度[9]、根据倾斜传感器输出的汽车倾斜角度来确定车辆是上高架还是下高架[10]、根据载噪比表示的卫星信号的强弱来估计车辆高度[11],等等。因此,即便可用高精度地图来标示在某一经纬度下的某一层立交路面的高度,导航系统除了GPS之外,还需高精度地图和高度测量仪来帮助定位车辆处于多层立交的哪一层。回到第I节的讨论,如果我们简单地在车辆行进的车道上放置一个标识物(“编码反射镜”,详看下面解释)告知车辆处于多层立交的哪一层,不是又可靠又简单吗?

V.完全依靠人工智能的识别不能满足安全要求

首先,请看目前业界识别交叉路口红绿灯的方法:使用最广泛的是各种基于人工智能的视觉识别算法[12]。由于只用颜色和形状信息来识别效果不好,研发者们提出诸如“级联分类器”方法、“特征分类”方法、卷积神经网络(CNN)方法等等。对多个红绿灯同时出现在同一交叉路口的情况,检测者难以确定到底哪一个红绿灯适用于当前车道中的当前车辆,因而只好用高精度地图,将红绿灯的位置、大小等信息存放在高精度地图中。在车辆行驶的过程中,根据车辆的位置从高精度地图中找出适用于当前位置的红绿灯的坐标,再使用坐标转换将地图中的坐标映射到现场拍摄的视野图像中。又由于红绿灯在整个视野中只占很小的面积,必须从图像中剪切出感兴趣区域(ROI),最后对ROI使用目标检测算法进行红绿灯检测。即使经过这么复杂的过程,各种方法报告的最高识别正确率只能达到99%左右。这是什么概念?就是说每台自动驾驶汽车平均每经过100次交叉路口就可能误判红绿灯1次!或者说,平均每100台汽车经过同一交叉路口就可能有一台汽车会误判红绿灯!特斯拉直到不久前,自动驾驶车辆到交叉路口会自动停车,但要驾驶员自己判断是否踩油门通过交叉路口[13]。最近的改善是,如果它的前头有车辆通过,它就自动跟着通过。但是如果前头没有车带它通过,这时怎么办?特斯拉没有说[14]。 

除了红绿灯的例子,其他如路边交通标识识别(如限速、让路停车)、车道线检测等自动驾驶所需信息,基本上是完全在现有提供给人类驾驶员的设备和标识基础上,用现有人工智能识别所能达到的技术水平来解决。

那么,人工智能识别方法要达到多少准确率才能满足自动驾驶的安全要求呢?目前没有国际标准,也没有国家标准。但是我们可以作如下的议论和计算。举北京的例子来说。截止2019年7月,北京机动车保有量达621万辆[15]。现在我们以平均每日出行车辆400万辆,每辆车穿过25个交叉路口红绿灯计算,北京市每天有1亿车次穿过红绿灯。当北京市汽车驾驶自动化全面普及时,我们自然不愿意天天看到媒体“今天某时某地北京市又一辆自动驾驶汽车误判红绿灯肇事”的报导。那么,我们要求自动驾驶系统在交叉路口红绿灯的识别错误率小于1/(1亿),即正确率大于99.999999%。哪位预言家能说现有或一定长的将来人工智能方法可能提供这种精度?如果正确率小数点后少一个9,变5个9是什么情况,是识别错误率1/(1000万)。也就是说,当北京市汽车驾驶自动化全面普及时,媒体每天都有“今天某时某地北京市又共有10辆自动驾驶汽车误判红绿灯肇事”的报导。还有人要这种自动驾驶车吗?对于定位技术领域,情况也类似。根据上海交通大学的报告,使用人工智能识别方法,目前车道级定位技术只能做到90%左右的正确率[16]。

VI.问题分析

乘坐飞毯自由地到想去的地方,是人类许多世纪来的神话。技术发展到今天,用汽车自动驾驶来实现这个愿望,是近期人工智能和汽车业界认为可能实现的目标。如果这项技术成功付诸实现,除极少数人希望拥有私家车外,绝大多数人只需要像用Uber 或滴滴打车那样,随时随地招来一部自动驾驶的出租车,输入目的地,就可安全到达。私家车不要了,家里的车库不要了,商场街道上的停车场也不要了。乘客在旅途中可以把车辆作为继续工作、社交、娱乐或休息的场所。作者认为这是最近的未来人工智能可能给人类生活带来最大的变革。

这就是为什么,以中国为例,从2014开始资本大量进入这个领域。但是好景不长,大约3年之后,从2017年下半年开始,中国汽车自动驾驶圈已经开始感受到资本的阵阵寒意,企业融资难度加大,失败的企业激增[17]。发展至2019年,业界更有“自动驾驶进入资本寒冬”的说法传出。

 理由很简单,资本所关心的商业化落地的可能性与进程没有达到要求[18]。

从技术来说,工程师们把激光、雷达、通讯、测量和人工智能等最前沿技术引入这个领域,例如LIDAR,毫米波雷达,LTE-V2X,5G-V2X,DeepLearning,CNN,高精度地图,……, 等等等等。但是,为什么还不能解决商业化落地化的问题呢?作者认为,主流技术走上了负重前行的路线。

在前面的《I.本项目灵感的来源》中,我们提到了“学院派路线”和“简实路线”两条不同的技术路线。现在自动驾驶研发主流是走类似这个例子中的第一条路线,这在前述第III到V节中已经加以论述了。 

我们再举另外一个例子来说明。假设项目的目标是实现汽车制造的自动化。技术上有两条路线:第一条路线,研发万能的能自主行走机器人,识别并使用人类使用的扳手改锥焊枪手推车吊车等等工具,识别螺杆螺帽和各种汽车零件,利用几十年前就有的人工汽车装配车间的设备,让机器人在模仿工人组装汽车步骤的软件指挥下工作,准确地代替人类完成汽车安装;第二条路线,把几十年前就有的人工汽车装配车间改造成今天大多数现代化车厂的自动生产线,在该生产线的两边安装比万能的机器人简单的多的机械手,每个机械手完成一个简单的操作,最后在生产线的终端完成整车的自动安装。显然,正确并导致成功的是第二条路线。在这个例子中,自动驾驶研发主流也是走第一条路线。 

VII.解决方法

现在全世界的公路的交通控制设备都是为人类驾驶设计的,正如几十年前的汽车组装车间是为工人手工组装设计的一样。从上面描述的目前自动驾驶的红绿灯和其他交通标识的识别以及车道级定位方法来看,自动驾驶系统就像汽车自动生产的第一条路线的万能机器人。如果自动驾驶要走第二条路线,那就要彻底改造现有公路,使其适合自动驾驶,就像现代汽车自动生产线完全不同于旧式的人工汽车组装车间一样。

那么适合自动驾驶的公路设备应该是怎样的呢?总的一个原则是,道路要用车辆听得懂的语言直接和车辆说话,而不要用人工智能把人类听得懂的语言翻译成车辆听得懂的语言向车辆说话。也就是:直接向车辆传送能够无疑义地准确识别和定位的代码指令,代替现有的供人类识别的文字、图形或颜色等路边标识和为了定位需要的复杂和大量计算的高精度地图及车辆定位等原始数据。最直接的办法自然是用有源的(有电源的)代码指令发生器来向到来的车辆发送人类驾驶员须要识别的交通标识、指挥信号和定位信息的所有代码。但这实现起来太困难。举最简单的例子,我们不可能在每一小段的车道线标识上安装一个有源代码指令发生器,因为它是天文数字。所以,我们要分静态信息和动态信息两类来讨论。

静态信息指标示在路面和路旁的不随时间变化的交通标识,例如:车道线、直行或拐弯箭头、限速和让路停车标识、人行道标识等,也包括是哪一条车道,距离路边出口和交叉路口的距离,在隧道和立交桥处于第几层等定位信息。对这类标识和定位,我们要尽可能多地用无源的回波反射器(以下通称反射镜)来向到来的车辆发送指令。这个反射器应该就是一小块由金属或是其他材料制成的反射镜,安装在到来的车辆行进的车道(例如,在中线或边线)上,由安装在车辆的头、腹或尾部(或其他部位)的发射波(超声波、电磁波、光波、激光或其他波)照射后产生反射的回波。这个发射波只有固定一种(种类、频率、强度),但借助反射镜的尺寸、质材、形状或表面光洁度和平凹等不同,导致其辐射特性(频率、波形、峰值、宽度、波形积分等)不同,因而得到不同的回波

在绝大多数的路况,就足够使用了。当然,反射镜的排列,可以是1维度的,也可以是2维度的。

这种有源的发射和无源的反射系统在技术和构成上必须遵循如下原则:1. 有源的发射-接收器属于车载装置,成本不是考虑的中心。但无源的反射器,因为数量太大,成本一定要考虑。比如,车道线标识,考虑公路车道线上每5米就要安装1个(道路拐弯处可加大安装密度)。如果车道线标识放在车道中心,让自动驾驶的车道保持系统(LKA)保持车辆纵向中线与车道标识线一致,那么对双车道公路,就要2条车道中线的标识线。如果车道线标识放在车道边沿,让自动驾驶的车道保持系统保持车辆纵向中线与两边车道线标识线等距,那么对双车道公路,就要4条车道线标识线。所以,车道线标识放在车道中心要节省一些。即便如此,全球的公路如果都要改造,那么需要安装的车道线标识反射器就是天文数字。它只用一种最廉价的反射镜,不用编码组合,只用一个反射镜,例如,编码为“0”的反射镜。以现在的物价考虑,这种反射镜成本应该在200元人民币或30美元左右。编码为“0”到“4”的个共5单个反射镜用在出现频率最高一类的静态交通标识上;编码为“00”到“44”的共25个双反射镜组合用在出现频率中等一类的静态交通标识上;编码为“000”到“444”的共125个叁反射镜组合用在出现频率最低一类的静态交通标识上。2.在家庭、商店、机关单位建筑物的入口附近设有表示停车标识的反射镜。车辆到达目的地时,由“靠边停车”标识引导车辆到达停车点。同时,在不繁忙的路边,也可以设置停车点供没有服务的车辆停车,因为那时的大量停车场已被取消。3. 如果所有交通标识的反射器都要安装在各条车道路面(例如中线或边线)以方便发射-接收器工作,那么反射镜必须躲藏在不会被车轮触及的路面小凹洞里,车轮伤不到它,它也不妨碍车辆行走。4.大量安装这种反射镜,应考虑发明一种像插秧机的机器,在公路上自动安装。

在复杂程度不同的交叉路口,我们用不同编码的反射镜通知沿着本车道前来的车辆该车道对应的信息,我们以下称为“车道属性信息”。方法如下。

我们约定如下的车道属性符号的语义解释:

1.  直:直行车道;

2.  左:左拐车道;

3.  右:右拐车道;

4.  左/直:左拐兼直行车道;

5.  直/右:右拐兼直行车道;

6.  左pq: p是自然数1,2,3,…,q是①,②,③,…,p或q缺失时表示0(下同)。表示该车道是左拐车道,从该车道向右要跨越p条车道才能到达直行车道,从该车道向右要跨越q条车道才能到达右拐车道。例如:左1②,表示车道本身是左拐车道,如果要直行,需越过1个车道,如果要右拐,需越过2个车道。

7.  qp右:表示该车道是右拐车道,从该车道向左要跨越p条车道才能到达直行车道,从该车道向左要跨越q条车道才能到达左拐车道。例如:②1右,表示车道本身是右拐车道,如果要直行,需越过1个车道,如果要左拐,需越过2个车道。

8.  q1直q2: 表示该车道是直行车道,从该车道向左要跨越q1条车道才能到达左拐车道,从该车道向右要跨越q2条车道才能到达右拐车道。例如③直②,表示车道本身是直行车道,如果要左拐,需向左越过3个车道,如果要右拐,需向右越过2个车道。

9.  如果以上定义不能涵盖更加复杂的车道,还可以增加符号及其定义。

请看图3.

图3

对应图3的两条由南向北车道,我们可以有如下的表格: 

2车道情况:

同样道理我们可填写如下多个表格:

3车道情况:

5车道情况:

用同样的方法就可以定义任何车道数的交叉路口车道属性的符号。有了这些信息,控制系统就知道当前车道是否允许车辆运行规划中的下一步操作,如果不允许需要向左或向右跨越几个车道才能到达允许下一个操作的车道。指令直接且明确,不必查地图。也不必计算。

同样,在多层隧道和立交区域,我们也可以用设置在车道上代表隧道的-2,-1到0(地面),再到立交的第1,2,…, 5层的反射镜,来告知车辆所在的第几层。

此外,当我们把所有反射镜都安装在车道中线时,可以把指示车道中线和不同车道符号反射镜两个信息合二为一。我们在使用不同编码(即不同符号)的反射镜代表哪一条车道的同时,这些反射镜的位置又是该车道的中线。实际上,如果我们约定所有反射镜都准确地安装在车道中线上,那么,所有反射镜都可以按照其编码提供一个特定意义的指令,其位置又可代表车道中线的位置。同样道理,如果我们约定所有反射镜都准确地安装在车道边线上,那么,所有反射镜都可以按照其编码提供一个特定意义的指令,其位置又可代表车道边线的位置。当然,我们也可以把反射镜吊在各车道的正上空,这样最有利于扫描和信号接收,只是要加大成本。

对于远离城市的简单道路,如果使用车载的光学摄像及毫米波雷达图像处理可以获得车道中线(或边线)信息,在进一步提高软件性能保证满足在该路段自动驾驶安全要求的基础上,也可以不用反射镜方法。

以下讨论动态信息的交通标识。主要是指红绿灯、雨雪路滑、大风、前方道路拥挤等可能随时间变化的其他交通控制及警告信号。作者的方法是使用路边有源发送器把这些动态信息以电子指令的形式,以一定的频率向车辆发送。特别是,红绿灯有源指令发送器可以像上述的无源反射镜一样,直接安装在每一个车道,例如,车道中线上。红绿灯的电子指令发送器直接从交叉路口现有的信号灯系统接受信号,而不是用人工智能的识别方法从红绿灯的颜色得到(其他的动态信息也一样)。在距离交叉路口一定距离(比如100米)开始,车辆陆续接收该车道对应红绿灯的电子指令信号,并在到达交叉路口时依指令及其他命令协同执行。由于红绿灯的电子指令发送器安装在各个车道上,上面提到的多交通灯交叉路口产生的到底服从哪一个交通灯信号的问题就迎刃而解了。同时,即使公路上通常红绿灯信号机由于工程需要改变位置,在高精度地图的场合需要及时修正地图,在我们的场合,某车道的红绿灯信号直接来自安装在该车道的电子指令发送器,与公路上通常红绿灯信号机位置无关,所以像高精度地图的场合需要及时修正红绿灯地图位置的问题也就不存在了。由于这类动态信息的电子指令发射器的需求数量比上述静态信息的反射镜少好几个数量级,所以成本就不是最主要问题。

以上是“偏重硬件方式”(我们称为“方式1”)。

当然,为了降低大量硬件(反射镜)制作安装成本,对上述除定位和与位置有关的标识之外的所有静态(如限速)、动态交通标识和红绿灯等所有信号都采用有源的地面发射-车载接收的直接向车辆提供路边交通标识和指挥信号电子指令,也是一种选择。下面介绍这种“软硬件混合方式”(我们称为“方式2”)。

在路边每隔一定距离(特别是在限速等标识更改时)设置一个统一储存有该路段设置的所有静态(除定位和与位置有关的标识之外)、动态交通标识和红绿灯等所有交通控制信号形成的指令数据总表的发送装置,使用合适的物理波(如超声波、电磁波等等),以一定频率向前来的所有车辆发送这个指令数据总表,由车载接收器接收后,根据车辆自身的特点(车型、载重量、由从车道标识反射镜等硬件装置确认的车道,距离交叉路口的距离等等),从指令数据总表中选择适用本车辆的指令,传递给汽车自动驾驶单元。在复杂的交叉路口,不同的车道服从不同的红绿灯控制。由于车辆知晓自身处于那条车道,所以它能准确从数据总表中选择它必须服从的红绿灯信号。和“偏重硬件方式”一样,上面提到的多交通灯交叉路口产生的到底服从哪一个交通灯信号的问题就迎刃而解了。同时,即使公路上通常的红绿灯信号机由于工程需要改变位置,在高精度地图的场合需要及时修正地图,在我们的场合,某车道的红绿灯信号直接来自对应于该车道的红绿灯信号机,与公路上红绿灯信号机位置调整无关,所以像高精度地图的场合需要及时修正地图的问题也就不存在了。又由于在路边每隔一定距离,就有一个交通标识和控制信号形成的指令数据总表的发送装置,车辆在两个或几个这样的发送装置的有效发送范围内,就会形成信号的重叠或混淆。所以,每个数据总表必须带有该发送装置所在的路段编号,而车辆运行中可从导航地图中(或者从路边的“路段编号”反射镜中)获取的路段编号,选择与之相匹配的指令数据总表。

再有,左右车道有车要并入你的车道,司机驾驶时是在你的左右前方闪尾灯向你表示他的意图。在自动驾驶主流技术路线场合,也是要由感知系统去寻找和捕捉后由人工智能方法识别的。在简实路线场合,如果要求并线的车辆直接用V2V通信向自动车发送消息请你让他并入就可,不必使用人工智能“识别”方法。

最容易实现的具体实施方式应该是“软硬件混合方式”,即:所有的定位信息和与位置有关的信息,如车道线标识,车道属性标识及家庭、商店、机关单位门口的停车点标识采用无源的单个反射镜,而其他静态动态标识和控制信号采用交通标识和控制信号指令数据总表的发送装置,由车载接收装置接收后交驾驶控制单元处理。

如果我们考虑上述方式1和方式2都要用到上述的反射镜在同一种入射波之下,凭借其质材形状表面特征不同,必须至少能得到2种可区分的不同反射波,以便能用排列不同的反射镜得到不同编码,这是本文项目的研究课题的话,那么我们还有全部基于现成技术的“方式3”如下:1)需要天量设置的车道线标识采用无源的单片金属反射镜。车辆上用设置现有的毫米波雷达装置来定位它。2)除1)提到的车道线标识之外的所有静态动态标识和指挥信号,均采用由路边供电的有源的发射器向车辆发送各个路边标识特有的编码指令,而不是像“方式1”和“方式2”那样,用具有不同反射波特性的反射镜排列来形成不同的编码,再由车载的接收器接收后转化成编码指令。3)上面2)的方式,可以考虑采用路边供电的有源的主动式射频识别(RFID)方法来实现。例如,采用车载特高频(UHF)或微波频率和有效读取范围1-2米的射频识别读取装置,来从路边或路面的射频识别电子标签获取如车道属性之类的信息。当然,这种射频识别读取装置和电子标签必须是满足汽车自动驾驶正确率和寿命要求的。 

VIII.本文提出的技术在汽车自动驾驶全栈解决方法中的地位

典型的自动驾驶汽车的全栈解决方案分四个部分[19]。(1)通过道路网络规划路线。这一部分任务在采用本项目方法的基础上,用现在常用的GPS导航系统应该可以基本完成。(2)行为层,其决定将汽车推向目的地并遵守道路规则的局部驾驶任务。(3)运动规划模块选择通过环境的连续路径以完成局部导航任务。(4)控制系统实时地校正执行规划运动中的错误。本项目的方法主要应用在(2)中直接向车辆提供车道属性、路边交通标识静态及红绿灯等动态信息的电子指令,以使车辆在行驶中严格遵守道路规则,不负责对运动的车辆、行人及随机出现的障碍物的检测,故与(1)、(3)和(4)的任务无关。作者完全肯定人工智能和自动控制技术在(3)和(4)部分中的重要作用和目前取得的成果。

IX.  本文项目及技术可行性分析和项目初步规划

当前,自动驾驶的主流,国外,以特斯拉为代表的是尽量不去改造道路,着重使用摄像机积累天量数据,用于最先进的AI技术的识别、定位和驾驶决策的学习,以求提高技术的有效性。在国内,正孕育着全新的基础设施,(2018)阿里和百度等提出 “车路协同” 的概念,基于LTE-V2X 和 5G 带来的超视距感知能力和高可靠低延迟链路,可以把一部分感知和决策能力放在路端,利用边缘云的思路去解决环境和基础设施的问题[20]。最近,如长沙的智慧高速的智能路侧系统,每150米部署一处边缘感知,每450米部署一套边缘计算单元。加上云控平台,实现了智能汽车的云控数据交互,再加基于高精地图做到车道级的车辆运营状态监控;进行路网态势感知,融合互联网出行数据和道路实施监控数据,实现高速公路事件AI发布和推送[21]。再如杭绍甬智慧高速也是就是全程可感知、可预警、可管理。以致投资高达707 亿元,相当于每公里造价4.06 亿元,大约是普通高速公路造价的2.5倍[22]。尽管这些豪华的投资不完全用于自动驾驶,但和国外相似,自动驾驶选择了一条学院派路线。

所谓“项目可行性”是指作者提出的简实的技术路线,第一,是否有效?第二,是否有优越性?第三,技术上能否实现?对第一、第二两个问题,本文的第I到第V节实际上已经分析和回答了。第三个问题,从技术上说,最关键的是上文提到的车载发射波发生器、反射镜、反射波接收及处理。作者初步的考虑是可以从现有毫米波雷达作为切入点。因为处于毫米波波段的电磁波不会受到雨、雾、灰尘等常见的环境因素影响,因此,毫米波具有全天候的强抗干扰的探测性能。此外,在探测距离上,由于毫米波在大气中衰减弱,所以可以探测感知到更远的距离,中远程毫米波雷达可以达到250米的探测距离。因此,在高速行驶过程中,毫米波雷达能够更早地探测到本车道前方的各种反射镜。在制作工艺上,毫米波雷达具有体积小、重量轻、易集成等特性,容易安装在汽车上;在成本上,毫米波雷达的价格可以控制在千元左右。还有一个很好的特点,是毫米波可以穿透塑料,但对金属非常敏感。如果用不同金属作为反射镜,并把金属反射镜装置在塑料盒中埋在车道线上,反射镜就可以得到很好的保护。进一步的研究应放在提升毫米波雷达的测量分辨率和精确度上,特别是对不同金属的识别(以便用不同金属反射镜的排列形成编码)则成为当务之急。还有一个问题,是有人提到毫米波雷达不适合用于大雨天气,这也是一个要解决的问题。

其他地面上所有静态动态交通标识的指令数据总表的发送装置及车载接收和处理,应该可以在LTE-V2X的基础上解决。这些装置与其它全栈解决有关装置的配合,都没有现在技术解决不了的问题。例如,自动驾驶执行层,Tier1拥有体系化的底盘控制系统[17],我们简单购入他们的系统就可以了。

要强调的一点是,上面我们提出的简实路线方案,其目的不是否定主流路线,而是指出后者的问题,并为简实路线提出参与与主流路线比赛和竞争的理由和根据。我们初步规划用3年时间完成车载发射波发射器、反射镜、反射波接收及处理装置(即本文方法的核心装置),再用3年时间引进或研发躲避突然出现的静止或移动障碍物的其他模块,调试该核心装置与其他模块的协同工作。从第4年开始,我们就要在矿山这一类相对封闭区内落地我们的技术方案,以取得赢收来支持后续的研发。关键是我们要从政府管理部门获取一个试验区域,在该区域的道路中安装车道线标识,车道属性标识、停车标识等静态反射镜和红绿灯的动态指令发射装置,静态动态交通标识的指令数据总表的发送装置等等,同时配合其它模块的车载装置进行试验。在第7年开始的3年,扩大试验区,建设一个10横10纵的封闭性实验公路网,放置100台L5级自动驾驶实验车,昼夜24小时做随机的运行,其中夹杂释放若干牲口或机器人进入公路干扰实验车运行,用3年时间发现和解决所有问题。到第10年,对外公开展览一年。(由于采取本文的方法要对全球公路进行改造工程,怀疑和反对一定存在。只有看到长时间公开展览的成功,才能说服人们相信这条简实的技术路线是成功之道。)

项目经费预算,尚在估计之中。但项目成功之后,由于本文核心装置的生产、销售、特别是公路改造工程的技术专利都在项目的所有者手中,后继的收益当在千亿元以上。

现代化公路是历经近百年积累而建成的。如果按本文提供的方法改造,在经济上是否可行?在此作者提供一组简单数据。中国全国公路共500万公里;美国全国公路共665万公里(2015);全球公路共6500万公里(2013)。以双车道(应该占大多数)来估计:每车道每5米安装1个车道线标识单反射镜,1公里公路要安装400个。按上述每个反射镜200元计算,共需8万人民币。加上比车道线标识反射镜少得多的其他静态动态信息装置和工程费用,每公里100万人民币应该足够。中国500万公里公路共需5万亿人民币。以2019中国GDP为99万亿计算,大约是全国1年GDP的1/20。把这个算法用到美国公路总数和GDP总数,以上费用也大约是美国1年GDP的1/20。如果分10年完成这种公路改造工程,那费用就是1年GDP的1/200。对中国来说,就是每年5000亿人民币。而根据[18],中国从2016到2019每年在汽车自动驾驶产业上的投入分别是6014、9938、8528和5940亿,都是高出5000亿人民币。

中国自动驾驶主流技术的最新展示应该是最近百度在北京进行的自动驾驶出租车Apollo GO实验,如下图。据一位业内人士粗略计算,此次搭载在Apollo GO 林肯MKZ上的自动驾驶设

图4

备包括一个激光雷达、10个摄像头、两个毫米波雷达、以及两个惯性导航、一个主机、一个控制器以及一个工控机等,再加上车辆成本,总计改装成本约百万元。经济观察网记者报告说[23],虽然行驶过程较为流畅但具体体验感并不算好。原因一是后备箱内装有工控机,它工作时声音较大,因此车内会有噪音;二是车辆到了固定停车点后,仅仅就是停在停车点,缺少对基于路况判断的随机应变方案。记者还说,此次实验,共有13个体验点可供选择,主要集中在大兴区、海淀区等几个距离市中心较远的区域,且附近没有地铁站与其他主要交通枢纽。这些区域的路况相对简单,周边几乎都是工厂、无复杂交通情况、路面宽、车流和人流量都相对主城区要少很多。记者上车后,坐在了后座,而安全员坐在主驾。据安全员介绍,他全程不参与车辆操作,只是负责在必要的时候对车辆进行接管。这种简单路况和安全员坐在主驾随时准备接管的条件,应该是自动驾驶的L3级吧。这样的自动驾驶车辆成本已经到了一百万元。那么,如果将来上升到L5级呢?就算由于量产和装备费用逐年下降与装备水平提高相抵消,将来L5自动驾驶车辆的售价也以100万人民币计算,那么购买500万辆L5自动驾驶车辆的费用是5万亿人民币。如上所述,截止2019年7月,北京机动车保有量621万辆。假设以后L5自动驾驶车辆普遍使用,由于大部分人不必要自家私车,全北京拥有500万辆L5自动驾驶车辆已经满足要求,那么其总价格正好是上面预算的中国500万公里公路采用本文的简实方案所需的5万亿人民币投资(一切都以现在的物价、车辆拥有数和公路总公里数来计算)。

也就是说,用一个北京市的车辆的投资,可换来全国所有公路适合自动驾驶简实方案的改造,使得全国自动驾驶车辆,想象是1亿辆吧(2020年上半年全国机动车保有量达3.6亿辆[24]),可以用比现在普通车稍高一点的价格来购置,因为自动驾驶简实方案只要求路面反射镜的读取和处理装置,无需高级激光雷达高精度地图和复杂计算设备。就算每辆40万元,相对现在每辆100万也是60万亿(中国去年GDP的一半以上)的节省呀!而这还没有计算主流技术路线要求的5G通信、边缘计算和高精度地图等车载设备之外的路面和后勤的庞大支出。

从收益上来说,如果本项目方法10年之后实现,开始全面推广,将得到的是绝大多数家庭的车库、几乎全部商店、街道和公共场所的停车场被解放;每年国家GDP增长0.5%;全球交通事故死亡率减低几十倍;最重要的是人类终于进入了汽车自动驾驶的时代!

后语

1. 自动驾驶是人类交通史上的一次重大革命。它不但要靠整车的电子和机械设备软硬件的全新设计,更要靠道路的重大改造来配合才能完成。

2.  目前自动驾驶的学院派技术路线是一条重负越来越大而到最终可能不可承受的技术路线。因为如果按现在主流技术提供的自动驾驶车,需要配置了GPS、摄像头、雷达和激光雷达等传感器,每天将产生约4TB待处理的传感器数据。实现自动驾驶,到底需要多少算力?实现L3级别的自动驾驶,也许需要2TOPS,也有可能是需要20TOPS,真的没有人说得清楚。而且,这还只是L3级别,真的进入L4 L5级别,算力的要求势必将呈现出几何级的上升。如此巨大的数据量必须有强大的计算设备来支撑。如果我们打开现阶段进行展示或者测试的自动驾驶汽车的后备箱,都会发现有一个很大的“计算平台”,他还需要强大的冷却装置[25]。目前这种L3级的车,在中国是100万人民币,在西方国家是20万美金(2018)左右。可见,全自动驾驶困难重重,除技术外「成本」仍是最大障碍。此外,鉴于人们对商业模式的担忧,人工监控自动驾驶汽车以确保安全的遥控操作,可能成为一项「不可忽视的」成本。在旧金山,由于远程操作、许可证、保险、维护和其他系统的支出,自动驾驶出租车将难以在成本上保持竞争力[26]。原本现代城市的私车,绝大多数情况是为1个人(少数时间是2人或多人)之出行工具,现在要把它变成配备多种昂贵传感器和巨大的计算平台的“大花轿”;再配上在路两边,“车路协同”的传感器、边缘计算站、云端设备、5G基站等等的每公里亿元级投资的“迎亲队”!这种气势使得Waymo首席执行官约翰·克拉夫奇克(JohnKrafcik)表示,自动驾驶汽车可能永远无法在全路况条件下行驶[27], 也使得苹果联合创始人沃兹感叹:我有生之年难以实现全自动驾驶 [28]。

3.  有报导说:“当单车智能逐渐走向瓶颈期间,车路协同方案正在中国慢慢获得越来越多的关注,成为实现自动驾驶的重要技术路线。而且由于5G的发展、中国通讯行业的基础设施情况,加上政府以及企业的参与,这条技术路线正在显现出越来越清晰的演进路线,并且让自动驾驶有可能在中国加速落地”[29]。把自动驾驶的负重从车分一部分给路的思路是对的。但如果感知决策控制仍然走学院派的技术路线,效果非常有限。只要看看长沙的智慧高速的智能路侧系统配置[21],看看杭绍甬智慧高速投资达普通高速公路造价的2.5倍[22]就可以明白。如果真的想自动驾驶在中国加速落地,就要走简实路线。

4.  简实路线的最核心思想,就是尽量利用路边(或路面)设备(包括V2X)直接向车辆提供红绿灯、限速等动态静态路边标识的指令,代替用人工智能的识别方法去取得;提供车道线,车辆所在车道及其左右拐直行等信息,代替高精度地图、高精度定位的复杂查图等计算。

5.  在自动驾驶中,不管什么路线都要遇到的问题是:行车过程中突然在近距离出现的物体。在我们建议的把行人和车辆隔离在两个世界的情况下,不可能有人类或动物突然出现,最多的情况就是失控暴走的车辆。这种情况下如果我们的系统能做到所有自动驾驶车辆能以最快速度刹车,在碰撞之前获得短距离,比如说0.2米的距离停车,那么,自动驾驶的事故率,比起现在全球范围内每年车祸事故造成140万人死亡(等于到今天为止全球新冠病毒死亡人数。每天近4千人),自动驾驶技术承诺会消除94%由人为失误造成的车祸。从这个角度来看,自动驾驶汽车可能成为与新冠病毒疫苗、青霉素和天花疫苗齐名的救命创新。有人计算过:自动驾驶汽车有朝一日将每天拯救3000条生命[30]。

6. 乍看起来,我们提出的简单实路线要求在所有公路上开膛破肚安装“反射镜”似乎不可思议,但看看我们在路上面改造的每公里预算(百万人民币)与目前主流“车路协同”试点的投资(上亿人民币)相比,再加上可以像马斯克说的:“无人车应该丢掉激光雷达这个拐杖”[31],丢掉高精度地图、高精度定位,还有只用到LTE而不必劳驾5G的V2X,那么人类就有望轻装上阵完成自动驾驶的征途。

 

【参考文献】

[1]《英国自动与电动汽车法案》评述:自动驾驶汽车保险和责任规则的革新 

http://zhicar.blogchina.com/572416060.html

[2]特写|美国无人驾驶十五年:战争、背叛与谷歌往事

http://zhicar.blogchina.com/679300232.html

[3]【红刊财经】自动驾驶步入蓝海机会仍在龙头公司——专访硅谷数据科学家傅周通

http://zhicar.blogchina.com/941448756.html

[4] 杨学志: https://www.iyiou.com/p/93766.html

[5]美国GPS卫星精度0.4米,俄格洛纳斯10米,中国北斗呢?https://zhuanlan.zhihu.com/p/216514843

[6]  众包制图是绘制高精地图的灵丹妙药吗?

https://www.d1ev.com/kol/81666

[7]高精地图市场的「世纪难题」:成也众包,败也众包https://zhuanlan.zhihu.com/p/53583137

[8] https://www.zhihu.com/question/28288064

[9] 基于气压传感的车辆导航系统

https://patents.google.com/patent/CN105180950A/z

[10]汽车自主导航终端及其判断汽车是否在高架道路上行驶的方法(专利)https://patents.google.com/patent/CN1702431A/zh

[11] 立体交通导航方法和装置

https://patents.google.com/patent/CN101441262B/zh

[12] 自动驾驶发展与关键技术综述

https://new.qq.com/omn/20190604/20190604A0JJYB.html

[13] 特斯拉自动驾驶新能力:识别红绿灯停车标识

https://tech.sina.cn/csj/2020-04-26/doc-iircuyvh9883181.d.html?from=wap

[14] 特斯拉自动等红灯功能升级 可自己过十字路口

https://zhidx.com/p/219139.html

[15] 北京机动车保有量达621万辆

http://www.xinhuanet.com/local/2019-07/27/c_1124804598.htm

[16] 基于视觉和毫米波雷达的车道级定位方法

https://www.sohu.com/a/224987096_465591

[17]自动驾驶的2019:创企关停/巨头受挫 除了满屏尴尬还有啥?

https://zhidao.baidu.com/question/925163743268075699.html?fr=iks&word=%B1%B1%BE%A9%CA%D0%C6%FB%B3%B5%D7%D4%B6%AF%BC%DD%CA%BB%D1%D0%B7%A2%C7%E9%BF%F6&ie=gbk

[18] 2020-2023中国高等级自动驾驶产业发展趋势研究

2020年04月06日 新浪财经-自媒体综合

https://finance.sina.com.cn/stock/stockzmt/2020-04-06/doc-iimxyqwa5382413.shtml

[19]城市道路自动驾驶车辆运动规划和控制技术综述https://blog.csdn.net/hgdwdtt/article/details/82052577 

[20] 万字长文回顾智能驾驶进化史

http://zhicar.blogchina.com/538925603.html

[21]长沙建成全国首条支持自动驾驶的智慧高速https://mp.weixin.qq.com/s/rN3mKDBFi48FMGWaIVDhqQ

[22]投资707亿的超级高速长啥样?自动驾驶车随意跑,今年6月底开建https://www.d1ev.com/kol/116169?bsh_bid=5547128918

[23]等待半小时、被三次取消订单,百度无人驾驶出租车初体验香吗?http://m.eeo.com.cn/2020/1016/422298.shtml

[24]2020年上半年全国机动车保有量达3.6亿辆http://www.gov.cn/xinwen/2020-07/18/content_5528056.htm

[25] 自动驾驶的发展瓶颈:从万人追捧到寒冬降临

 http://zhicar.blogchina.com/721381504.html

[26] MIT最新报告:完全无人驾驶仍需10年,马斯克:特斯拉已经实现

http://zhicar.blogchina.com/729511567.html

[27]吴恩达团队盘点2019AI大势:自动驾驶寒冬、

http://zhicar.blogchina.com/687954581.html

[28]苹果联合创始人沃兹:我有生之年难以实现全自动驾驶

http://zhicar.blogchina.com/721310337.html

[29]基于车路协同,落地中国的自动驾驶方案

http://zhicar.blogchina.com/805263504.html

[30]特斯拉Autopilot将救人无数 但现在却拿命做测试

http://zhicar.blogchina.com/553812104.html

[31] 马斯克:无人车应该丢掉激光雷达这个拐杖

http://zhicar.blogchina.com/868113974.html

[32] 无人驾驶技术入门(十)|看不见的“传感器”高精度地图

https://zhuanlan.zhihu.com/p/37885573

[33] 世界上最复杂的7大立交桥,第一在中国,路痴进去就出不来了!

https://kuaibao.qq.com/s/20180123A05OE400?refer=spider

 


 
最新文章
相关阅读