我想买辆车,不用我开的那种!(技术篇)——AI报告解读(四)

浏览: 时间:2020-01-08

自动驾驶是人工智能最有前途的应用之一,也是目前复杂度最高的应用。自动驾驶的分享分三个部分:应用情况、技术简介、由无人驾驶溢出的机会。

技术简介:包含自动化驾驶的主要技术,这部分只包含技术所需解决的问题,未包含技术方案的介绍。此外还介绍了这个领域主要的派系分歧和挑战。

技术部分很长、很难啃,但是你还是可以花点时间了解一下——因为,未来你可能在很多地方会遇到这些技术,了解一点背景,你会把它们用的更好。


1、基本过程

自动驾驶是要给非常复杂的系统,所以接下来的技术简介也比较长。

 

自动驾驶的基本运行过程,是感知》决策》执行的循环。

042

自动驾驶基本运行过程

 

2、感知,是让车“看到”

043


传感器获取信息。自动驾驶汽车对自身位置和方向、速度的感知,对道路、环境、邻车、行人、障碍物等的感知,大部分是由车辆上安装的传感器提供的、车辆视角的信息。

自动驾驶汽车的成本构成,主要就是传感器。一辆L4自动驾驶汽车上,少则有30个传感器,多的可以到50个。即使不特别考虑安全性,只在实验室实现基本功能,传感器的成本都在2万美金以上。目前投入路测的自动驾驶汽车,造价大多在1~2百万人民币以上,其中仅仅一个激光雷达的价格就可以高达8万美金。

因此,传感器的成本,是自动驾驶技术应用的限制要素之一。

图片

百度自动驾驶汽车

 

网联获取信息。自动驾驶汽车地图、天气、对邻车驾驶意图、前方施工/学校放学等异常路况、十字路口左右侧盲区的车辆和行人等的感知,是从网络联接上获得的、上帝视角的信息

自动驾驶汽车如果能够获得和处理足够的网联信信,会有3个好处:

1、  自动驾驶车辆的传感器可以降低配置、控制价格,推进商用的进程;

2、  可以解决汽车对气候、时间等环境的适应性问题,尽早实现L5自动驾驶;

3、  上帝视角能够帮助车辆提前规划路径、规避风险,使自动驾驶更智能。

因此,有些学者提出了以“网联智能为重心发展自动驾驶”。网联智能虽然有上述好处,但问题也同样明显,后面会专门讨论。

 

信息预处理。几十个传感器,并不是每个传感器、全部时间的、所有信息,都对后续的决策环节有用,需要进行预处理,减少信息冗余和噪音

比如一个小石子从车前20米飞过去,雷达会检测到,但这个障碍物只存在于一、两帧的扫描数据里,并不需要车辆对此做出什么反应,这就属于噪音,需要通过预处理去除。

比如负责观察行人、车辆、障碍物的摄像头抓取的信息,只有物体的轮廓、色彩、纹理等信息对后续的识别和决策有作用,预处理就需要先完成提取甚至标记的工作。

现在,信息预处理主要使用深度学习方法实现。

 

信息在时空维度融合。几十个传感器,每个安装的位置、角度都不同,抓取信息的频率、时间也不一样。

图片

图片来自:新浪科技

 

路边安全岛上的一个行人,可能好几个传感器都扫描到了他的部分信息,雷达知道他的准确位置和行动轨迹、摄像头知道他的一切外观特征。想要准确认知这是一个人,他的准确位置在哪里,行动轨迹和意图如何,就需要把所有传感器的信息进行融合

信息融合需要把所有传感器的信息,在时间和空间坐标上进行统一化处理,最后输出目标对象3D、多维度的、完整的信息。

现在,信息融合也主要使用深度学习方法实现。

044

感知层做了什么

 

3、决策,是让车自主的判断“发生了什么”,并决定“怎么做”

045

现在决策环节的功能,底层都是深度学习技术。

 

道路、环境识别。这是自动驾驶进行自主决策的基础。

自动驾驶车辆需要一直到L4级,都对道路类别、气候、路况、时间等有使用条件的限制,自动驾驶车辆必须能够自行判断当前是否满足条件,防止自动驾驶被错误启动。

自动驾驶车辆想准确的知道“我在哪”,需要把感知信息和高精地图进行匹配。比如根据车道线和路标、建筑物等,知道自己在哪个路段的哪个车道(精确到厘米)。

 

行人、车辆、障碍物的识别、跟踪和行为预测。这是自动驾驶进行自主决策的主要依据。

车辆需要在行驶的过程中时刻判断“周围正在发生什么”。需要识别所有的行人、机动车、非机动车、动物、固定/不固定障碍物等,一切有可能出现的物体。跟踪每一个对象的运动轨迹,并根据轨迹、对象的类别、道路和环境、其他对象等信息,预测对象接下来行为。比如:雨夜,识别一个人在人行道上,一路跑到一个没有红绿灯的路口,目前道路上车辆稀少,本车离路口还有20米,就可以预测:有很大概率此人会直接跑过路口。

*道路、环境识别;行人、车辆、障碍物的识别、跟踪和行为预测——这是自动驾驶这一波发展中,技术更新最快的分支。随着摄像头获取图像的细节越来越丰富,甚至可以根据光影的细微变化,“看见”物体背后的物体,比如被相邻车道车辆遮挡的行人

046

 自动驾驶感知&决策

 

本车行为认知。自动驾驶需要判断自己“正在做什么”。比如,在哪里、以什么样的速度在行驶,车身姿态是否正常没有侧倾,(没有GPS信号的时候)刚刚跑了多少里程,如果维持现状接下来车辆会怎么运动等。

 

基于感知地图的定位和自主导航。这是自动驾驶的常规决策内容。

现在的人工驾驶中,导航的作用主要是做出发点到目的地的总体路径规划。

自动驾驶的导航则精细的多,需要知道每一秒钟车辆应该在哪条路的哪个车道行驶,车速应该是多少等。

047

感知地图

 

现在的普通车载或APP导航,使用的是GPS地图,地图提供道路轮廓、车道、道路类别、限速等信息,结合卫星定位系统,车辆可以知道自己的位置,定位的误差可以在3~5米之内。这就是为什么有时车辆行驶过程中,导航会询问“目前是否行驶在辅道”。这样的精度用在自动驾驶是不够的。

自动驾驶需要的是高精地图,这个地图上除了GPS信息,还有车道形状、方向、道路部件、道路类别、限速等整体信息,还包含道路的坡度、曲率、铺设材质等信息,以及车道线类型、车道宽度、路边地标、防护栏、道路边缘类型等详细数据,甚至还有拥堵、施工、交通事故等动态交通信息。

自动驾驶的定位,简单一些理解,是在GPS定位的基础上,再用“看到”的路标、建筑等的角度、距离等信息,在高精地图上“查”出精确的车辆定位信息,这个定位精确到了厘米级。

048

高精地图,图片来源:宽凳科技

 

自动驾驶汽车有了精确的定位,再加上对道路上其他交通参与者、障碍物、交通事件的认知,以及发点到目的地的总体路径规划,就可以决策是否应该变换车道、减速或加速了。

 

异常情况的紧急决策。这是自动驾驶应付突发异常的决策内容。

自动驾驶汽车按照既定规划把乘客送到目的地,这个功能的实现虽然复杂,但只实现了车辆的20%不到的功能。

自动驾驶绝大部分的功能,都是在处理各种突发、异常的情况,车辆的驾驶策略需要确保无论出现什么状况,都能保障所有人员的安全。自动驾驶的硬件成本,研发、路测等工作的成本,超过80%都花在了安全性的提升上。

自动驾驶对时延近乎严苛的要求,也是处于安全的需要。如果检测到前方有物体,到识别是行人,最后决策需要紧急刹车,这中间每多0.1秒的时间,车辆就会多跑出去了接近2米,事故的风险会大很多。

自动驾驶对时延(从异常出现到开始采取动作)的要求是0.2秒以内,相当于一个熟练司机的正常反应时间。

 

图片

决策层做了什么

 

4、执行,是让车辆按照决策结果行动

049


执行机构需要重新设计。车辆最基础的执行机构包括动力、制动、转向三个系统,让车辆根据需要加速、减速、转向

传统汽车这三个基础控制的动力来源是人力,是由人根据经验施加不同大小的力,实现精确的转向、加减速控制。

自动驾驶这三个基础控制的动力来源是电机等机电装置,需要重新适配和设计。这部分的设计直接决定了自动驾驶车辆操控的灵活性、连续性、准确性,这些决定了自动驾驶车辆的舒适性。

自动驾驶的执行机构虽然需要重新设计,但功能实现主要是非常细致、繁琐的实验、调整过程,整车厂之前的造车技术和经验尚可以继承。执行层全新的挑战,主要在安全性。

 

“绝对”安全的挑战。机动车的安全性要求是“7个9”——连续行驶116天中,允许有1秒钟车辆处于失控状态,而这1秒中足够车辆跑出去10~20米——换成里程大约是每行驶16~33万公里,允许有1秒的时间,系统无法控制车辆。这几乎是一个绝对安全的要求,现在自动驾驶的最高水平,和这个要求都还有数量级上的差距。

 

动力、制动、转向这三个系统中的任何一个一旦失效,都会直接导致车辆失控。为了达到安全性要求,这三个系统每个都有2~4个冗余备份的设计。

以制动系统为例,制动控制器、ESP(车身稳定系统)、电子手刹是制动系统的一种冗余设计方案。

当制动控制器整体失效,相当于踩刹车没反应,这时电子手刹就是备份方案。

当制动控制器部分失效,相当于有个别轮子没刹住,这时ESP就会通过重新分配制动力、降低电机动力等方式,实现车辆的稳定控制和刹车。

 

对于车辆这种复杂系统,冗余除了带来更高的可靠性(在汽车行业表现为安全性),也带来了数倍的复杂性。如果处理不好,冗余可能反而降低可靠性。

还是以制动系统为例,在无需制动的时候,如果由于软件故障、环境扰动、局部误判等原因,错误的启动了ESP(车身稳定系统)、电子手刹,车辆会直接陷入失控状态,非常危险。

决策层和执行层各冗余系统之间的配合,是自动驾驶汽车的挑战之一。

 

执行机构的技术迭代。这两年随着ADAS的应用,执行机构各系统的技术迭代也比较快。

自动泊车系统(APS)、车道保持系统(LKS)等的应用,推动转向系统迭代:

图片

自适应巡航系统(ACC)、主动紧急制动(AEB)等的应用,推动制动系统迭代:

图片


图片

执行层做了什么


5、自动驾驶功能小结

自动驾驶本身并不是一个新概念,早在上世纪60年代,通用汽车就推出了自动驾驶概念车。它之所以在现在成为可能,主要是几个基础条件的变化:

1、  传感器的成熟,使车辆能够获得自动驾驶所需的完整信息。

2、  深度学习解决了感知和感知信息处理、智能决策的问题。

3、  电动汽车、电子控制器的成熟,降低了车辆控制的难度。

 

自动驾驶的关键技术包含:

  • 感知到认知。把传感器的价格控制在可接受的范围,用传感器获得的丰富数据,形成对车辆运行的近、中、远距离中,所有交通参与者、道路、环境的认知。

  • 高精地图。这是自动驾驶实现厘米级精确定位的基础,也是一个“打呆仗”的力气活。

  • 驾驶策略。驾驶策略是安全的保障,但这不仅仅是一个技术问题,更是一个伦理和法规的问题。

 

自动驾驶的挑战,一言以蔽之:用民用产品的价格、在民用产品的开放性使用环境中,达到远超民用的安全性标准。


6、线路之争——单车智能 vs网联智能

自动驾驶从早期定义,到近几年成为技术热点,一直都只有单车智能,从网络侧获取信息只是补充。去年以来,随着5G标准的确定,以及各国开始加大5G网络的建设,网联智能开始作为自动驾驶的线路之一被摆上了桌面。

图片

单车智能 vs 网联智能

 

  • 基本观点:自动驾驶必然是“单车智能+网联智能”,因此,这两个线路之争,事实上是对整个系统主导权的判断,而不是二选一。

  • 核心技术&投资重点:两个线路依赖的技术也几乎一样,只是对不同的技术依赖程度不同,因此发展和投资的优先级选择有所不同。

  • 前提:

  • 单车智能认为,车辆自始至终都是在各种开放道路上行驶,L2~L5的区别只是自动化的程度不同,道路上始终都会有人工驾驶的车辆,以及其他各种物体和障碍物。

  • 网联智能认为,L5只在理想中存在,非常长的时间(以百年为尺度)内,自动驾驶只在城市的社区、商区、景区、校区、园区、市区比较有价值,其他区域、城市以外,需要维持人工驾驶。而在这些区域,政府能够协调社会的各种资源,包含市政规划、交通管理、市政建设、网络服务提供商、车企等,一起遵循统一的、为自动驾驶制定的规范,共同建设适合自动驾驶的道路环境。

  • 优势:

  • 单车智能线路下,无论是最终的自动驾驶,还是过程中的辅助驾驶、有条件自动驾驶,车厂推出的一款车型都可以参与全球竞争,不受当地网络建设水平、道路智能化水平的限制。车企和科技企业可以自主发展。不依赖外部条件,自己选择技术路线、选择生态、自主发展。因为现在的电信网络事实上还无法做到全球通用,每个国家在频段选择、优先覆盖区域、服务质量上的选择都不同,因此,只利用不依赖网络,是更多车企选择。

  • 网联智能下,网络实现自动驾驶所需的大部分感知、决策能力,车辆只需要从网络侧获取加工后的信息,再补充少量车辆视角的信息,就可以实现自动驾驶。所需的开发工作量减少,短期就可以落地。一些成本特别高的传感器安装到了道路上,运算量大的计算放到云端,单点投资可以为更多车辆提供服务,一次性投入虽然大,但长期综合成本比较低。

  • 挑战:

  • 单车智能的挑战,首先是成本高,不仅是研发、路测阶段需要投入巨大的成本,量产以后生产单个产品的边际成本也较高。其次,L4级自动驾驶路测的复杂性超出预期,商用仍遥遥无期。

  • 网联智能的挑战,首先是安全性的技术难度被低估。网联方案中感知、决策的各个部分之间依赖网络通信,5G虽然有高带宽、低时延的优点,但互联网的架构总的说来对带宽和时延没有保障。而且网联系统中节点数量和类型众多,这些对自动驾驶的安全性都是巨大的挑战,很可能需要从网络架构开始重新设计自动驾驶的网联方案。其次,在网联方案中,单车仍需自行处理紧急状况,单车成本和技术门槛降低的比较有限。

  • 掣肘:

  • 单车智能目前尚在技术爬坡期,当技术问题被解决之后,很可能会被伦理和法规问题困扰,比如:刹车失灵时,是由车主承担风险找一个固定障碍物撞上去?还是由路人承担风险,找个上坡路段开过去?

  • 网联智能的掣肘则近在眼前,目前V2X并没有完整、统一的规范体系。

 

*车路协同(V2X)。V2X包含车与车、车与交通设施、车与人、车与云端服务平台的联接。自动驾驶通过V2X获得路面、交通参与者、环境等方面,可视范围以外的信息。

V2X可以让车辆提前预知行驶路段的高发风险,提前采取措施防范风险。V2X可以让车辆根据几公里范围内的交通状况,进行线路选择和车速控制,使道路通行更有效率。V2X还可以为车辆提供其他远程的增值服务。

 

图片
HUI观点

HUI本人认为,未来的很长时间,自动驾驶的技术发展都将以单车智能为主,网联为辅。作为一个用户,买车的目的是两个:工作日通勤&节假日扩大活动范围。过多的使用路段限制,会严重打击我对自动驾驶的付费意愿。就像5G网络没有达到一定覆盖,很难撬动大部分人换机一样。

图片


7、线路之争——视觉主导 vs激光雷达主导

在感知层的传感器应用上,存在视觉主导和激光雷达主导的线路之争。小HUI没有现场聆听过两派观点的争论,这个话题只能粗略介绍。

 

都是对多种传感器的不同组合。

两条线路都用到了摄像头、激光雷达(特斯拉甚至连低成本激光雷达都不用)、毫米波雷达、超声波雷达等主要的传感器。不同的是把主要的投资放在哪里

图片

自动驾驶使用的传感器

 

激光雷达主导,因为雷达会直接输出高精度的3D模型,主要投资放在雷达硬件就好,对摄像头精度和图像处理的要求比较低。

视觉主导,依赖摄像头抓取的图像,分析得到主要的距离、角度、轮廓、色彩、纹理等完整信息,主要投资放在计算机视觉的实现上。

激光雷达主导的方案,量产以后生产单个产品的边际成本较高,但现阶段难度较小。

视觉主导方案一旦成熟,量产以后的边际成本几乎没有,但是现阶段难度非常大。

两个方案谁能胜出,最后可能是制造成本的竞赛

 

争夺的主要是中、远距离感知的主导权。

30~50米内的近距离感知,主要由毫米波雷达、超声波雷达与摄像头配合,这个范围内的传感器方案没有多少歧义。

30~150米的中距离,以及100米以上的远距离感知,激光雷达、毫米波雷达、摄像头各有优势。短时间内,谁也无法完全替代谁。

*近、中、远距离的量化划分,没有公认的标准,这里只是为了形成感性认知采用了一种划分。

图片

激光雷达、毫米波雷达、摄像头优势对比


图片
HUI观点

虽然从功能上看,视觉主导和激光雷达主导,二者是势均力敌的关系。但是目前自动驾驶有一个重要的工作:搜集尽可能多的实际道路数据,用于在实验室训练自动驾驶系统,因为路测的成本太高、风险太大。

高精度摄像头+毫米波雷达的方案,因为成本足够低,除了可以在路测车辆上搭载,也可以在正式发布的商用车型上安装,获取实际道路数据的效率更高。同时,这个方案获取的信息足够完整,损失和失真非常小,能够让实验室训练的仿真程度大大提高。

所以小HUI认为,无论当前的商用侧重哪个线路,都不应该放弃视觉方案的研发。


图片

8、路测结果

自动驾驶车辆不仅自身是一个复杂系统,它的工作环境也是开放的,这意味着自动驾驶最终上市前,必须在真实环境中对可能的情况进行驾驶安全的验证。

目前通行的做法,政府设置专门的自动驾驶试验场。有些试验场是封闭的,可以在不危害其他交通参与者的前提下做早期产品的测试,或者测试特定场景、危险场景。有些试验场是特定区域的城市公共道路,用于测试真实环境中的功能和安全性。

在城市公共道路的路测,目前投入的都是L2(车上有安全员)自动驾驶车辆。

 

自动驾驶试验场最多的国家是美国和中国,美国已经建成60多座试验场,包含模拟驾驶、封闭试验区、半封闭城区、开放城区、交通走廊各种形态。中国建成和在建20多座,以封闭试验区、半封闭城区为主。

 

各家公司自动驾驶的技术对比,看的是路测结果。主要包括:

1、  场景覆盖率。在试验场中完成了哪些道路条件、危险情况、安全驾驶行为的路测。比如通过人行道、学校路段、坡道起停等。

2、  路测里程。考察的是完成路测的量,里程越高,意味着对路面各种情况的覆盖越成熟。

3、  人工接管前里程(MPI)。考察的是平均自动驾驶多少公里,需要人工接管一次。这是自动驾驶最重要的指标,越高距离商用越近。

 

自动驾驶有科技企业、传统车企、造车新势力三个阵营。

图片

自动驾驶竞争力排名(NavigantResearch,美国)

 

科技企业起步较早,上路测试的里程、积累的路面数据都更多。

科技企业中技术最成熟的是谷歌。从2009年发布Waymo至今,已经完成了2000万公里的路测,为10万人次提供了出租车服务。从美国加州的测试数据看,Waymo的车辆每行驶17000+公里才需要人工接管一次,应该可以比较快跨越到L3自动驾驶。

 

国内自动驾驶的龙头是百度,目前已经完成200万公里的路测,从北京市发布的路测结果看,MPI(人工接管前里程)评分比Waymo低很多,安全性还有比较大提升空间。

国内科技企业中,小马智行在美国加州和中国北京的路测中,MPI上的表现是最好的,但和Waymo仍有数量级上的差距。

 

科技企业虽然自动驾驶技术更领先,但自动驾驶的主体是汽车,绝大部分自动驾驶科技企业,必须寻求与传统车企的合作,才能打通最后的汽车控制部分,使自动驾驶真正落地。

 

传统车企在自动驾驶方面相对保守,但也早已通过收购、合作开始了自动驾驶的探索和实验。今年,凯迪拉克、沃尔沃、尼桑、宝马、奔驰等都发布了L2级自动驾驶的量产车型。

在自动驾驶上,国内车企和国际车企有3~5年的差距,一汽、上汽、金龙等基本上是选择和科技企业合作,目前都在早期路测阶段,测试结果还不理想。

 

造车新势力,特斯拉、蔚来汽车等,无论是从自动驾驶的功能完整性,还是可靠性/安全性上,目前都还落后于主流科技企业和传统车企,属于第三梯队。

 

9、道路长且阻

美国智库兰德公司 2016 年的一份报告认为:一辆自动驾驶汽车需要积累约200亿公里的路测数据才能验证其安全性。路测过程中,平均16~33万公里发生一次人工接管,才算满足汽车安全性的要求

从这个标准看,无论哪个阵营,离L4自动驾驶都还很远。

自动驾驶提出来已经有10年,但是对于“完全自动驾驶”到底什么时候到来,最乐观的判断是10~15年,Garter技术成熟度曲线中判断L4级自动驾驶的成熟还需要10年以上,有些业内人士的判断,甚至认为“遥遥无期”。原因有:

1、  L2只需要具备功能,L3对可靠性要求极高

L2(部分自动驾驶)的车辆,机器已经具备了全部的汽车操控能力,看上去离L3(无需驾驶员人工干预)应该很近了。

但是L2L3其实非常遥远,比如自动驾驶车辆需要能够自动通过学校区域,但是如果在上下学时间段,L2允许驾驶员人工干预,L3则基本上不允许。车辆需要自行等候过马路的学生,躲避见缝插针的电动车和家长,还要根据交通义工的指挥行进,尽可能不堵路。

L2L3,要解决的是各种复杂条件下的可靠性问题,需要投入至少10倍于L2的工作量才可能达成。

2、  目前的自动驾驶路测结果,有非常强的地域限制

美国的道路条件,和中国的差别很大;北京完成的测试结果,也没法证明车辆在贵州、重庆也能有相同表现;广东要求机动车必须礼让行人,其他地方就未必;有些地方行人只走斑马线,有些地方路上除了有随意乱穿的人,还有各种大小动物。

要想造出全球发布的车型,就需要在全世界所有道路上进行路测,这几乎是不可能完成的任务。

这意味着,消费者现在买的车,只能在有限的区域自动驾驶,出了这些区域就只能人工驾驶。自动驾驶很长时间都是在城市公交、货运等有固定线路的领域更可行,车辆也不太可能放弃刹车、油门、方向盘。


自动驾驶正在试图:用民用产品的价格、在民用产品的开放性使用环境中,达到远超民用的安全性标准。

这个过程中:

  • 会创造出高精度、高可靠性、全工况、低成本的摄像头、激光雷达、毫米波雷达等传感器;

  • 会倒逼物联网提升可靠性和性能,促进物--物相连标准的发展;

  • 会激励地图和定位技术的更新换代,达到更高的精度和速度;

  • 会给专用芯片的发展提供契机;

  • 也会催生出一批有别于互联网时代的,适合硬科技和工业需要软件技术人员群体。

自动驾驶是硬科技创新的龙头之一,产生的技术创新会在其他的硬科技创新应用中发挥价值。