三大阻碍专家解读自动驾驶为何难实现车谈网

人工智能（AI）时代已经来临，这项技术其实从90年代开始就不断走向成熟。现如今，阿尔法狗（AlphaGo）又轻松击败了人类最强围棋大脑，顶尖电竞团队打Dota也败给了AI，并且永远不可能再翻盘。自动驾驶可以说是人工智能应用最大、最典型的场景，然而为何自动驾驶汽车的发展却一波三折。

『清华大学车辆与运载学院长聘副教授李升波』

日前，在第六届国际智能网联汽车技术年会（CICV 2019）上，清华大学车辆与运载学院长聘副教授李升波称，一个AI算法应用在手机上其实是比较比较容易实现的，但是应用在汽车上，一旦把安全性、节能性、流畅性以及舒适性等要求加上去，这个挑战就已经是成倍的增长了。

自动驾驶汽车的现实如何，又面临哪些实际问题呢？李升波从自动驾驶汽车“感知”、“决策”和“执行”三个层面剖析了自动驾驶发展所面临的挑战。

感知层的挑战

感知层，其实是要解决汽车“我在哪里”的问题。目前，一般采用摄像头、毫米波雷达、激光雷达、GPS、IMU（惯性测量单元）等来实现。摄像头是当前应用人工智能算法的核心零部件，摄像头主要有四大任务：图像分类、目标的定位、目标的检测和语义分割。

李升波称，目前所采用的主流方法是深度学习神经网络来完成上述任务，理论上没有问题，但在实际应用中问题比较大。一方面，当汽车需要去识别更多的车辆、行人、自行车以及道路标志等目标的时候，无论是人工智能的训练深度还是推断能力都有所欠缺。例如，神经网络需要大量的数据标注，1500万张图片需要5万多名工程师耗费2年时间才能完成，但这才标注了20多种类型，而道路环境需求却远超这个数据。这还不包括激光雷达、毫米波雷达等传感器所需要标注的数据，况且除了数据标注工作外，还要加上安全性和准确性等方面的要求。

此外，实际驾驶场景中还有恶意样本的欺骗性。李升波举例称，原来是熊猫的样本图片中加入百分之一的“噪声”，系统就将其识别成了金丝猴。而这样的“噪声”干扰在现实中太多了，神经网络在对抗恶意样本的时候能力会变得非常脆弱。

决策层的挑战

决策，在狭义上其实是指自动驾驶的“大脑”根据汽车“看到”的环境信息，给出汽车的驾驶策略。目前，在园区等简单的封闭场景下，自动驾驶系统决策比较“完美”，但在城市工况下却不尽然。

李升波例举了一个颇具现实意味的例子，检验自动驾驶汽车决策是否完美最直接的方式就是，“让一辆自动驾驶汽车从清华大学校门口跑到五道口，如果不出问题，那就算过关了，这是最好的测试场景。”

不过，自动驾驶汽车在现实中很难通过十字路口，这就需要更加先进的人工智能决策和控制系统。李升波称，现今在“干净”的场景下做决策没问题，但是像中国道路状况的复杂性就太高了，行人的随机性太强，还有碰瓷的问题又该如何解决呢。

另外一类是跟驾驶员相关，98%的驾驶员在驾车时其驾驶行为集中在4中模式：急行、超车、跟车、换道。但从研究的角度来说，驾驶行为有几百种，虽然前面4中驾驶模式覆盖了所有驾驶行为的98%，但剩下的2%却同样跟安全密切相关。李升波称，人在驾驶时是不断改进的，但当前决策模块却达不到这样的水平。可以看出，人工智能还需要不断进化才能应用在汽车领域。

执行层的挑战

排在感知、决策之后，就是执行的问题，也就是汽车的运动问题。狭义上来说，自动驾驶汽车需要解决方向盘（转向）、油门/刹车（制动）两个问题，能够实现纵向和横向的同时控制，这也就基本达到了L3级自动驾驶（L3与L2最根本的区别在于L3实现了纵向和横向的控制）。

不过，李升波同样认为当前汽车运动也不“完美”。一方面是，传感器有“噪声”、执行器有误差、变速车轮非线形。在普通的路况较好的道路上运动控制是没有问题的，但是在极限状态下还达不到。

另外，如果自动驾驶要实现商业化，卡车编队控制是一个重要的商业化应用场景。而在卡车编队中，有时候为了节能有时候需要把卡车间的距离控制在4-5米，而这种精度的运动控制已经上升了一个量级。