据electrek报道,特斯拉申请了一项技术专利,计划从其庞大的车队中获取数据,以训练自动驾驶神经网络。
特斯拉申请了这项专利,但特斯拉人工智能和自动驾驶软件负责人安德烈·卡帕西(Andrej Karpathy)被指定为这项专利应用的唯一发明人。
卡帕西在这项专利中描述了在应用程序中为深度学习培训收集数据的问题:“通过训练机器学习模型,开发应用于自动驾驶等领域的深度学习系统。
通常,深度学习系统的性能至少在一定程度上受到用于训练模型的训练集的质量的限制。在许多情况下,重要的资源被投入到收集、管理和注释培训数据上。创建训练集所需的工作可能很重要,而且常常很繁琐。此外,为机器学习模型改进,进行特定案例数据收集通常是困难的。”
特斯拉开发自动驾驶系统的方式与大多数其他公司大相径庭。大多数其他公司利用相对较小的车队测试车辆,收集数据和检测系统,但特斯拉利用其销售的成千上万车进行数据收集。这些车配备一组传感器收集路上和驾驶数据,以及测试无人驾驶系统在“影子模式”中的运行。
车队收集的这些数据对特斯拉训练自动驾驶神经网络非常有价值。但是,又必须小心地收集,并把数据供给自动驾驶神经网络。
卡帕西在专利申请中提到:“随着机器学习模型变得越来越复杂,如更深层次的神经网络,对大型训练数据集的需求也相应增加。
与较浅的神经网络相比,这些较深的神经网络可能需要更多的训练实例,以确保其通用性。例如,一个神经网络可能被训练得对相关数据非常精确,但是这个神经网络可能不能很好地泛化到预测未来的案例。而在这个案例中,神经网络可能会受益于训练数据中包含的其他例子。”
因此,卡帕西解释了他的专利方法,将潜在的训练数据从源头分类,然后再传输:
“示例方法包括接收传感器并将神经网络应用于传感器数据。将触发分类器应用于神经网络的中间结果,以确定传感器数据的分类器评分。根据至少部分分类器得分,决定是否通过计算机网络传输至少部分传感器数据。当确定为‘积极’时,传感器数据被传输并用于生成训练数据。”