郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布!
Nature Machine Intelligence, 2023, 5(2): 145-158
Abstract
今天的自动驾驶汽车已经取得了令人印象深刻的驾驶能力,但在长尾情况下仍存在不确定性。用更多的数据训练基于强化学习的自动驾驶算法并不总能带来更好的性能,这是一个安全问题。在这里,我们提出了一种动态置信增强学习(DCARL)技术,以保证持续改进。持续改进意味着更多的培训始终会提高或保持其当前的绩效。我们的技术能够使用驾驶过程中收集的数据提高性能,而不需要长时间的预训练阶段。我们使用模拟和在实验车辆上评估了所提出的技术。结果表明,所提出的DCARL方法能够在各种情况下实现持续改进,同时,在任何阶段都匹配或优于默认的自动驾驶策略。这项技术在2022年北京冬奥会上在车辆上进行了演示和评估。
标签:confidence,driving,cars,Continuous,dynamic,驾驶,improvement,using From: https://www.cnblogs.com/lucifer1997/p/17164446.html