中国时代汽车网  网站地图 |  加入收藏
您现在的位置是: 首页 > 评车> 内容

卡内基梅隆大学开发出基于强化学习的框架可提高自动驾驶汽车并道性能

发布时间:2022-12-26 17:52 来源: 网络  阅读量:15489  

盖世汽车讯虽然现在很多汽车公司都在投入研发自动驾驶汽车,但到目前为止,自动驾驶汽车还没有达到大规模部署所需的安全水平。为了达到这一水平,车辆需要能够安全有效地应对道路上的各种挑战。

据国外媒体报道,卡内基梅隆大学的研究人员开发了一种基于强化学习(RL)的框架,可以帮助提高自动驾驶汽车在匝道合并场景下的性能,即当匝道上的车辆偏离主路时,或将提高自动驾驶汽车的安全性,降低事故风险。

开发该模型的研究人员之一Soumith Udatha说:“这项研究专注于高速公路合并,因为它涉及高速车辆、不同风格的司机和各种不确定性。”

乌达塔和他的同事们致力于提高自动驾驶汽车的安全性。在最近的论文中,这些研究人员试图设计一个框架,可以有效地捕捉匝道合并场景,并根据任何不确定性和可能的风险的分析来规划车辆的行动。

Udatha解释说:“RL模型与环境进行交互,并收集数据以优化其奖励,但这种数据探索在部署到真实环境时会遇到一些问题,部分原因是代理遇到的并非所有状态都是安全的。我们使用控制障碍函数来约束我们的RL策略,以确保在指定距离内的安全性。因此,在环境约束下,我们可以忽略不安全的情况,增强系统学习导航的能力。”

CBF是一种全新的计算方法,旨在加强自动驾驶系统的安全控制。CBF可以直接应用于不同的优化问题,包括斜率合并。然而,CBF执行的优化没有考虑系统在探索环境时收集的数据,RL方法可以帮助填补这一空白。

Udatha说:“我们发现我们的算法可以扩展到离线和在线RL环境。由于我们现在有大量的数据用于离线RL,离线数据集的训练最终可以产生更好的模型。根据我们的指标,我们还发现,将概率CBF作为约束条件可以提供更好的安全性,因为CBF在一定程度上考虑了驾驶员的不确定性。”

Udatha和他的同事在一系列测试中测试了他们的框架,使用了英特尔实验室和巴塞罗那计算机视觉中心的研究人员开发的在线版CARLA模拟器。在这些仿真中,基于RL的框架取得了显著的效果,突出了其在匝道合并期间提高自动驾驶车辆安全性的可能价值。

Udatha补充说:“我们现在计划通过训练模型来扩展研究,以便在驾驶员不确定的场景中将自动驾驶汽车与多辆汽车结合起来。我们还发现缺乏比较各种匝道合并方法的标准基准,因此我们正在尝试为NGSIM建立匝道合并基准,NGSIM是NHTSA在美国I-80和101高速公路上发布的高速公路数据集。”

免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。