This website requires JavaScript.
DOI: 10.1109/icra40945.2020.9197132

Driving in Dense Traffic with Model-Free Reinforcement Learning

Dhruv Mauria SaxenaSangjae BaeAlireza NakhaeiKikuo FujimuraMaxim Likhachev
Sep 2019
切换摘要原文
当道路交通拥挤时,因为在时空中无障碍的区域太小,传统的规控方法可能无法为自动驾驶车辆找到可行的路线。但是,这不意味着可行路线不存在,因为人类驾驶者能够达成合作,创造空当,把车开过密集的车流。而传统方法没能考虑到自车的行动会影响到道路上的其他车辆的表现。本文的工作中,我们利用深度强化学习对这种交互进行了隐式建模,并学会了一种控制自动驾驶车辆的策略,这种策略在动作空间中是连续的。实现过程中,我们的车辆会和他车进行协商,并在道路中开辟空隙,从而进行并道或者时变道。我们的策略包括反复的探入目标车道,从而找到一个可以安全切入的点。我们在仿真测试中与另外两种model-predictive control-based算法进行了比较,证明了我们的策略更优。作为工作的一部分,我们提出了一种新的基准,供社区在测试密集车流中的驾驶模型时用于比较。
白鹡鸰
译文提供者
全部 1 篇译文
图表提取

论文十问由沈向洋博士提出,鼓励大家带着这十个问题去阅读论文,用有用的信息构建认知模型。写出自己的十问回答,还有机会在当前页面展示哦。

  1. Q1
    论文试图解决什么问题?
    白鹡鸰 2021/12/10

    安全舒适地在密集车流中并道/变道。

  2. Q2
    这是否是一个新的问题?
    白鹡鸰 2021/12/10

    需求一直存在,但解决方法目前不足。

  3. Q3
    这篇文章要验证一个什么科学假设?
    白鹡鸰 2021/12/10

    将与其他车辆交互情况纳入考虑范围能够提升驾驶决策模型的表现。

  4. Q4
    有哪些相关研究?如何归类?谁是这一课题在领域内值得关注的研究员?
  5. Q5
    论文中提到的解决方案之关键是什么?
  6. Q6
    论文中的实验是如何设计的?
  7. Q7
    用于定量评估的数据集是什么?代码有没有开源?
  8. Q8
    论文中的实验及结果有没有很好地支持需要验证的科学假设?
  9. Q9
    这篇论文到底有什么贡献?
  10. Q10
    下一步呢?有什么工作可以继续深入?
6
被引用
笔记
问答