职称:2023级硕士
研究方向:无人驾驶可信性测评、基于深度强化学习的智能决策算法失效的快速测试评估
邮箱:
教育经历:
2019.9-2023.6 同济大学
2023.9-至今同济大学
研究进展:
基于深度强化学习的智能决策算法失效的快速测试评估:基于深度强化学习的决策算法在自动驾驶技术中取得了很大进展,但在长尾情况下仍存在不确定性故障。验证这些算法的安全性对自动驾驶车辆的发展具有重要意义。在本研究中,我们设计了一个测试和评估框架,能够快速评估基于深度强化学习的决策算法的失败概率。考虑到导致算法失败的场景的罕见特征,将子集模拟算法与自适应的马尔可夫链蒙特卡罗算法相结合,迭代更新样本,从而促进罕见事件的发生,加快概率评估过程。
通过应用自适应马尔科夫蒙特卡洛采样方法的子集模拟方法,在样本的迭代过程中逐渐增加稀有事件发生的频率,并最终对不同智能决策算法在不同安全评估阈值下的失效概率进行评估,在评估准确性、评估方差、置信度水平和苹果效率方面相较传统方法均有提升。
图1 样本迭代更新过程
图2 面向不同智能决策算法的测试评估结果
获得的荣誉和成果:
(1) 2019-2020 同济大学本科优秀学生奖学金二等奖
(2) 2020-2021 同济大学本科优秀学生奖学金一等奖
兴趣爱好和特长:
音乐、乒乓球