論文の概要: Safe Decision-making for Lane-change of Autonomous Vehicles via Human
Demonstration-aided Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2207.00448v1
- Date: Fri, 1 Jul 2022 14:16:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-04 13:43:37.312897
- Title: Safe Decision-making for Lane-change of Autonomous Vehicles via Human
Demonstration-aided Reinforcement Learning
- Title(参考訳): 実証支援強化学習による車線変更のための安全意思決定
- Authors: Jingda Wu, Wenhui Huang, Niels de Boer, Yanghui Mo, Xiangkun He, Chen
Lv
- Abstract要約: 意思決定は、自動運転における車線変更に不可欠である。
貧弱なランタイム安全性は、実際に複雑な運転タスクからRLベースの意思決定戦略を妨げる。
本稿では,人間による実演をRLに基づく意思決定戦略に組み込む。
- 参考スコア(独自算出の注目度): 3.8902094267855167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decision-making is critical for lane change in autonomous driving.
Reinforcement learning (RL) algorithms aim to identify the values of behaviors
in various situations and thus they become a promising pathway to address the
decision-making problem. However, poor runtime safety hinders RL-based
decision-making strategies from complex driving tasks in practice. To address
this problem, human demonstrations are incorporated into the RL-based
decision-making strategy in this paper. Decisions made by human subjects in a
driving simulator are treated as safe demonstrations, which are stored into the
replay buffer and then utilized to enhance the training process of RL. A
complex lane change task in an off-ramp scenario is established to examine the
performance of the developed strategy. Simulation results suggest that human
demonstrations can effectively improve the safety of decisions of RL. And the
proposed strategy surpasses other existing learning-based decision-making
strategies with respect to multiple driving performances.
- Abstract(参考訳): 自動運転車の車線変更には意思決定が不可欠である。
強化学習(Reinforcement Learning, RL)アルゴリズムは, 様々な状況における行動の価値を識別することを目的としたアルゴリズムである。
しかし、実行時の安全性の悪さは、実際に複雑な運転タスクからRLベースの意思決定戦略を妨げる。
この問題に対処するため,本論文では,人間による実演をRLに基づく意思決定戦略に組み込んだ。
運転シミュレータにおける被験者による決定は、安全なデモンストレーションとして扱われ、リプレイバッファに格納され、RLのトレーニングプロセスを強化するために使用される。
開発戦略の性能を調べるために,オフランプシナリオにおける複雑なレーン変更タスクが確立される。
シミュレーションの結果,RLの安全性が向上することが示唆された。
また,提案手法は,複数の運転性能に関して,既存の学習に基づく意思決定戦略を上回っている。
関連論文リスト
- RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes [57.319845580050924]
本稿では,リスク感応制御と適応行動空間のカリキュラムを組み合わせた強化学習フレームワークを提案する。
提案アルゴリズムは,現実世界のオフロード運転タスクに対して,高速なポリシーを学習可能であることを示す。
論文 参考訳(メタデータ) (2024-05-07T23:32:36Z) - DRNet: A Decision-Making Method for Autonomous Lane Changingwith Deep
Reinforcement Learning [7.2282857478457805]
DRNetは、DRLエージェントがシミュレートされた高速道路上で合理的な車線変更を行うことで、運転を学べる新しいDRLベースのフレームワークである。
我々のDRLエージェントは、衝突を起こさずに所望のタスクを学習でき、DDQNや他のベースラインモデルより優れています。
論文 参考訳(メタデータ) (2023-11-02T21:17:52Z) - Robust Driving Policy Learning with Guided Meta Reinforcement Learning [49.860391298275616]
本稿では,ソーシャルカーの多種多様な運転方針を一つのメタ政治として訓練する効率的な方法を提案する。
ソーシャルカーのインタラクションに基づく報酬関数をランダム化することにより、多様な目的を生み出し、メタ政治を効率的に訓練することができる。
本研究では,社会自動車が学習メタ政治によって制御される環境を利用して,エゴ自動車の運転方針の堅牢性を高めるためのトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-19T17:42:36Z) - Towards Safe Autonomous Driving Policies using a Neuro-Symbolic Deep
Reinforcement Learning Approach [6.961253535504979]
本稿では, DRLSL (Dybolic Logics) と呼ばれる新しいニューロシンボリックモデルフリーDRLアプローチを提案する。
DRL(経験から学ぶ)とシンボリックな一階述語論理(知識駆動推論)の強みを組み合わせることで、実環境における自動運転のリアルタイムインタラクションにおける安全な学習を可能にする。
我々は,ハイDデータセットを用いた自律走行にDRLSLフレームワークを実装し,トレーニングとテストの両段階において,安全でない動作を回避できることを実証した。
論文 参考訳(メタデータ) (2023-07-03T19:43:21Z) - NeurIPS 2022 Competition: Driving SMARTS [60.948652154552136]
ドライビングSMARTSは、動的相互作用コンテキストにおける分散シフトに起因する問題に対処するために設計された定期的な競争である。
提案するコンペティションは,強化学習(RL)やオフライン学習など,方法論的に多様なソリューションをサポートする。
論文 参考訳(メタデータ) (2022-11-14T17:10:53Z) - Prediction Based Decision Making for Autonomous Highway Driving [3.6818636539023175]
本稿では,予測に基づく深層強化学習(Deep Reinforcement Learning, PDRL)意思決定モデルを提案する。
高速道路運転の意思決定プロセスにおいて、周囲の車両の操作意図を考慮に入れている。
その結果,提案したPDRLモデルでは,衝突数を減少させることで,Deep Reinforcement Learning (DRL)モデルと比較して意思決定性能が向上することがわかった。
論文 参考訳(メタデータ) (2022-09-05T19:28:30Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Constrained Reinforcement Learning for Robotics via Scenario-Based
Programming [64.07167316957533]
DRLをベースとしたエージェントの性能を最適化し,その動作を保証することが重要である。
本稿では,ドメイン知識を制約付きDRLトレーニングループに組み込む新しい手法を提案する。
我々の実験は、専門家の知識を活用するために我々のアプローチを用いることで、エージェントの安全性と性能が劇的に向上することを示した。
論文 参考訳(メタデータ) (2022-06-20T07:19:38Z) - Training and Evaluation of Deep Policies using Reinforcement Learning
and Generative Models [67.78935378952146]
GenRLはシーケンシャルな意思決定問題を解決するためのフレームワークである。
強化学習と潜在変数生成モデルの組み合わせを利用する。
最終方針訓練の性能に最も影響を与える生成モデルの特徴を実験的に決定する。
論文 参考訳(メタデータ) (2022-04-18T22:02:32Z) - Decision-making for Autonomous Vehicles on Highway: Deep Reinforcement
Learning with Continuous Action Horizon [14.059728921828938]
本稿では,高速道路における連続水平決定問題に対処するために,深部強化学習(DRL)手法を用いる。
エゴ自動車両の走行目標は、衝突することなく効率的でスムーズなポリシーを実行することである。
PPO-DRLに基づく意思決定戦略は、最適性、学習効率、適応性など、複数の観点から推定される。
論文 参考訳(メタデータ) (2020-08-26T22:49:27Z) - Decision-making at Unsignalized Intersection for Autonomous Vehicles:
Left-turn Maneuver with Deep Reinforcement Learning [17.715274169051494]
本研究は、自動運転車の信号なし交差点における深層強化学習に基づく左旋回意思決定フレームワークを提案する。
提案した意思決定戦略は、衝突率を効果的に低減し、輸送効率を向上させることができる。
この研究は、構築された左旋回制御構造がリアルタイムに適用可能な大きな可能性を持っていることも明らかにした。
論文 参考訳(メタデータ) (2020-08-14T22:44:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。