論文の概要: Safe, Efficient, Comfort, and Energy-saving Automated Driving through
Roundabout Based on Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2306.11465v1
- Date: Tue, 20 Jun 2023 11:39:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 14:45:24.035683
- Title: Safe, Efficient, Comfort, and Energy-saving Automated Driving through
Roundabout Based on Deep Reinforcement Learning
- Title(参考訳): 深層強化学習に基づくラウンドアバウトによる安全・効率的・快適・省エネルギー自動運転
- Authors: Henan Yuan, Penghui Li, Bart van Arem, Liujiang Kang, and Yongqi Dong
- Abstract要約: ラウンドアバウンドでの交通シナリオは、自動化された運転に相当な複雑さをもたらす。
本研究は、ラウンドアバウンドを走行する自動運転車の運転を指示する様々なDRLアルゴリズムを探索し、採用し、実装する。
3つの試験されたDRLアルゴリズムはいずれも、自動運転車がラウンドアバウンドを走行できるようにするのに成功している。
- 参考スコア(独自算出の注目度): 3.4602940992970903
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traffic scenarios in roundabouts pose substantial complexity for automated
driving. Manually mapping all possible scenarios into a state space is
labor-intensive and challenging. Deep reinforcement learning (DRL) with its
ability to learn from interacting with the environment emerges as a promising
solution for training such automated driving models. This study explores,
employs, and implements various DRL algorithms, namely Deep Deterministic
Policy Gradient (DDPG), Proximal Policy Optimization (PPO), and Trust Region
Policy Optimization (TRPO) to instruct automated vehicles' driving through
roundabouts. The driving state space, action space, and reward function are
designed. The reward function considers safety, efficiency, comfort, and energy
consumption to align with real-world requirements. All three tested DRL
algorithms succeed in enabling automated vehicles to drive through the
roundabout. To holistically evaluate the performance of these algorithms, this
study establishes an evaluation methodology considering multiple indicators
such as safety, efficiency, and comfort level. A method employing the Analytic
Hierarchy Process is also developed to weigh these evaluation indicators.
Experimental results on various testing scenarios reveal that the TRPO
algorithm outperforms DDPG and PPO in terms of safety and efficiency, and PPO
performs best in terms of comfort level. Lastly, to verify the model's
adaptability and robustness regarding other driving scenarios, this study also
deploys the model trained by TRPO to a range of different testing scenarios,
e.g., highway driving and merging. Experimental results demonstrate that the
TRPO model trained on only roundabout driving scenarios exhibits a certain
degree of proficiency in highway driving and merging scenarios. This study
provides a foundation for the application of automated driving with DRL in real
traffic environments.
- Abstract(参考訳): ラウンドアバウンドでの交通シナリオは、自動走行にかなりの複雑さをもたらす。
可能なすべてのシナリオを状態空間に手動でマッピングすることは、労働集約的で難しい。
環境との相互作用から学習する能力を備えた深層強化学習(DRL)は、そのような自動運転モデルのトレーニングのための有望なソリューションとして現れる。
本研究は,自動車のラウンドアバウトを通した運転を指示するために,DDPG(Deep Deterministic Policy Gradient),PPO(Proximal Policy Optimization),TRPO(Trust Region Policy Optimization)といったDRLアルゴリズムを探索し,採用し,実装する。
駆動状態空間、動作空間、報酬関数が設計される。
報酬関数は、現実世界の要求に合わせて安全、効率、快適、エネルギー消費を考慮する。
3つの試験されたDRLアルゴリズムはいずれも、自動運転車がラウンドアバウンドを走行できるようにすることに成功した。
これらのアルゴリズムの性能を確率的に評価するために,安全性,効率,快適度などの複数の指標を考慮した評価手法を構築した。
これらの評価指標を評価するために,解析階層プロセスを用いた手法も開発されている。
様々なテストシナリオにおける実験結果から,TRPOアルゴリズムはDDPGとPPOよりも安全性と効率が優れており,PPOは快適度において最高であることがわかった。
最後に、他の運転シナリオに対するモデルの適応性と堅牢性を検証するために、TRPOによって訓練されたモデルを、高速道路運転やマージなど、さまざまなテストシナリオに展開する。
実験結果から, 実走行シナリオのみを訓練したTRPOモデルは, ハイウェイ走行およびマージシナリオにおいて一定の習熟度を示した。
本研究は,実際の交通環境におけるDRLを用いた自動走行の基盤を提供する。
関連論文リスト
- Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - DRNet: A Decision-Making Method for Autonomous Lane Changingwith Deep
Reinforcement Learning [7.2282857478457805]
DRNetは、DRLエージェントがシミュレートされた高速道路上で合理的な車線変更を行うことで、運転を学べる新しいDRLベースのフレームワークである。
我々のDRLエージェントは、衝突を起こさずに所望のタスクを学習でき、DDQNや他のベースラインモデルより優れています。
論文 参考訳(メタデータ) (2023-11-02T21:17:52Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Action and Trajectory Planning for Urban Autonomous Driving with
Hierarchical Reinforcement Learning [1.3397650653650457]
本稿では,階層型強化学習法(atHRL)を用いた行動・軌道プランナを提案する。
我々は、複雑な都市運転シナリオにおける広範な実験を通して、atHRLの有効性を実証的に検証した。
論文 参考訳(メタデータ) (2023-06-28T07:11:02Z) - Comprehensive Training and Evaluation on Deep Reinforcement Learning for
Automated Driving in Various Simulated Driving Maneuvers [0.4241054493737716]
本研究では、DQN(Deep Q-networks)とTRPO(Trust Region Policy Optimization)の2つのDRLアルゴリズムの実装、評価、比較を行う。
設計されたComplexRoads環境で訓練されたモデルは、他の運転操作にうまく適応でき、全体的な性能が期待できる。
論文 参考訳(メタデータ) (2023-06-20T11:41:01Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Learning to drive from a world on rails [78.28647825246472]
モデルベースアプローチによって,事前記録された運転ログからインタラクティブな視覚ベースの運転方針を学習する。
世界の前方モデルは、あらゆる潜在的な運転経路の結果を予測する運転政策を監督する。
提案手法は,carla リーダボードにまずランク付けし,40 倍少ないデータを用いて25%高い運転スコアを得た。
論文 参考訳(メタデータ) (2021-05-03T05:55:30Z) - Real-world Ride-hailing Vehicle Repositioning using Deep Reinforcement
Learning [52.2663102239029]
アイドルヘイリングプラットフォーム上での現実世界の車両の深層強化学習と意思決定時間計画に基づく新しい実用的枠組みを提示する。
本手法は,重み付きバッチ学習アルゴリズムを用いて乗車時の状態値関数を学習する。
配車シミュレーション環境におけるベースラインでアルゴリズムをベンチマークし、収益効率の向上における優位性を実証します。
論文 参考訳(メタデータ) (2021-03-08T05:34:05Z) - Decision-making for Autonomous Vehicles on Highway: Deep Reinforcement
Learning with Continuous Action Horizon [14.059728921828938]
本稿では,高速道路における連続水平決定問題に対処するために,深部強化学習(DRL)手法を用いる。
エゴ自動車両の走行目標は、衝突することなく効率的でスムーズなポリシーを実行することである。
PPO-DRLに基づく意思決定戦略は、最適性、学習効率、適応性など、複数の観点から推定される。
論文 参考訳(メタデータ) (2020-08-26T22:49:27Z) - Decision-making Strategy on Highway for Autonomous Vehicles using Deep
Reinforcement Learning [6.298084785377199]
高速道路のオーバーテイク行動に対処するため、自動車の深層強化学習(DRL)対応意思決定ポリシーを構築した。
これらの車両を制御するために階層的な制御フレームワークが提示され、上層部が運転決定を管理することを示す。
DDQNをベースとしたオーバーテイク政策は、ハイウェイ運転のタスクを効率的かつ安全に達成することができた。
論文 参考訳(メタデータ) (2020-07-16T23:41:48Z) - Intelligent Roundabout Insertion using Deep Reinforcement Learning [68.8204255655161]
本稿では,多忙なラウンドアバウンドの入場を交渉できる演習計画モジュールを提案する。
提案されたモジュールは、トレーニングされたニューラルネットワークに基づいて、操作の全期間にわたって、ラウンドアバウンドに入るタイミングと方法を予測する。
論文 参考訳(メタデータ) (2020-01-03T11:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。