論文の概要: Behavioral decision-making for urban autonomous driving in the presence
of pedestrians using Deep Recurrent Q-Network
- arxiv url: http://arxiv.org/abs/2010.13407v1
- Date: Mon, 26 Oct 2020 08:08:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 17:45:23.171184
- Title: Behavioral decision-making for urban autonomous driving in the presence
of pedestrians using Deep Recurrent Q-Network
- Title(参考訳): ディープリカレントqネットワークを用いた歩行者存在下の都市自律運転行動決定
- Authors: Niranjan Deshpande (CHROMA), Dominique Vaufreydaz (LIG), Anne
Spalanzani (CHROMA)
- Abstract要約: 都市環境における自動運転の意思決定は,道路構造の複雑化と多様な道路利用者の行動の不確実性により困難である。
本研究では,歩行者の存在下での都市環境における高レベル運転行動に対する深層強化学習に基づく意思決定手法を提案する。
提案手法は都市密集シナリオに対して評価し,ルールベース手法と比較し,DRQNに基づく運転行動決定器がルールベース手法より優れていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decision making for autonomous driving in urban environments is challenging
due to the complexity of the road structure and the uncertainty in the behavior
of diverse road users. Traditional methods consist of manually designed rules
as the driving policy, which require expert domain knowledge, are difficult to
generalize and might give sub-optimal results as the environment gets complex.
Whereas, using reinforcement learning, optimal driving policy could be learned
and improved automatically through several interactions with the environment.
However, current research in the field of reinforcement learning for autonomous
driving is mainly focused on highway setup with little to no emphasis on urban
environments. In this work, a deep reinforcement learning based decision-making
approach for high-level driving behavior is proposed for urban environments in
the presence of pedestrians. For this, the use of Deep Recurrent Q-Network
(DRQN) is explored, a method combining state-of-the art Deep Q-Network (DQN)
with a long term short term memory (LSTM) layer helping the agent gain a memory
of the environment. A 3-D state representation is designed as the input
combined with a well defined reward function to train the agent for learning an
appropriate behavior policy in a real-world like urban simulator. The proposed
method is evaluated for dense urban scenarios and compared with a rule-based
approach and results show that the proposed DRQN based driving behavior
decision maker outperforms the rule-based approach.
- Abstract(参考訳): 都市環境における自動運転の意思決定は,道路構造の複雑化と多様な道路利用者の行動の不確実性により困難である。
従来の手法は、専門家のドメイン知識を必要とする駆動ポリシーとして手動で設計されたルールで構成されており、一般化が困難であり、環境が複雑になるにつれて準最適結果を与える可能性がある。
一方、強化学習を用いることで、環境との対話を通じて最適な運転ポリシーを学習し、自動的に改善することができる。
しかし、自動運転の強化学習の分野での最近の研究は、都市環境にほとんど重点を置かない高速道路の設置に重点を置いている。
本研究では,歩行者の存在下での高レベル運転行動に対する深い強化学習に基づく意思決定手法を提案する。
本研究では,DQN(Deep Recurrent Q-Network)と長期短期記憶(LSTM)を組み合わせ,エージェントが環境の記憶を得るのに役立つ手法を提案する。
3次元状態表現は、都市シミュレータのような現実世界で適切な行動ポリシーを学ぶためのエージェントを訓練するために、適切に定義された報酬関数と組み合わされた入力として設計される。
提案手法は都市密集シナリオに対して評価し,ルールベース手法と比較し,DRQNに基づく運転行動決定器がルールベース手法より優れていることを示す。
関連論文リスト
- Research on Autonomous Driving Decision-making Strategies based Deep Reinforcement Learning [8.794428617785869]
行動決定サブシステムは、自律運転システムの重要な構成要素である。
本研究では、自律的に学習し、運転戦略を最適化する高度な強化学習モデルを採用する。
論文 参考訳(メタデータ) (2024-08-06T10:24:54Z) - Robust Driving Policy Learning with Guided Meta Reinforcement Learning [49.860391298275616]
本稿では,ソーシャルカーの多種多様な運転方針を一つのメタ政治として訓練する効率的な方法を提案する。
ソーシャルカーのインタラクションに基づく報酬関数をランダム化することにより、多様な目的を生み出し、メタ政治を効率的に訓練することができる。
本研究では,社会自動車が学習メタ政治によって制御される環境を利用して,エゴ自動車の運転方針の堅牢性を高めるためのトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-19T17:42:36Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Navigation In Urban Environments Amongst Pedestrians Using
Multi-Objective Deep Reinforcement Learning [0.0]
本研究は,都市環境におけるナビゲーションを多目的強化学習問題として定式化する。
歩行者間の自律的なナビゲーションのために,しきい値付き辞書Q-ラーニングのディープラーニング版が提示される。
論文 参考訳(メタデータ) (2021-10-11T12:15:06Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - An End-to-end Deep Reinforcement Learning Approach for the Long-term
Short-term Planning on the Frenet Space [0.0]
本稿では,自動運転車の意思決定と動作計画に向けた,エンドツーエンドの継続的強化学習手法を提案する。
初めて、Frenet空間上の状態と行動空間の両方を定義して、走行挙動を道路曲率に変化させないようにする。
このアルゴリズムは、フィードバックコントローラが追跡するFrenetフレーム上で連続時間軌道を生成する。
論文 参考訳(メタデータ) (2020-11-26T02:40:07Z) - Emergent Road Rules In Multi-Agent Driving Environments [84.82583370858391]
運転環境の要素が道路ルールの出現の原因となるかを分析する。
2つの重要な要因が雑音知覚とエージェントの空間密度であることがわかった。
我々の結果は、世界中の国々が安全で効率的な運転で合意した社会道路規則を実証的に支持する。
論文 参考訳(メタデータ) (2020-11-21T09:43:50Z) - Behavior Planning at Urban Intersections through Hierarchical
Reinforcement Learning [25.50973559614565]
本研究では,都市環境の階層構造を用いた自律走行計画を行うことができる強化学習(RL)に基づく行動計画構造を提案する。
我々のアルゴリズムは、車線封鎖やエゴ車前方の遅延による交差点に近づく際に、車線変更の可能な方向から左に曲がるタイミングや、車線変更の可能性など、規則に基づく決定方法よりも優れている。
また,提案手法は従来のRL法よりも高速に最適方針に収束することを示した。
論文 参考訳(メタデータ) (2020-11-09T19:23:26Z) - Decision-making Strategy on Highway for Autonomous Vehicles using Deep
Reinforcement Learning [6.298084785377199]
高速道路のオーバーテイク行動に対処するため、自動車の深層強化学習(DRL)対応意思決定ポリシーを構築した。
これらの車両を制御するために階層的な制御フレームワークが提示され、上層部が運転決定を管理することを示す。
DDQNをベースとしたオーバーテイク政策は、ハイウェイ運転のタスクを効率的かつ安全に達成することができた。
論文 参考訳(メタデータ) (2020-07-16T23:41:48Z) - Intelligent Roundabout Insertion using Deep Reinforcement Learning [68.8204255655161]
本稿では,多忙なラウンドアバウンドの入場を交渉できる演習計画モジュールを提案する。
提案されたモジュールは、トレーニングされたニューラルネットワークに基づいて、操作の全期間にわたって、ラウンドアバウンドに入るタイミングと方法を予測する。
論文 参考訳(メタデータ) (2020-01-03T11:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。