論文の概要: Intelligent Roundabout Insertion using Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2001.00786v3
- Date: Wed, 28 Apr 2021 09:22:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-14 17:37:10.312505
- Title: Intelligent Roundabout Insertion using Deep Reinforcement Learning
- Title(参考訳): 深層強化学習を用いたインテリジェントラウンドアラウンドアラウンドアラウンド挿入
- Authors: Alessandro Paolo Capasso, Giulio Bacchiani, Daniele Molinari
- Abstract要約: 本稿では,多忙なラウンドアバウンドの入場を交渉できる演習計画モジュールを提案する。
提案されたモジュールは、トレーニングされたニューラルネットワークに基づいて、操作の全期間にわたって、ラウンドアバウンドに入るタイミングと方法を予測する。
- 参考スコア(独自算出の注目度): 68.8204255655161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An important topic in the autonomous driving research is the development of
maneuver planning systems. Vehicles have to interact and negotiate with each
other so that optimal choices, in terms of time and safety, are taken. For this
purpose, we present a maneuver planning module able to negotiate the entering
in busy roundabouts. The proposed module is based on a neural network trained
to predict when and how entering the roundabout throughout the whole duration
of the maneuver. Our model is trained with a novel implementation of A3C, which
we will call Delayed A3C (D-A3C), in a synthetic environment where vehicles
move in a realistic manner with interaction capabilities. In addition, the
system is trained such that agents feature a unique tunable behavior, emulating
real world scenarios where drivers have their own driving styles. Similarly,
the maneuver can be performed using different aggressiveness levels, which is
particularly useful to manage busy scenarios where conservative rule-based
policies would result in undefined waits.
- Abstract(参考訳): 自動運転研究における重要なトピックは、操縦計画システムの開発である。
車両は、時間と安全性の観点から最適な選択が取られるように、互いに対話し、交渉する必要がある。
この目的のために,本研究では,多忙なラウンドアバウンドの入場を交渉できる操作計画モジュールを提案する。
提案されたモジュールは、操作の期間を通してラウンドアラウンドに入るタイミングと方法を予測するようにトレーニングされたニューラルネットワークに基づいている。
本モデルでは,車両が現実的な操作能力で移動する合成環境において,遅延A3C(Delayed A3C)と呼ばれる新しいA3Cの実装を訓練する。
さらに,ドライバが独自の運転スタイルを持つ現実のシナリオをエミュレートすることで,エージェントが独特なチューニング可能な振る舞いを特徴付けるように訓練されている。
同様に、この操作は異なる攻撃性レベルを使って行うことができ、保守的なルールベースのポリシーが未定義の待ち時間をもたらすような忙しいシナリオを管理するのに特に有用である。
関連論文リスト
- Dream to Drive with Predictive Individual World Model [12.05377034777257]
本稿では,自律運転のための予測的個別世界モデル(PIWM)を用いたモデルベース強化学習(MBRL)手法を提案する。
PIWMは、運転環境を個人レベルで記述し、車両の対話的関係と意図を捉える。
PIWMの想像力で訓練され、意図を意識した潜伏状態を活用する都市運転シーンで効果的にナビゲートする。
論文 参考訳(メタデータ) (2025-01-28T06:18:29Z) - A Systematic Study of Multi-Agent Deep Reinforcement Learning for Safe and Robust Autonomous Highway Ramp Entry [0.0]
本研究では,車体前方移動動作を制御するハイウェイランプ機能について検討し,車体が進入する高速道路交通の流れとの衝突を最小限に抑える。
我々はこの問題に対してゲーム理論的マルチエージェント(MA)アプローチを採用し、深層強化学習(DRL)に基づくコントローラの利用について検討する。
本稿では,2台以上の車両(エージェント)の相互作用を研究することで既存の作業を拡張し,交通量やエゴカーを付加して道路シーンを体系的に拡張する。
論文 参考訳(メタデータ) (2024-11-21T21:23:46Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Deep Interactive Motion Prediction and Planning: Playing Games with
Motion Prediction Models [162.21629604674388]
本研究は,新しい対話型マルチエージェントニューラルネットワークポリシを予測モデルの一部として使用するゲーム理論モデル予測制御器(MPC)を提案する。
本手法の成功の基礎は,周辺エージェントの状態と地図情報に基づいて車両を操縦できる,新しいマルチエージェントポリシーネットワークの設計である。
論文 参考訳(メタデータ) (2022-04-05T17:58:18Z) - Generative Adversarial Imitation Learning for End-to-End Autonomous
Driving on Urban Environments [0.8122270502556374]
GAIL(Generative Adversarial Imitation Learning)は、報酬関数を明示的に定義することなくポリシーを訓練することができる。
両モデルとも,訓練終了後に開始から終了まで,専門家の軌道を模倣できることを示す。
論文 参考訳(メタデータ) (2021-10-16T15:04:13Z) - IntentNet: Learning to Predict Intention from Raw Sensor Data [86.74403297781039]
本論文では,LiDARセンサが生成する3次元点群と,環境の動的なマップの両方を利用するワンステージ検出器と予測器を開発した。
当社のマルチタスクモデルは、それぞれの別々のモジュールよりも高い精度を実現し、計算を節約します。
論文 参考訳(メタデータ) (2021-01-20T00:31:52Z) - Deep Structured Reactive Planning [94.92994828905984]
自動運転のための新しいデータ駆動型リアクティブ計画目標を提案する。
本モデルは,非常に複雑な操作を成功させる上で,非反応性変種よりも優れることを示す。
論文 参考訳(メタデータ) (2021-01-18T01:43:36Z) - End-to-end Interpretable Neural Motion Planner [78.69295676456085]
複雑な都市環境での自律走行学習のためのニューラルモーションプランナー(NMP)を提案する。
我々は,生lidarデータとhdマップを入力とし,解釈可能な中間表現を生成する全体モデルを設計した。
北米のいくつかの都市で収集された実世界の運転データにおける我々のアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-01-17T14:16:12Z) - Interpretable End-to-end Urban Autonomous Driving with Latent Deep
Reinforcement Learning [32.97789225998642]
本稿では,エンドツーエンド自動運転のための解釈可能な深部強化学習手法を提案する。
逐次潜在環境モデルを導入し、強化学習プロセスと共同で学習する。
本手法は,自動車が運転環境にどう影響するかを,よりよく説明することができる。
論文 参考訳(メタデータ) (2020-01-23T18:36:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。