論文の概要: An End-to-end Deep Reinforcement Learning Approach for the Long-term
Short-term Planning on the Frenet Space
- arxiv url: http://arxiv.org/abs/2011.13098v1
- Date: Thu, 26 Nov 2020 02:40:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 12:25:49.519863
- Title: An End-to-end Deep Reinforcement Learning Approach for the Long-term
Short-term Planning on the Frenet Space
- Title(参考訳): frenet空間の長期短期計画のためのエンド・ツー・エンド深層強化学習手法
- Authors: Majid Moghadam, Ali Alizadeh, Engin Tekin and Gabriel Hugh Elkaim
- Abstract要約: 本稿では,自動運転車の意思決定と動作計画に向けた,エンドツーエンドの継続的強化学習手法を提案する。
初めて、Frenet空間上の状態と行動空間の両方を定義して、走行挙動を道路曲率に変化させないようにする。
このアルゴリズムは、フィードバックコントローラが追跡するFrenetフレーム上で連続時間軌道を生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tactical decision making and strategic motion planning for autonomous highway
driving are challenging due to the complication of predicting other road users'
behaviors, diversity of environments, and complexity of the traffic
interactions. This paper presents a novel end-to-end continuous deep
reinforcement learning approach towards autonomous cars' decision-making and
motion planning. For the first time, we define both states and action spaces on
the Frenet space to make the driving behavior less variant to the road
curvatures than the surrounding actors' dynamics and traffic interactions. The
agent receives time-series data of past trajectories of the surrounding
vehicles and applies convolutional neural networks along the time channels to
extract features in the backbone. The algorithm generates continuous
spatiotemporal trajectories on the Frenet frame for the feedback controller to
track. Extensive high-fidelity highway simulations on CARLA show the
superiority of the presented approach compared with commonly used baselines and
discrete reinforcement learning on various traffic scenarios. Furthermore, the
proposed method's advantage is confirmed with a more comprehensive performance
evaluation against 1000 randomly generated test scenarios.
- Abstract(参考訳): 道路利用者の行動予測の複雑さ,環境の多様性,交通相互作用の複雑化などにより,自動運転車の戦術的意思決定と戦略的行動計画が困難である。
本稿では,自動運転車の意思決定と行動計画に対する,新しいエンドツーエンドの連続的深層強化学習手法を提案する。
はじめて、Frenet空間上の状態と行動空間の両方を定義し、周囲のアクターの動的および交通的相互作用よりも運転挙動が道路曲率に変化しないようにする。
エージェントは、周辺車両の過去の軌跡の時系列データを受信し、時間チャネルに沿って畳み込みニューラルネットワークを適用して背骨の特徴を抽出する。
このアルゴリズムは、フィードバックコントローラが追跡するフレネットフレーム上の連続時空間軌道を生成する。
CARLAにおける広汎な高忠実度高速道路シミュレーションは、様々な交通シナリオにおける一般的なベースラインと離散強化学習と比較して、提案手法の優位性を示している。
さらに,1000のランダムなテストシナリオに対して,より包括的な性能評価を行うことで,提案手法の利点を確認した。
関連論文リスト
- End-to-end Driving in High-Interaction Traffic Scenarios with Reinforcement Learning [24.578178308010912]
これらの問題に対処するために,Ranmble というエンドツーエンドモデルベース RL アルゴリズムを提案する。
環境のダイナミックスモデルを学ぶことで、Rambleは今後のトラフィックイベントを予測し、より情報に富んだ戦略的決定を下すことができる。
Rambleは、CARLA Leaderboard 2.0におけるルート完了率と運転スコアに関する最先端のパフォーマンスを達成し、複雑でダイナミックな交通状況を管理する上での有効性を示している。
論文 参考訳(メタデータ) (2024-10-03T06:45:59Z) - Eco-Driving Control of Connected and Automated Vehicles using Neural
Network based Rollout [0.0]
接続された自動運転車は、エネルギー消費を最小化する可能性がある。
既存の決定論的手法は、一般に高い計算とメモリ要求に悩まされる。
本研究ではニューラルネットワークを介して実装された階層型マルチ水平最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-16T23:13:51Z) - PDFormer: Propagation Delay-Aware Dynamic Long-Range Transformer for
Traffic Flow Prediction [78.05103666987655]
空間時空間グラフニューラルネットワーク(GNN)モデルは、この問題を解決する最も有望な方法の1つである。
本稿では,交通流の正確な予測を行うために,遅延を意識した動的長距離トランスフォーマー(PDFormer)を提案する。
提案手法は,最先端の性能を達成するだけでなく,計算効率の競争力も発揮できる。
論文 参考訳(メタデータ) (2023-01-19T08:42:40Z) - RLPG: Reinforcement Learning Approach for Dynamic Intra-Platoon Gap
Adaptation for Highway On-Ramp Merging [14.540226579203207]
小隊は、非常に近い距離で一緒に移動する車両のグループを指す。
近年の研究では、高規格道路と高架道路の合流時の交通流に対する極小小小高架区間の影響が明らかにされている。
本稿では,各小隊員の小隊内ギャップを適応的に調整し,交通流を最大化する新しい補強学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-07T07:33:54Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - GINK: Graph-based Interaction-aware Kinodynamic Planning via
Reinforcement Learning for Autonomous Driving [10.782043595405831]
都市部などの構造環境下での自律運転に深部強化学習(D)を適用するには,多くの課題がある。
本稿では,グラフに基づく意図表現と動的計画のための強化学習を効果的に組み合わせた新しいフレームワークを提案する。
この実験は,既存のベースラインと比較して,我々のアプローチの最先端性能を示すものである。
論文 参考訳(メタデータ) (2022-06-03T10:37:25Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Implicit Latent Variable Model for Scene-Consistent Motion Forecasting [78.74510891099395]
本稿では,センサデータから直接複雑な都市交通のシーン一貫性のある動き予測を学習することを目的とする。
我々は、シーンを相互作用グラフとしてモデル化し、強力なグラフニューラルネットワークを用いてシーンの分散潜在表現を学習する。
論文 参考訳(メタデータ) (2020-07-23T14:31:25Z) - Planning on the fast lane: Learning to interact using attention
mechanisms in path integral inverse reinforcement learning [20.435909887810165]
自動走行のための汎用軌道計画アルゴリズムは複雑な報酬関数を利用する。
深層学習アプローチは局所的な状況依存報酬関数の予測に成功している。
低次元の文脈ベクトルを生成するためにポリシーアテンション機構を用いるニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-07-11T15:25:44Z) - Constructing Geographic and Long-term Temporal Graph for Traffic
Forecasting [88.5550074808201]
交通予測のための地理・長期時間グラフ畳み込み型ニューラルネットワーク(GLT-GCRNN)を提案する。
本研究では,地理的・長期的時間的パターンを共有する道路間のリッチな相互作用を学習する交通予測のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-23T03:50:46Z) - Spatial-Temporal Transformer Networks for Traffic Flow Forecasting [74.76852538940746]
本稿では,長期交通予測の精度を向上させるため,時空間変圧器ネットワーク(STTN)の新たなパラダイムを提案する。
具体的には、有向空間依存を動的にモデル化することにより、空間変換器と呼ばれる新しいグラフニューラルネットワークを提案する。
提案モデルにより,長期間にわたる空間的依存関係に対する高速かつスケーラブルなトレーニングが可能になる。
論文 参考訳(メタデータ) (2020-01-09T10:21:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。