論文の概要: Graph-based Prediction and Planning Policy Network (GP3Net) for scalable
self-driving in dynamic environments using Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2312.05784v1
- Date: Sun, 10 Dec 2023 06:04:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 18:37:01.992249
- Title: Graph-based Prediction and Planning Policy Network (GP3Net) for scalable
self-driving in dynamic environments using Deep Reinforcement Learning
- Title(参考訳): 深層強化学習を用いた動的環境におけるスケーラブルな自動運転のためのグラフベース予測計画政策ネットワーク(GP3Net)
- Authors: Jayabrata Chowdhury, Venkataramanan Shivaraman, Suresh Sundaram and P
B Sujit
- Abstract要約: グラフベースの予測とポリシーネットワーク(GP3Net)フレームワークは、非定常環境向けに提案されている。
A時間グラフは、それらの参加者の将来の軌跡を予測するために、交通参加者間の相互作用をモデル化する。
目に見えない新しい気象条件下では、GP3Netはより少ないトラフィック違反で所望の経路を完成させる。
- 参考スコア(独自算出の注目度): 2.7630712870373624
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in motion planning for Autonomous Vehicles (AVs) show
great promise in using expert driver behaviors in non-stationary driving
environments. However, learning only through expert drivers needs more
generalizability to recover from domain shifts and near-failure scenarios due
to the dynamic behavior of traffic participants and weather conditions. A deep
Graph-based Prediction and Planning Policy Network (GP3Net) framework is
proposed for non-stationary environments that encodes the interactions between
traffic participants with contextual information and provides a decision for
safe maneuver for AV. A spatio-temporal graph models the interactions between
traffic participants for predicting the future trajectories of those
participants. The predicted trajectories are utilized to generate a future
occupancy map around the AV with uncertainties embedded to anticipate the
evolving non-stationary driving environments. Then the contextual information
and future occupancy maps are input to the policy network of the GP3Net
framework and trained using Proximal Policy Optimization (PPO) algorithm. The
proposed GP3Net performance is evaluated on standard CARLA benchmarking
scenarios with domain shifts of traffic patterns (urban, highway, and mixed).
The results show that the GP3Net outperforms previous state-of-the-art
imitation learning-based planning models for different towns. Further, in
unseen new weather conditions, GP3Net completes the desired route with fewer
traffic infractions. Finally, the results emphasize the advantage of including
the prediction module to enhance safety measures in non-stationary
environments.
- Abstract(参考訳): 最近の自動運転車のモーションプランニング(avs)の進歩は、非定常運転環境でのエキスパートドライバーの行動を使うことに大きな期待を示している。
しかし、専門家ドライバーによる学習は、交通参加者のダイナミックな振る舞いと気象条件のために、ドメインシフトやほぼ障害シナリオから回復するために、より汎用性を必要とする。
深層グラフに基づく予測・計画政策ネットワーク(GP3Net)フレームワークは,交通参加者間のインタラクションをコンテキスト情報にエンコードし,AVの安全な操作を判断する非定常環境に対して提案されている。
時空間グラフは、トラヒック参加者間の相互作用をモデル化し、その参加者の将来の軌跡を予測する。
予測された軌道は、進化する非定常運転環境を予測するために不確実性が埋め込まれたAV周辺の将来の占有マップを生成するために利用される。
次に、gp3netフレームワークのポリシーネットワークにコンテキスト情報と将来の占有マップを入力し、近位ポリシー最適化(ppo)アルゴリズムを用いてトレーニングする。
提案したGP3Net性能は,交通パターンのドメインシフト(アーバン,ハイウェイ,混合)を基準とした標準CARLAベンチマークシナリオで評価される。
その結果,gp3netは旧来の模倣学習型計画モデルよりも優れていた。
さらに、目に見えない新しい気象条件では、GP3Netはより少ないトラフィック違反で所望の経路を完成させる。
最後に,非定常環境における安全対策を強化するための予測モジュールの導入の利点を強調する。
関連論文リスト
- Planning with Adaptive World Models for Autonomous Driving [50.4439896514353]
運動プランナー(MP)は複雑な都市環境における安全なナビゲーションに不可欠である。
最近リリースされたMPベンチマークであるnuPlanは、クローズドループシミュレーションロジックで現実世界の駆動ログを拡張することで、この制限に対処している。
本稿では,モデル予測制御(MPC)ベースのプランナであるAdaptiveDriverを提案する。
論文 参考訳(メタデータ) (2024-06-15T18:53:45Z) - A Graph and Attentive Multi-Path Convolutional Network for Traffic
Prediction [16.28015945020806]
本稿では,将来的な交通状況を予測するために,グラフおよび注意深いマルチパス畳み込みネットワーク(GAMCN)モデルを提案する。
我々のモデルは交通条件に影響を与える空間的要因と時間的要因に焦点を当てている。
予測精度は,予測誤差が最大18.9%,予測効率が23.4%である。
論文 参考訳(メタデータ) (2022-05-30T16:24:43Z) - Predicting Future Occupancy Grids in Dynamic Environment with
Spatio-Temporal Learning [63.25627328308978]
本稿では,将来の占有予測を生成するための時間的予測ネットワークパイプラインを提案する。
現在のSOTAと比較して、我々の手法は3秒の長い水平線での占有を予測している。
我々は、さらなる研究を支援するために、nulisに基づくグリッド占有データセットを公開します。
論文 参考訳(メタデータ) (2022-05-06T13:45:32Z) - Deep Interactive Motion Prediction and Planning: Playing Games with
Motion Prediction Models [162.21629604674388]
本研究は,新しい対話型マルチエージェントニューラルネットワークポリシを予測モデルの一部として使用するゲーム理論モデル予測制御器(MPC)を提案する。
本手法の成功の基礎は,周辺エージェントの状態と地図情報に基づいて車両を操縦できる,新しいマルチエージェントポリシーネットワークの設計である。
論文 参考訳(メタデータ) (2022-04-05T17:58:18Z) - Context-Aware Scene Prediction Network (CASPNet) [3.390468002706074]
我々は,新しい畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)に基づくアーキテクチャを用いて,すべての道路利用者の動きを共同で学習し,予測する。
我々の手法は予測ベンチマークで最先端の結果に到達する。
論文 参考訳(メタデータ) (2022-01-18T12:52:01Z) - Graph-Based Spatial-Temporal Convolutional Network for Vehicle
Trajectory Prediction in Autonomous Driving [2.6774008509841005]
本稿では,グラフに基づく時空間畳み込みネットワーク(GSTCN)を提案する。
時空間の特徴を符号化し、ゲートリカレントユニット(GRU)ネットワークで復号し、将来の軌道分布を生成する。
次世代シミュレーション(NGSIM)におけるI-80とUS-101の2つの実世界の高速道路軌跡データを用いたネットワーク評価
論文 参考訳(メタデータ) (2021-09-27T02:20:38Z) - PSTN: Periodic Spatial-temporal Deep Neural Network for Traffic
Condition Prediction [8.255993195520306]
本稿では,交通条件の予測性能を改善するために,周期的深部ニューラルネットワーク(PSTN)を3つのモジュールで提案する。
まず、歴史交通情報を折り畳み、グラフ畳み込みネットワークと時間畳み込みネットワークからなるモジュールに供給する。
論文 参考訳(メタデータ) (2021-08-05T07:42:43Z) - An End-to-end Deep Reinforcement Learning Approach for the Long-term
Short-term Planning on the Frenet Space [0.0]
本稿では,自動運転車の意思決定と動作計画に向けた,エンドツーエンドの継続的強化学習手法を提案する。
初めて、Frenet空間上の状態と行動空間の両方を定義して、走行挙動を道路曲率に変化させないようにする。
このアルゴリズムは、フィードバックコントローラが追跡するFrenetフレーム上で連続時間軌道を生成する。
論文 参考訳(メタデータ) (2020-11-26T02:40:07Z) - TPNet: Trajectory Proposal Network for Motion Prediction [81.28716372763128]
Trajectory Proposal Network (TPNet) は、新しい2段階の動作予測フレームワークである。
TPNetはまず、仮説の提案として将来の軌道の候補セットを生成し、次に提案の分類と修正によって最終的な予測を行う。
4つの大規模軌道予測データセットの実験は、TPNetが定量的かつ定性的に、最先端の結果を達成することを示した。
論文 参考訳(メタデータ) (2020-04-26T00:01:49Z) - PiP: Planning-informed Trajectory Prediction for Autonomous Driving [69.41885900996589]
マルチエージェント設定における予測問題に対処するために,計画インフォームド・トラジェクトリ予測(PiP)を提案する。
本手法は,エゴカーの計画により予測過程を通知することにより,高速道路のデータセット上でのマルチエージェント予測の最先端性能を実現する。
論文 参考訳(メタデータ) (2020-03-25T16:09:54Z) - Accelerating Deep Reinforcement Learning With the Aid of Partial Model:
Energy-Efficient Predictive Video Streaming [97.75330397207742]
深層強化学習を用いて,モバイルネットワーク上でのエネルギー効率の高いビデオストリーミングのための予測電力割り当てを考案した。
連続状態と行動空間を扱うために、我々はDeep Deterministic Policy gradient (DDPG)アルゴリズムを利用する。
シミュレーションの結果,提案手法は完全大規模チャネル予測に基づいて導出される最適方針に収束することが示された。
論文 参考訳(メタデータ) (2020-03-21T17:36:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。