論文の概要: GPG-HT: Generalized Policy Gradient with History-Aware Decision Transformer for Probabilistic Path Planning
- arxiv url: http://arxiv.org/abs/2508.17218v1
- Date: Sun, 24 Aug 2025 05:41:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.40836
- Title: GPG-HT: Generalized Policy Gradient with History-Aware Decision Transformer for Probabilistic Path Planning
- Title(参考訳): GPG-HT:確率的経路計画のための履歴対応決定変換器を用いた一般化政策勾配
- Authors: Xing Wei, Yuqi Ouyang,
- Abstract要約: 本稿では,決定変換器をGPG(Generalized Policy Gradient)フレームワークと統合した経路計画ソリューションを提案する。
長期的な依存関係をモデル化するTransformerの意思決定能力に基づいて,提案手法は経路決定の精度と安定性を向上させる。
- 参考スコア(独自算出の注目度): 10.790753340194762
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rapidly increased number of vehicles in urban areas, existing road infrastructure struggles to accommodate modern traffic demands, resulting in the issue of congestion. This highlights the importance of efficient path planning strategies. However, most recent navigation models focus solely on deterministic or time-dependent networks, while overlooking the correlations and the stochastic nature of traffic flows. In this work, we address the reliable shortest path problem within stochastic transportation networks under certain dependencies. We propose a path planning solution that integrates the decision Transformer with the Generalized Policy Gradient (GPG) framework. Based on the decision Transformer's capability to model long-term dependencies, our proposed solution improves the accuracy and stability of path decisions. Experimental results on the Sioux Falls Network (SFN) demonstrate that our approach outperforms previous baselines in terms of on-time arrival probability, providing more accurate path planning solutions.
- Abstract(参考訳): 都市部での車両の急増に伴い、既存の道路インフラは近代的な交通需要に対応するのに苦労し、渋滞の問題となった。
これは効率的な経路計画戦略の重要性を強調します。
しかし、最近のナビゲーションモデルは、決定論的または時間に依存したネットワークにのみ焦点をあてる一方で、トラフィックフローの相関性や確率的性質を見越す。
本研究では, 確率的輸送ネットワークにおいて, 信頼度の高い最短経路問題に, 一定の依存の下で対処する。
本稿では,決定変換器をGPG(Generalized Policy Gradient)フレームワークと統合した経路計画ソリューションを提案する。
長期的な依存関係をモデル化するTransformerの意思決定能力に基づいて,提案手法は経路決定の精度と安定性を向上させる。
Sioux Falls Network (SFN) の実験結果によると、我々の手法は、より正確な経路計画ソリューションを提供し、オンタイム到着確率において、過去のベースラインよりも優れていた。
関連論文リスト
- DynamicRouteGPT: A Real-Time Multi-Vehicle Dynamic Navigation Framework Based on Large Language Models [13.33340860174857]
複雑な交通環境におけるリアルタイムな動的経路計画は、交通量の変化や信号待ち時間といった課題を提示する。
DijkstraやA*のような従来の静的ルーティングアルゴリズムは最短経路を計算するが、しばしば動的条件下で失敗する。
本稿では,実時間動的経路計画のための因果推論に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2024-08-26T11:19:58Z) - Residual Chain Prediction for Autonomous Driving Path Planning [5.139918355140954]
残留連鎖損失は損失計算過程を動的に調整し、予測経路点の時間依存性と精度を高める。
我々の研究は、自動運転車の計画コンポーネントに革命をもたらすために、Residual Chain Lossの可能性を浮き彫りにした。
論文 参考訳(メタデータ) (2024-04-08T11:43:40Z) - A Data-driven Resilience Framework of Directionality Configuration based
on Topological Credentials in Road Networks [0.5154704494242526]
本稿では,最適化に基づくBrute Force検索手法と意思決定支援フレームワークを統合した新しい道路再構成手法を提案する。
提案フレームワークは、最適化プロセス中に生成されたシナリオからの入力を組み合わせ、マルチ基準決定分析アプローチを取り入れている。
道路構成のランク付けには、リッジ回帰などの機械学習アルゴリズムを使用して、各基準に対する最適な重みを決定する。
論文 参考訳(メタデータ) (2024-01-14T21:22:22Z) - Integrating Higher-Order Dynamics and Roadway-Compliance into
Constrained ILQR-based Trajectory Planning for Autonomous Vehicles [3.200238632208686]
軌道計画は、自動運転車のグローバルな最適ルートを作成することを目的としている。
既存の自転車キネマティックモデルを用いた実装では、制御可能な軌道は保証できない。
このモデルを、曲率と長手ジャークの1階および2階微分を含む高階項で拡張する。
論文 参考訳(メタデータ) (2023-09-25T22:30:18Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - An End-to-end Deep Reinforcement Learning Approach for the Long-term
Short-term Planning on the Frenet Space [0.0]
本稿では,自動運転車の意思決定と動作計画に向けた,エンドツーエンドの継続的強化学習手法を提案する。
初めて、Frenet空間上の状態と行動空間の両方を定義して、走行挙動を道路曲率に変化させないようにする。
このアルゴリズムは、フィードバックコントローラが追跡するFrenetフレーム上で連続時間軌道を生成する。
論文 参考訳(メタデータ) (2020-11-26T02:40:07Z) - Constructing Geographic and Long-term Temporal Graph for Traffic
Forecasting [88.5550074808201]
交通予測のための地理・長期時間グラフ畳み込み型ニューラルネットワーク(GLT-GCRNN)を提案する。
本研究では,地理的・長期的時間的パターンを共有する道路間のリッチな相互作用を学習する交通予測のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-23T03:50:46Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。