論文の概要: Generalizable Trajectory Prediction via Inverse Reinforcement Learning with Mamba-Graph Architecture
- arxiv url: http://arxiv.org/abs/2506.12474v1
- Date: Sat, 14 Jun 2025 12:18:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:46.28987
- Title: Generalizable Trajectory Prediction via Inverse Reinforcement Learning with Mamba-Graph Architecture
- Title(参考訳): マンバグラフアーキテクチャを用いた逆強化学習による一般化可能な軌道予測
- Authors: Wenyun Li, Wenjie Huang, Zejian Deng, Chen Sun,
- Abstract要約: 本稿では,人間的な意思決定を捉える新しい逆強化学習フレームワークを提案する。
学習した報酬関数を用いてエンコーダ・デコーダアーキテクチャによる出力の可能性を最大化する。
- 参考スコア(独自算出の注目度): 6.590896800137733
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate driving behavior modeling is fundamental to safe and efficient trajectory prediction, yet remains challenging in complex traffic scenarios. This paper presents a novel Inverse Reinforcement Learning (IRL) framework that captures human-like decision-making by inferring diverse reward functions, enabling robust cross-scenario adaptability. The learned reward function is utilized to maximize the likelihood of output by the encoder-decoder architecture that combines Mamba blocks for efficient long-sequence dependency modeling with graph attention networks to encode spatial interactions among traffic agents. Comprehensive evaluations on urban intersections and roundabouts demonstrate that the proposed method not only outperforms various popular approaches in prediction accuracy but also achieves 2 times higher generalization performance to unseen scenarios compared to other IRL-based method.
- Abstract(参考訳): 正確な運転行動モデリングは安全かつ効率的な軌道予測の基礎であるが、複雑な交通シナリオでは依然として困難である。
本稿では,多種多様な報酬関数を推定することにより,人間的な意思決定を捉える新しい逆強化学習(IRL)フレームワークを提案する。
学習した報奨関数は,Mambaブロックとグラフアテンションネットワークを併用して,トラフィックエージェント間の空間的相互作用を符号化するエンコーダ・デコーダアーキテクチャにより,出力の可能性を最大化するために用いられる。
都市交差点とラウンドアバウンドに関する総合的な評価は、提案手法が予測精度において様々な一般的なアプローチより優れるだけでなく、他のIRL法に比べて2倍高い一般化性能を達成していることを示している。
関連論文リスト
- TrajFlow: Multi-modal Motion Prediction via Flow Matching [29.274577509291973]
本稿では,新しいフローマッチングに基づく動き予測フレームワークであるTrajFlowを紹介する。
TrajFlowは1回のパスで複数の可算な将来の軌跡を予測し、計算オーバーヘッドを大幅に削減する。
さまざまな主要なメトリクスにわたって最先端のパフォーマンスを達成し、安全クリティカルな自動運転アプリケーションの有効性を裏付ける。
論文 参考訳(メタデータ) (2025-06-10T08:08:31Z) - Future-Aware Interaction Network For Motion Forecasting [10.211526610529374]
本稿では,シーンエンコーディングに将来的な軌跡を取り入れたインタラクションベースの「Future-Aware Interaction Network」を提案する。
空間的相互作用モデリングにMambaを適用するために,未順序データを構造化シーケンスに変換する適応的リオーダー戦略を提案する。
マンバは、生成した将来の軌道を時間的に洗練し、より一貫した予測を保証するために使用される。
論文 参考訳(メタデータ) (2025-03-09T11:38:34Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - SEPT: Towards Efficient Scene Representation Learning for Motion
Prediction [19.111948522155004]
本稿では,自己教師付き学習を活用し,複雑な交通シーンのための強力なモデルを開発するためのモデリングフレームワークSEPTを提案する。
実験により、SEPTはアーキテクチャ設計や機能エンジニアリングを伴わず、Argoverse 1 と Argoverse 2 のモーション予測ベンチマークで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2023-09-26T21:56:03Z) - MacFormer: Map-Agent Coupled Transformer for Real-time and Robust
Trajectory Prediction [26.231420111336565]
実時間およびロバストな軌道予測のためのMap-Agent Coupled Transformer (MacFormer)を提案する。
本フレームワークは,共用マップと参照抽出器という,慎重に設計された2つのモジュールを通じて,マップ制約をネットワークに明示的に組み込む。
我々はArgoverse 1 と Argoverse 2 と nuScenes の実世界のベンチマークに対するアプローチを評価し、いずれも最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2023-08-20T14:27:28Z) - Traj-MAE: Masked Autoencoders for Trajectory Prediction [69.7885837428344]
軌道予測は、危険を予測して信頼性の高い自動運転システムを構築する上で重要な課題である。
本稿では,運転環境におけるエージェントの複雑な動作をよりよく表現する,軌道予測のための効率的なマスク付きオートエンコーダを提案する。
複数エージェント設定と単一エージェント設定の両方の実験結果から,Traj-MAEが最先端手法と競合する結果が得られることが示された。
論文 参考訳(メタデータ) (2023-03-12T16:23:27Z) - Multi-modal Trajectory Prediction for Autonomous Driving with Semantic
Map and Dynamic Graph Attention Network [12.791191495432829]
現実の交通シナリオにおける軌道予測にはいくつかの課題がある。
目的や周囲に注意を払って交通をナビゲートする人々の自然な習慣に触発された本論文は,ユニークなグラフ注意ネットワークを示す。
ネットワークはエージェント間の動的社会的相互作用をモデル化し、セマンティックマップでトラフィックルールに適合するように設計されている。
論文 参考訳(メタデータ) (2021-03-30T11:53:12Z) - Congestion-aware Multi-agent Trajectory Prediction for Collision
Avoidance [110.63037190641414]
渋滞パターンを明示的に学習し、新しい「センス--学習--Reason--予測」フレームワークを考案する。
学習段階を2段階に分解することで、「学生」は「教師」から文脈的手がかりを学習し、衝突のない軌跡を生成する。
実験では,提案モデルが合成データセットにおいて衝突のない軌道予測を生成できることを実証する。
論文 参考訳(メタデータ) (2021-03-26T02:42:33Z) - Learning Scalable Multi-Agent Coordination by Spatial Differentiation
for Traffic Signal Control [8.380832628205372]
交通信号制御のためのディープ強化学習法に基づくマルチエージェント協調フレームワークを設計する。
具体的には、リプレイバッファ内の時間空間情報を用いて各アクションの報酬を補正する調整のための空間差分法を提案する。
論文 参考訳(メタデータ) (2020-02-27T02:16:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。