論文の概要: GoIRL: Graph-Oriented Inverse Reinforcement Learning for Multimodal Trajectory Prediction
- arxiv url: http://arxiv.org/abs/2506.21121v1
- Date: Thu, 26 Jun 2025 09:46:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.040215
- Title: GoIRL: Graph-Oriented Inverse Reinforcement Learning for Multimodal Trajectory Prediction
- Title(参考訳): GoIRL:マルチモーダル軌道予測のためのグラフ指向逆強化学習
- Authors: Muleilan Pei, Shaoshuai Shi, Lu Zhang, Peiliang Li, Shaojie Shen,
- Abstract要約: 周囲のエージェントの軌道予測は自動運転の課題である。
本稿では,ベクトル化された文脈表現を備えたIRLベースの予測器であるグラフ指向逆強化学習フレームワークを提案する。
提案手法は,大規模Argoverse & nuScenesモーション予測ベンチマークにおける最先端性能を実現する。
- 参考スコア(独自算出の注目度): 35.36975133932852
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Trajectory prediction for surrounding agents is a challenging task in autonomous driving due to its inherent uncertainty and underlying multimodality. Unlike prevailing data-driven methods that primarily rely on supervised learning, in this paper, we introduce a novel Graph-oriented Inverse Reinforcement Learning (GoIRL) framework, which is an IRL-based predictor equipped with vectorized context representations. We develop a feature adaptor to effectively aggregate lane-graph features into grid space, enabling seamless integration with the maximum entropy IRL paradigm to infer the reward distribution and obtain the policy that can be sampled to induce multiple plausible plans. Furthermore, conditioned on the sampled plans, we implement a hierarchical parameterized trajectory generator with a refinement module to enhance prediction accuracy and a probability fusion strategy to boost prediction confidence. Extensive experimental results showcase our approach not only achieves state-of-the-art performance on the large-scale Argoverse & nuScenes motion forecasting benchmarks but also exhibits superior generalization abilities compared to existing supervised models.
- Abstract(参考訳): 周囲のエージェントの軌道予測は、その固有の不確実性と根底にあるマルチモーダル性のために、自律運転において難しい課題である。
本稿では、主に教師付き学習に依存する一般的なデータ駆動型手法とは異なり、ベクトル化された文脈表現を備えたIRLベースの予測器であるグラフ指向逆強化学習(GoIRL)フレームワークを提案する。
我々は,レーングラフの特徴をグリッド空間に効果的に集約する特徴適応器を開発し,最大エントロピーIRLパラダイムとのシームレスな統合により,報酬分布を推定し,複数のプラウチブルプランを導出するためのポリシを得る。
さらに, サンプル計画に基づいて, 予測精度を向上させるための階層的パラメータ化軌道生成器と, 予測信頼性を高めるための確率融合戦略を実装した。
大規模なArgoverse & nuScenes動作予測ベンチマークにおいて,我々のアプローチは最先端の性能を達成するだけでなく,既存の教師付きモデルよりも優れた一般化能力を示す。
関連論文リスト
- Motion Forecasting via Model-Based Risk Minimization [8.766024024417316]
複数モデルの予測に基づく軌道予測に適用可能な新しいサンプリング手法を提案する。
まず、予測確率に基づく従来のサンプリングは、モデル間のアライメントの欠如により性能を低下させることができることを示す。
基礎学習者として最先端モデルを用いて,最適軌道サンプリングのための多種多様な効果的なアンサンブルを構築した。
論文 参考訳(メタデータ) (2024-09-16T09:03:28Z) - Certified Human Trajectory Prediction [66.1736456453465]
本稿では,ロバスト性を保証する軌道予測に適した認証手法を提案する。
そこで本研究では, 拡散型トラジェクトリデノイザを提案し, 本手法に組み込むことにより, 性能低下を緩和する。
認定された予測器の精度と堅牢性を実証し、認定されていない予測器に対するそれらの優位性を強調する。
論文 参考訳(メタデータ) (2024-03-20T17:41:35Z) - Pre-training on Synthetic Driving Data for Trajectory Prediction [61.520225216107306]
軌道予測におけるデータ不足の問題を緩和するパイプラインレベルのソリューションを提案する。
我々は、駆動データを生成するためにHDマップ拡張とトラジェクトリ合成を採用し、それらを事前学習することで表現を学習する。
我々は、データ拡張と事前学習戦略の有効性を実証するための広範な実験を行う。
論文 参考訳(メタデータ) (2023-09-18T19:49:22Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - Distribution-aware Goal Prediction and Conformant Model-based Planning
for Safe Autonomous Driving [16.654299927694716]
本研究では,学習から学習までのタスクを,障害物認識と接地,分布認識の目標予測,モデルベース計画として再構築する。
CARLAシミュレータでは,CARNOVELベンチマークの最先端結果を報告する。
論文 参考訳(メタデータ) (2022-12-16T21:51:51Z) - Distributional Gradient Boosting Machines [77.34726150561087]
私たちのフレームワークはXGBoostとLightGBMをベースにしています。
我々は,このフレームワークが最先端の予測精度を実現することを示す。
論文 参考訳(メタデータ) (2022-04-02T06:32:19Z) - End-to-End Trajectory Distribution Prediction Based on Occupancy Grid
Maps [29.67295706224478]
本稿では,実世界における移動エージェントの将来の軌跡分布を予測することを目的としている。
我々は、接地構造分布に対する明示的かつシーン順応的な近似として、占有格子マップを用いて対称的クロスエントロピーで分布を学習する。
実験では,Stanford Drone データセットとIntersection Drone データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-31T09:24:32Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - THOMAS: Trajectory Heatmap Output with learned Multi-Agent Sampling [2.424910201171407]
本稿では,高速かつ同時エージェントによる将来のヒートマップ推定のための統一モデルアーキテクチャを提案する。
シーン一貫性のある予測を生成することは、衝突のない軌道の単なる世代を越えている。
我々は、Interaction Multi-agent Prediction Challengeについて報告し、オンラインテストリーダーボードで1st$をランク付けした。
論文 参考訳(メタデータ) (2021-10-13T10:05:47Z) - Video Prediction via Example Guidance [156.08546987158616]
ビデオ予測タスクでは、将来のコンテンツとダイナミクスのマルチモーダルな性質を捉えることが大きな課題である。
本研究では,有効な将来状態の予測を効果的に行うための,シンプルで効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-03T14:57:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。