論文の概要: Goal-Oriented Reactive Simulation for Closed-Loop Trajectory Prediction
- arxiv url: http://arxiv.org/abs/2603.24155v1
- Date: Wed, 25 Mar 2026 10:24:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.244425
- Title: Goal-Oriented Reactive Simulation for Closed-Loop Trajectory Prediction
- Title(参考訳): ゴール指向の反応シミュレーションによる閉ループ軌道予測
- Authors: Harsh Yadav, Tobias Meisen,
- Abstract要約: 現在の軌道予測モデルは、主にオープンループ方式で訓練されている。
本稿では,高周波数・遅延型地平線エゴ予測に最適化されたオンライン閉ループトレーニングパラダイムを提案する。
- 参考スコア(独自算出の注目度): 9.812666469580872
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current trajectory prediction models are primarily trained in an open-loop manner, which often leads to covariate shift and compounding errors when deployed in real-world, closed-loop settings. Furthermore, relying on static datasets or non-reactive log-replay simulators severs the interactive loop, preventing the ego agent from learning to actively negotiate surrounding traffic. In this work, we propose an on-policy closed-loop training paradigm optimized for high-frequency, receding horizon ego prediction. To ground the ego prediction in a realistic representation of traffic interactions and to achieve reactive consistency, we introduce a goal-oriented, transformer-based scene decoder, resulting in an inherently reactive training simulation. By exposing the ego agent to a mixture of open-loop data and simulated, self-induced states, the model learns recovery behaviors to correct its own execution errors. Extensive evaluation demonstrates that closed-loop training significantly enhances collision avoidance capabilities at high replanning frequencies, yielding relative collision rate reductions of up to 27.0% on nuScenes and 79.5% in dense DeepScenario intersections compared to open-loop baselines. Additionally, we show that a hybrid simulation combining reactive with non-reactive surrounding agents achieves optimal balance between immediate interactivity and long-term behavioral stability.
- Abstract(参考訳): 現在の軌道予測モデルは、主にオープンループ方式で訓練されており、実世界のクローズドループ設定でデプロイされた場合、共変量シフトや複合エラーにつながることが多い。
さらに、静的データセットや非反応性ログ再生シミュレータに依存してインタラクティブループを分離し、egoエージェントが学習して周囲のトラフィックを積極的に交渉するのを防ぐ。
本研究では,高周波数・遅延水平エゴ予測に最適化されたオンライン閉ループ訓練パラダイムを提案する。
現実的な交通相互作用の表現にエゴ予測を基礎として、反応一貫性を実現するため、ゴール指向のトランスフォーマーベースのシーンデコーダを導入し、本質的に反応性のあるトレーニングシミュレーションを行う。
エゴエージェントをオープンループデータとシミュレートされた自己誘導状態の混合に露出することにより、モデルがリカバリ動作を学び、自身の実行エラーを修正する。
広範囲な評価により、閉ループトレーニングは高いリプラン周波数での衝突回避能力を著しく向上し、ニューScenesでは最大27.0%、DeepScenarioの交点では79.5%の相対的な衝突速度低下をもたらすことが示されている。
さらに,反応剤と非反応性周囲剤を併用したハイブリッドシミュレーションにより,即時相互作用性と長期挙動安定性の最適バランスが得られることを示す。
関連論文リスト
- Rectify, Don't Regret: Avoiding Pitfalls of Differentiable Simulation in Trajectory Prediction [8.730908751307737]
現在のオープンループ軌道モデルは、小さな初期偏差が複雑なエラーを発生させるため、現実の自動運転に苦慮している。
シミュレーションステップ間のグラフを明示的に除去するために、分離された後退水平方向のロールアウトを導入する。
我々の手法はより堅牢な回復戦略をもたらし、目標衝突を最大33.24%削減する。
論文 参考訳(メタデータ) (2026-03-24T16:28:09Z) - ForSim: Stepwise Forward Simulation for Traffic Policy Fine-Tuning [13.668397738433852]
ForSimは段階的にクローズドループフォワードシミュレーションパラダイムである。
マルチモーダルな振る舞いの多様性を保ちながら、モダリティ内整合性を確保する。
ForSimは、グループ相対最適化と協調して、きめ細かいトラフィックポリシーを運用する。
論文 参考訳(メタデータ) (2026-02-02T10:20:11Z) - Offline Reinforcement Learning for End-to-End Autonomous Driving [1.2891210250935148]
エンドツーエンド(E2E)自律走行モデルは、カメライメージのみを入力として取り、将来の軌道を直接予測する。
オンライン強化学習(RL)は、ILによる問題を緩和する可能性がある。
カメラのみのE2EオフラインRLフレームワークを導入し、追加の探索を行わず、固定されたシミュレータデータセットのみをトレーニングする。
論文 参考訳(メタデータ) (2025-12-21T09:21:04Z) - Simulation-Driven Railway Delay Prediction: An Imitation Learning Approach [12.018920884898215]
Drift-Corrected Imitation Learning (DCIL) は、距離に基づくドリフト補正を取り入れてDAggerを拡張する新しい自己教師型アルゴリズムである。
ベルギーの鉄道インフラ管理者であるtextscInfrabel の総合的実世界のデータセットを用いて DCIL の評価を行った。
論文 参考訳(メタデータ) (2025-12-17T14:06:26Z) - Steering Vision-Language-Action Models as Anti-Exploration: A Test-Time Scaling Approach [78.4812458793128]
動作チャンクの高忠実度検証に軽量な擬数推定器を適用したテスト時間スケーリングフレームワークである textbfTACO を提案する。
我々の手法は、オフライン強化学習(RL)における古典的な反探索原理に似ており、勾配のないため、計算上の大きな恩恵をもたらす。
論文 参考訳(メタデータ) (2025-12-02T14:42:54Z) - Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.69551510148673]
コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。
シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。
マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文 参考訳(メタデータ) (2025-10-09T04:48:49Z) - Pseudo-Simulation for Autonomous Driving [66.1981253104508]
既存の自動運転車(AV)の評価パラダイムは、重大な制限に直面している。
現実世界の評価は、安全上の懸念と現実主義の欠如のためにしばしば困難である。
オープンループ評価は、一般的に複合的なエラーを見落としているメトリクスに依存する。
論文 参考訳(メタデータ) (2025-06-04T17:57:53Z) - RIFT: Group-Relative RL Fine-Tuning for Realistic and Controllable Traffic Simulation [13.319344167881383]
データ駆動シミュレーターにおいて、模擬学習事前学習を行う2段階のAV中心シミュレーションフレームワークを導入する。
次に、物理に基づくシミュレータで微調整を学習し、スタイルレベルの制御性を向上する。
微調整段階において,新しいグループ関連RL微調整戦略であるRIFTを提案する。
論文 参考訳(メタデータ) (2025-05-06T09:12:37Z) - Bench2Drive-R: Turning Real World Data into Reactive Closed-Loop Autonomous Driving Benchmark by Generative Model [63.336123527432136]
我々は,リアクティブ閉ループ評価を可能にする生成フレームワークであるBench2Drive-Rを紹介する。
既存の自動運転用ビデオ生成モデルとは異なり、提案された設計はインタラクティブなシミュレーションに適したものである。
我々は、Bench2Drive-Rの生成品質を既存の生成モデルと比較し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2024-12-11T06:35:18Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。