論文の概要: DecompGAIL: Learning Realistic Traffic Behaviors with Decomposed Multi-Agent Generative Adversarial Imitation Learning
- arxiv url: http://arxiv.org/abs/2510.06913v1
- Date: Wed, 08 Oct 2025 11:46:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.465662
- Title: DecompGAIL: Learning Realistic Traffic Behaviors with Decomposed Multi-Agent Generative Adversarial Imitation Learning
- Title(参考訳): DecompGAIL: マルチエージェント・ジェネリック・ジェネレーション・シミュレーション学習による現実的な交通行動の学習
- Authors: Ke Guo, Haochen Liu, Xiaojun Wu, Chen Lv,
- Abstract要約: 既存の模倣学習アプローチは、しばしば現実的な交通行動のモデル化に失敗する。
本稿では,現実性をエゴマップとエゴ隣接コンポーネントに明示的に分解するDecompGAILを提案する。
DecompGAILは、WOMD Sim Agents 2025ベンチマークで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 59.63038625580992
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Realistic traffic simulation is critical for the development of autonomous driving systems and urban mobility planning, yet existing imitation learning approaches often fail to model realistic traffic behaviors. Behavior cloning suffers from covariate shift, while Generative Adversarial Imitation Learning (GAIL) is notoriously unstable in multi-agent settings. We identify a key source of this instability: irrelevant interaction misguidance, where a discriminator penalizes an ego vehicle's realistic behavior due to unrealistic interactions among its neighbors. To address this, we propose Decomposed Multi-agent GAIL (DecompGAIL), which explicitly decomposes realism into ego-map and ego-neighbor components, filtering out misleading neighbor: neighbor and neighbor: map interactions. We further introduce a social PPO objective that augments ego rewards with distance-weighted neighborhood rewards, encouraging overall realism across agents. Integrated into a lightweight SMART-based backbone, DecompGAIL achieves state-of-the-art performance on the WOMD Sim Agents 2025 benchmark.
- Abstract(参考訳): 現実的な交通シミュレーションは、自律走行システムや都市移動計画の開発に不可欠であるが、既存の模倣学習アプローチは現実的な交通行動のモデル化に失敗することが多い。
行動クローニングは共変量シフトに悩まされる一方、GAIL(Generative Adversarial Imitation Learning)はマルチエージェント環境で不安定である。
無関係な相互作用の誤認: 差別者は、近隣の非現実的な相互作用によって、エゴ車の現実的な振る舞いを罰する。
そこで本研究では,現実性をego-mapとego-neighborコンポーネントに明示的に分解し,隣人や隣人である地図インタラクションをフィルタリングする,分解型マルチエージェントGAIL(DecompGAIL)を提案する。
さらに、距離重み付けされた近所の報酬でエゴ報酬を増大させる社会的PPO目標を導入し、エージェント間の全体的なリアリズムを奨励する。
軽量SMARTベースのバックボーンに統合されたDecompGAILは、WOMD Sim Agents 2025ベンチマークで最先端のパフォーマンスを達成する。
関連論文リスト
- Sim-to-Real Causal Transfer: A Metric Learning Approach to Causally-Aware Interaction Representations [58.96953392466609]
エージェント相互作用の現代的表現の因果認識を詳細に検討する。
近年の表現は、非因果剤の摂動に対して部分的に耐性があることが示されている。
本稿では,因果アノテーションを用いて潜在表現を規則化するメトリクス学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-07T18:57:03Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - PPAD: Iterative Interactions of Prediction and Planning for End-to-end Autonomous Driving [57.89801036693292]
PPAD(Iterative Interaction of Prediction and Planning Autonomous Driving)は、予測と計画のより良い統合を目的とした、タイムステップワイドなインタラクションである。
我々は,階層的動的キーオブジェクトに着目したego-to-agent,ego-to-map,ego-to-BEVインタラクション機構を設計し,インタラクションをモデル化する。
論文 参考訳(メタデータ) (2023-11-14T11:53:24Z) - Symphony: Learning Realistic and Diverse Agents for Autonomous Driving
Simulation [45.09881984441893]
本稿では,従来のポリシーと並列ビーム探索を組み合わせることで,リアリズムを大幅に改善するSymphonyを提案する。
Symphonyはこの問題を階層的なアプローチで解決し、エージェントの振る舞いをゴール生成とゴール条件に分解する。
実験により、交響楽団のエージェントは複数のベースラインよりも現実的で多様な行動を学ぶことが確認される。
論文 参考訳(メタデータ) (2022-05-06T13:21:40Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - Modeling Human Driving Behavior through Generative Adversarial Imitation
Learning [7.387855463533219]
本稿では、学習に基づくドライバモデリングにおけるGAIL(Generative Adversarial Imitation Learning)の使用について述べる。
ドライバモデリングは本質的にマルチエージェント問題であるため,PS-GAILと呼ばれるGAILのパラメータ共有拡張について述べる。
本稿では、報酬信号を変更し、エージェントにドメイン固有の知識を提供するReward Augmented Imitation Learning (RAIL)について述べる。
論文 参考訳(メタデータ) (2020-06-10T05:47:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。