論文の概要: EvoQRE: Modeling Bounded Rationality in Safety-Critical Traffic Simulation via Evolutionary Quantal Response Equilibrium
- arxiv url: http://arxiv.org/abs/2601.05653v1
- Date: Fri, 09 Jan 2026 09:21:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.713824
- Title: EvoQRE: Modeling Bounded Rationality in Safety-Critical Traffic Simulation via Evolutionary Quantal Response Equilibrium
- Title(参考訳): EvoQRE:進化的量子応答平衡による安全臨界交通シミュレーションにおける境界緩和性モデリング
- Authors: Phu-Hoa Pham, Chi-Nguyen Tran, Duy-Minh Dao-Sy, Phu-Quy Nguyen-Lam, Trung-Kiet Huynh,
- Abstract要約: EvoQREは、安全クリティカルなトラフィックインタラクションをモデル化するための原則化されたフレームワークである。
事前学習された生成世界モデルとエントロピー規則化された複製子ダイナミクスを統合する。
最先端の現実主義、安全基準の改善、多様な安全クリティカルシナリオの制御可能な生成を実現している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing traffic simulation frameworks for autonomous vehicles typically rely on imitation learning or game-theoretic approaches that solve for Nash or coarse correlated equilibria, implicitly assuming perfectly rational agents. However, human drivers exhibit bounded rationality, making approximately optimal decisions under cognitive and perceptual constraints. We propose EvoQRE, a principled framework for modeling safety-critical traffic interactions as general-sum Markov games solved via Quantal Response Equilibrium (QRE) and evolutionary game dynamics. EvoQRE integrates a pre-trained generative world model with entropy-regularized replicator dynamics, capturing stochastic human behavior while maintaining equilibrium structure. We provide rigorous theoretical results, proving that the proposed dynamics converge to Logit-QRE under a two-timescale stochastic approximation with an explicit convergence rate of O(log k / k^{1/3}) under weak monotonicity assumptions. We further extend QRE to continuous action spaces using mixture-based and energy-based policy representations. Experiments on the Waymo Open Motion Dataset and nuPlan benchmark demonstrate that EvoQRE achieves state-of-the-art realism, improved safety metrics, and controllable generation of diverse safety-critical scenarios through interpretable rationality parameters.
- Abstract(参考訳): 既存の自動運転車の交通シミュレーションフレームワークは、通常、完全に合理的なエージェントを暗黙的に仮定して、ナッシュや粗い相関均衡のために解決する模倣学習やゲーム理論のアプローチに依存している。
しかしながら、人間のドライバーは有界な合理性を示し、認知的および知覚的制約の下でほぼ最適な決定をする。
本稿では,QRE(Quantal Response Equilibrium)と進化型ゲームダイナミクスを用いて,一般的なマルコフゲームとして,安全クリティカルなトラフィックインタラクションをモデル化するための原則的フレームワークであるEvoQREを提案する。
EvoQREは、事前訓練された生成世界モデルとエントロピー規則化された複製子ダイナミクスを統合し、平衡構造を維持しながら確率的な人間の振る舞いを捉えている。
我々は厳密な理論的結果を提供し、提案された力学が、弱い単調性仮定の下で O(log k / k^{1/3}) の明示的な収束率で2時間スケールの確率近似の下でLogit-QREに収束することを証明した。
さらに、混合型およびエネルギーベースの政策表現を用いて、QREを連続的な行動空間に拡張する。
Waymo Open Motion DatasetとnuPlanベンチマークの実験では、EvoQREが最先端のリアリズム、安全基準の改善、解釈可能な合理性パラメータによる多様な安全クリティカルシナリオの制御が可能な生成を実現している。
関連論文リスト
- Towards Intelligible Human-Robot Interaction: An Active Inference Approach to Occluded Pedestrian Scenarios [17.074920390913995]
歩行者の突然の出現は 自動運転にとって 重要な安全上の課題だ
従来のルールベースあるいは純粋にデータ駆動アプローチは、これらのロングテールシナリオの本質的な高い不確実性に苦しむ。
そこで本研究では,エージェントに人間的,信念駆動的なメカニズムを付与する,アクティブ推論に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-26T15:22:07Z) - SPACeR: Self-Play Anchoring with Centralized Reference Models [50.55045557371374]
Simエージェントポリシーは、現実的で、人間らしく、高速で、マルチエージェント設定でスケーラブルである。
大規模な拡散モデルやトークン化モデルを用いた模倣学習の最近の進歩は、人間の運転データから直接行動を把握することができることを示している。
本研究では,事前訓練されたトークン化自己回帰運動モデルを利用したSPACeRを提案する。
論文 参考訳(メタデータ) (2025-10-20T19:53:02Z) - Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.69551510148673]
コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。
シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。
マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文 参考訳(メタデータ) (2025-10-09T04:48:49Z) - Game-Theoretic Modeling of Vehicle Unprotected Left Turns Considering Drivers' Bounded Rationality [17.5324678856791]
車両の左旋回防止シナリオに対する新たな意思決定モデルを提案する。
我々のモデルは、ドライバーの有界合理性を考慮したゲーム理論を統合する。
本研究は,有界有理性を有する車両の意思決定行動に関する貴重な知見に寄与する。
論文 参考訳(メタデータ) (2025-07-02T02:22:11Z) - Beyond Patterns: Harnessing Causal Logic for Autonomous Driving Trajectory Prediction [10.21659221112514]
本稿では、因果推論を利用して予測堅牢性、一般化、精度を向上させる新しい軌道予測フレームワークを提案する。
本研究は、軌跡予測の因果推論の可能性を強調し、ロバストな自律運転システムへの道を開くものである。
論文 参考訳(メタデータ) (2025-05-11T05:56:07Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Analyzing and Enhancing Closed-loop Stability in Reactive Simulation [25.27603440925488]
本研究では,シミュレーションと現実の交通シナリオ間の人間の行動ギャップを埋める新しいリアクティブ・シミュレーション・フレームワークを提案する。
まず、シミュレーション状態列の滑らかさと一貫性が安定性の重要な要因となる新しい反応性シミュレーションフレームワークを提案する。
次に、反応シミュレーションの閉ループ安定性を改善するために、キネマティック車両モデルをフレームワークに組み込む。
論文 参考訳(メタデータ) (2022-08-09T06:31:35Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。