論文の概要: Deep Fictitious Play-Based Potential Differential Games for Learning Human-Like Interaction at Unsignalized Intersections
- arxiv url: http://arxiv.org/abs/2506.12283v1
- Date: Sat, 14 Jun 2025 00:08:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:45.685897
- Title: Deep Fictitious Play-Based Potential Differential Games for Learning Human-Like Interaction at Unsignalized Intersections
- Title(参考訳): 不特定区間における人間的なインタラクション学習のための深部的遊びに基づく潜在的な差別化ゲーム
- Authors: Kehua Chen, Shucheng Zhang, Yinhai Wang,
- Abstract要約: 我々はDeep Fictitious Playを用いて,未署名の交差点で人間のようなインタラクティブな運転ポリシーを学習する。
私たちの知る限りでは、Deep Fictitious Playを使ってインタラクティブな運転ポリシーをトレーニングするのはこれが初めてです。
- 参考スコア(独自算出の注目度): 14.779420473274737
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modeling vehicle interactions at unsignalized intersections is a challenging task due to the complexity of the underlying game-theoretic processes. Although prior studies have attempted to capture interactive driving behaviors, most approaches relied solely on game-theoretic formulations and did not leverage naturalistic driving datasets. In this study, we learn human-like interactive driving policies at unsignalized intersections using Deep Fictitious Play. Specifically, we first model vehicle interactions as a Differential Game, which is then reformulated as a Potential Differential Game. The weights in the cost function are learned from the dataset and capture diverse driving styles. We also demonstrate that our framework provides a theoretical guarantee of convergence to a Nash equilibrium. To the best of our knowledge, this is the first study to train interactive driving policies using Deep Fictitious Play. We validate the effectiveness of our Deep Fictitious Play-Based Potential Differential Game (DFP-PDG) framework using the INTERACTION dataset. The results demonstrate that the proposed framework achieves satisfactory performance in learning human-like driving policies. The learned individual weights effectively capture variations in driver aggressiveness and preferences. Furthermore, the ablation study highlights the importance of each component within our model.
- Abstract(参考訳): 符号のない交差点での車両の相互作用をモデル化することは、基礎となるゲーム理論プロセスの複雑さのために難しい課題である。
従来の研究では、インタラクティブな運転行動のキャプチャを試みたが、ほとんどのアプローチはゲーム理論の定式化にのみ依存しており、自然主義的な運転データセットを利用できなかった。
本研究では,Deep Fictitious Playを用いて,信号のない交差点で人間のような対話型運転ポリシーを学習する。
具体的には、まず車間相互作用を微分ゲームとしてモデル化し、次に潜在的な微分ゲームとして再編成する。
コスト関数の重みはデータセットから学習され、さまざまな運転スタイルをキャプチャする。
また、我々のフレームワークがナッシュ均衡への収束の理論的保証を提供することを示した。
私たちの知る限りでは、Deep Fictitious Playを使ってインタラクティブな運転ポリシーをトレーニングするのはこれが初めてです。
InterAction データセットを用いて,DFP-PDG フレームワークの有効性を検証した。
提案手法は,人間ライクな運転方針を学習する上で,十分な性能を発揮することを示す。
学習した個々の重量は、ドライバーの攻撃性と好みの変化を効果的に捉えます。
さらに、アブレーション研究は、我々のモデルにおける各コンポーネントの重要性を強調している。
関連論文リスト
- TPK: Trustworthy Trajectory Prediction Integrating Prior Knowledge For Interpretability and Kinematic Feasibility [11.436186697804835]
軌道予測は自動運転車にとって不可欠であり、車両は周囲の道路利用者の動きを予測できる。
現在のディープラーニングモデルは、予測が物理的に実現不可能で、人間には非論理的であるため、信頼性に欠けることが多い。
本稿では,エージェントの行動差を捉えるために,すべてのエージェントクラスの相互作用とキネマティックな先行を取り入れることを提案する。
論文 参考訳(メタデータ) (2025-05-10T19:29:32Z) - Learning to Drive by Imitating Surrounding Vehicles [0.6612847014373572]
模倣学習は、複雑な交通環境をナビゲートするために自動運転車を訓練するための有望なアプローチである。
本研究では, 周辺車両の観測軌道を利用することで, 模倣学習の促進を図るデータ強化戦略を提案する。
我々は、nuPlanデータセット上で、最先端の学習ベースプランニング手法PLUTOを用いて、我々のアプローチを評価し、この拡張手法が複雑な運転シナリオの性能向上につながることを実証した。
論文 参考訳(メタデータ) (2025-03-08T00:40:47Z) - ProIn: Learning to Predict Trajectory Based on Progressive Interactions for Autonomous Driving [11.887346755144485]
プログレッシブ・インタラクション・ネットワークが提案され、エージェントの特徴が関係する地図に徐々に焦点を合わせることができる。
このネットワークは、グラフ畳み込みを通じて、地図制約の複雑な影響をエージェントの特徴に徐々にエンコードする。
実験は、既存の1段階の相互作用に対する進歩的相互作用の優越性を検証した。
論文 参考訳(メタデータ) (2024-03-25T02:38:34Z) - Beyond One Model Fits All: Ensemble Deep Learning for Autonomous
Vehicles [16.398646583844286]
本研究では,Mediated Perception, Behavior Reflex, Direct Perceptionの3つの異なるニューラルネットワークモデルを紹介する。
我々のアーキテクチャは、グローバルなルーティングコマンドを使用して、ベース、将来の潜伏ベクトル予測、補助タスクネットワークからの情報を融合し、適切なアクションサブネットワークを選択する。
論文 参考訳(メタデータ) (2023-12-10T04:40:02Z) - The Integration of Prediction and Planning in Deep Learning Automated Driving Systems: A Review [43.30610493968783]
我々は、最先端のディープラーニングベースの計画システムについてレビューし、どのように予測を統合するかに焦点を当てる。
異なる統合原則の意味、強み、限界について論じる。
論文 参考訳(メタデータ) (2023-08-10T17:53:03Z) - NeurIPS 2022 Competition: Driving SMARTS [60.948652154552136]
ドライビングSMARTSは、動的相互作用コンテキストにおける分散シフトに起因する問題に対処するために設計された定期的な競争である。
提案するコンペティションは,強化学習(RL)やオフライン学習など,方法論的に多様なソリューションをサポートする。
論文 参考訳(メタデータ) (2022-11-14T17:10:53Z) - Exploring the trade off between human driving imitation and safety for
traffic simulation [0.34410212782758043]
運転方針の学習において,人間の運転の模倣と安全維持との間にはトレードオフが存在することを示す。
両目的を協調的に改善する多目的学習アルゴリズム(MOPPO)を提案する。
論文 参考訳(メタデータ) (2022-08-09T14:30:19Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Learning to drive from a world on rails [78.28647825246472]
モデルベースアプローチによって,事前記録された運転ログからインタラクティブな視覚ベースの運転方針を学習する。
世界の前方モデルは、あらゆる潜在的な運転経路の結果を予測する運転政策を監督する。
提案手法は,carla リーダボードにまずランク付けし,40 倍少ないデータを用いて25%高い運転スコアを得た。
論文 参考訳(メタデータ) (2021-05-03T05:55:30Z) - Divide-and-Conquer for Lane-Aware Diverse Trajectory Prediction [71.97877759413272]
軌道予測は、自動運転車が行動を計画し実行するための安全クリティカルなツールです。
近年の手法は,WTAやベスト・オブ・マニーといったマルチコース学習の目標を用いて,強力なパフォーマンスを実現している。
我々の研究は、軌道予測、学習出力、そして運転知識を使って制約を課すことによるより良い予測における2つの重要な課題に対処する。
論文 参考訳(メタデータ) (2021-04-16T17:58:56Z) - Deep Structured Reactive Planning [94.92994828905984]
自動運転のための新しいデータ駆動型リアクティブ計画目標を提案する。
本モデルは,非常に複雑な操作を成功させる上で,非反応性変種よりも優れることを示す。
論文 参考訳(メタデータ) (2021-01-18T01:43:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。