論文の概要: Realistic pedestrian-driver interaction modelling using multi-agent RL with human perceptual-motor constraints
- arxiv url: http://arxiv.org/abs/2510.27383v1
- Date: Fri, 31 Oct 2025 11:18:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-03 17:52:16.082995
- Title: Realistic pedestrian-driver interaction modelling using multi-agent RL with human perceptual-motor constraints
- Title(参考訳): 人間の知覚運動制約を持つマルチエージェントRLを用いたリアルな歩行者・ドライバー相互作用モデリング
- Authors: Yueyang Wang, Mehmet Dogar, Gustav Markkula,
- Abstract要約: 本稿では,歩行者エージェントとドライバエージェントの視覚的制約と運動的制約を統合したマルチエージェント強化学習フレームワークを提案する。
その結果,視覚的制約と運動的制約を併用したモデルが最適であることが示唆された。
本フレームワークは,人口レベルの分布として人的制約を制御するパラメータをモデル化することで,個人差を考慮に入れている。
- 参考スコア(独自算出の注目度): 3.4087048085988765
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modelling pedestrian-driver interactions is critical for understanding human road user behaviour and developing safe autonomous vehicle systems. Existing approaches often rely on rule-based logic, game-theoretic models, or 'black-box' machine learning methods. However, these models typically lack flexibility or overlook the underlying mechanisms, such as sensory and motor constraints, which shape how pedestrians and drivers perceive and act in interactive scenarios. In this study, we propose a multi-agent reinforcement learning (RL) framework that integrates both visual and motor constraints of pedestrian and driver agents. Using a real-world dataset from an unsignalised pedestrian crossing, we evaluate four model variants, one without constraints, two with either motor or visual constraints, and one with both, across behavioural metrics of interaction realism. Results show that the combined model with both visual and motor constraints performs best. Motor constraints lead to smoother movements that resemble human speed adjustments during crossing interactions. The addition of visual constraints introduces perceptual uncertainty and field-of-view limitations, leading the agents to exhibit more cautious and variable behaviour, such as less abrupt deceleration. In this data-limited setting, our model outperforms a supervised behavioural cloning model, demonstrating that our approach can be effective without large training datasets. Finally, our framework accounts for individual differences by modelling parameters controlling the human constraints as population-level distributions, a perspective that has not been explored in previous work on pedestrian-vehicle interaction modelling. Overall, our work demonstrates that multi-agent RL with human constraints is a promising modelling approach for simulating realistic road user interactions.
- Abstract(参考訳): 歩行者とドライバーの相互作用をモデル化することは、人間の道路利用者の行動を理解し、安全な自動運転車システムの開発に不可欠である。
既存のアプローチはルールベースの論理、ゲーム理論モデル、あるいは'ブラックボックス'機械学習手法に依存していることが多い。
しかし、これらのモデルは、一般的には、歩行者やドライバーが対話的なシナリオでどのように認識し、行動するかを形作る、感覚やモーターの制約のような基盤となるメカニズムを軽視したり、見落としたりする。
本研究では,歩行者エージェントとドライバエージェントの視覚的制約と運動的制約を統合したマルチエージェント強化学習(RL)フレームワークを提案する。
信号のない歩行者横断から得られた実世界のデータセットを用いて、4つのモデル変種を評価する。1つは制約のないモデル、もう1つはモーターまたは視覚的制約のあるモデル、もう1つは相互作用リアリズムの行動的指標である。
その結果,視覚的制約と運動的制約を併用したモデルが最適であることが示唆された。
運動の制約は、交差する相互作用の間、人間の速度調整に似た動きを円滑にさせる。
視覚的制約の追加は知覚の不確実性や視野の制限をもたらし、エージェントは突然の減速を少なくするなど、より慎重で変動的な振る舞いを示す。
このデータ制限設定では、我々のモデルは教師付き行動クローンモデルよりも優れており、大規模なトレーニングデータセットを使わずに、我々のアプローチが効果的であることを示す。
最後に,本フレームワークは,歩行者と車両の相互作用をモデル化する従来の研究では検討されていない,人口レベルの分布として人的制約を制御するパラメータをモデル化することで,個人差を考慮に入れている。
全体として、人間の制約のあるマルチエージェントRLは、現実的な道路ユーザインタラクションをシミュレートするための有望なモデリング手法であることを示す。
関連論文リスト
- Game-Theoretic Modeling of Vehicle Unprotected Left Turns Considering Drivers' Bounded Rationality [17.5324678856791]
車両の左旋回防止シナリオに対する新たな意思決定モデルを提案する。
我々のモデルは、ドライバーの有界合理性を考慮したゲーム理論を統合する。
本研究は,有界有理性を有する車両の意思決定行動に関する貴重な知見に寄与する。
論文 参考訳(メタデータ) (2025-07-02T02:22:11Z) - Markov Regime-Switching Intelligent Driver Model for Interpretable Car-Following Behavior [19.229274803939983]
我々は、運転動作を異なるIDMパラメータセットで制御できるレギュラースイッチングフレームワークを導入する。
IDM力学を用いたファクショナル隠れマルコフモデルを用いてフレームワークをインスタンス化する。
論文 参考訳(メタデータ) (2025-06-17T17:55:42Z) - Trajeglish: Traffic Modeling as Next-Token Prediction [67.28197954427638]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。
車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。
我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文 参考訳(メタデータ) (2023-12-07T18:53:27Z) - InterControl: Zero-shot Human Interaction Generation by Controlling Every Joint [67.6297384588837]
関節間の所望距離を維持するために,新しい制御可能な運動生成手法であるInterControlを導入する。
そこで本研究では,既成の大規模言語モデルを用いて,ヒューマンインタラクションのための結合ペア間の距離を生成できることを実証した。
論文 参考訳(メタデータ) (2023-11-27T14:32:33Z) - Persistent-Transient Duality: A Multi-mechanism Approach for Modeling
Human-Object Interaction [58.67761673662716]
人間は高度に適応可能で、異なるタスク、状況、状況を扱うために異なるモードを素早く切り替える。
人間と物体の相互作用(HOI)において、これらのモードは、(1)活動全体に対する大規模な一貫した計画、(2)タイムラインに沿って開始・終了する小規模の子どもの対話的行動の2つのメカニズムに起因していると考えられる。
本研究は、人間の動作を協調的に制御する2つの同時メカニズムをモデル化することを提案する。
論文 参考訳(メタデータ) (2023-07-24T12:21:33Z) - Modeling human road crossing decisions as reward maximization with
visual perception limitations [23.561752465516047]
我々は,計算的合理性に基づく歩行者横断決定のモデルを開発する。
提案した認知-RLモデルは、ギャップ受容と交差開始時間の人間的なパターンをキャプチャする。
以上の結果から,これは人間の知覚的限界に対する合理的適応である可能性が示唆された。
論文 参考訳(メタデータ) (2023-01-27T14:20:35Z) - Isolating and Leveraging Controllable and Noncontrollable Visual
Dynamics in World Models [65.97707691164558]
Iso-DreamはDream-to-Controlフレームワークを2つの側面で改善する。
まず、逆動力学を最適化することにより、世界モデルに制御可能で制御不能な情報源を学習させることを奨励する。
第2に、エージェントの挙動を世界モデルの切り離された潜在的想像力に最適化する。
論文 参考訳(メタデータ) (2022-05-27T08:07:39Z) - Solution Concepts in Hierarchical Games under Bounded Rationality with Applications to Autonomous Driving [8.500525426182115]
階層型ゲームを用いた運転行動のゲーム理論モデルを作成する。
本研究では,自然主義データに適合するモデルと,その予測能力に基づいて行動モデルを評価する。
以上の結果から, 運転行動モデルとして評価された動作モデルのうち, レベル0の振る舞いをルールフォローとしてモデル化したQuantal Level-kモデルの適応として, 運転行動のモデル化が, 自然主義的な運転行動に最も適していることが示唆された。
論文 参考訳(メタデータ) (2020-09-21T17:13:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。