論文の概要: Towards Intelligible Human-Robot Interaction: An Active Inference Approach to Occluded Pedestrian Scenarios
- arxiv url: http://arxiv.org/abs/2602.23109v2
- Date: Fri, 27 Feb 2026 02:36:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.743684
- Title: Towards Intelligible Human-Robot Interaction: An Active Inference Approach to Occluded Pedestrian Scenarios
- Title(参考訳): インテリジェントな人間-ロボットインタラクションを目指して--歩行者シナリオへのアクティブ推論アプローチ
- Authors: Kai Chen, Yuyao Huang, Guang Chen,
- Abstract要約: 歩行者の突然の出現は 自動運転にとって 重要な安全上の課題だ
従来のルールベースあるいは純粋にデータ駆動アプローチは、これらのロングテールシナリオの本質的な高い不確実性に苦しむ。
そこで本研究では,エージェントに人間的,信念駆動的なメカニズムを付与する,アクティブ推論に基づく新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 17.074920390913995
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The sudden appearance of occluded pedestrians presents a critical safety challenge in autonomous driving. Conventional rule-based or purely data-driven approaches struggle with the inherent high uncertainty of these long-tail scenarios. To tackle this challenge, we propose a novel framework grounded in Active Inference, which endows the agent with a human-like, belief-driven mechanism. Our framework leverages a Rao-Blackwellized Particle Filter (RBPF) to efficiently estimate the pedestrian's hybrid state. To emulate human-like cognitive processes under uncertainty, we introduce a Conditional Belief Reset mechanism and a Hypothesis Injection technique to explicitly model beliefs about the pedestrian's multiple latent intentions. Planning is achieved via a Cross-Entropy Method (CEM) enhanced Model Predictive Path Integral (MPPI) controller, which synergizes the efficient, iterative search of CEM with the inherent robustness of MPPI. Simulation experiments demonstrate that our approach significantly reduces the collision rate compared to reactive, rule-based, and reinforcement learning (RL) baselines, while also exhibiting explainable and human-like driving behavior that reflects the agent's internal belief state.
- Abstract(参考訳): 閉塞した歩行者の突然の出現は、自動運転において重要な安全上の課題を呈している。
従来のルールベースあるいは純粋にデータ駆動アプローチは、これらのロングテールシナリオの本質的な高い不確実性に苦しむ。
この課題に対処するために,エージェントに人間的,信念駆動的なメカニズムを付与する,アクティブ推論に基づく新しいフレームワークを提案する。
筆者らのフレームワークは,Rao-Blackwellized Particle Filter (RBPF) を利用して,歩行者のハイブリッド状態を効率的に推定する。
不確実性下でのヒューマンライクな認知過程をエミュレートするために,歩行者の複数の潜伏意図に関する信念を明示的にモデル化する条件的信念リセット機構と仮説注入手法を導入する。
CEM(Cross-Entropy Method)拡張MPPI(Model Predictive Path Integral)コントローラによって計画が達成され、MPPIの本質的な堅牢性とCEMの効率的かつ反復的な探索を相乗化する。
シミュレーション実験により,本手法は反応,ルールベース,強化学習(RL)ベースラインと比較して衝突速度を著しく低下させるとともに,エージェントの内部信念を反映した説明可能な人間ライクな運転行動を示す。
関連論文リスト
- More Than Irrational: Modeling Belief-Biased Agents [25.274115351731325]
本稿では,認知的拘束力のあるエージェントに対して,偏見的信念の下で最適に作用する計算合理的(CR)ユーザモデルについて紹介する。
受動的観察から、潜伏するユーザ固有の境界を識別し、バイアスのある信念状態を推定するという課題に対処する。
CRモデルはメモリ容量の異なるレベルに対応する直感的に妥当な振る舞いを生成する。
論文 参考訳(メタデータ) (2025-11-15T21:14:37Z) - SPACeR: Self-Play Anchoring with Centralized Reference Models [50.55045557371374]
Simエージェントポリシーは、現実的で、人間らしく、高速で、マルチエージェント設定でスケーラブルである。
大規模な拡散モデルやトークン化モデルを用いた模倣学習の最近の進歩は、人間の運転データから直接行動を把握することができることを示している。
本研究では,事前訓練されたトークン化自己回帰運動モデルを利用したSPACeRを提案する。
論文 参考訳(メタデータ) (2025-10-20T19:53:02Z) - Game-Theoretic Modeling of Vehicle Unprotected Left Turns Considering Drivers' Bounded Rationality [17.5324678856791]
車両の左旋回防止シナリオに対する新たな意思決定モデルを提案する。
我々のモデルは、ドライバーの有界合理性を考慮したゲーム理論を統合する。
本研究は,有界有理性を有する車両の意思決定行動に関する貴重な知見に寄与する。
論文 参考訳(メタデータ) (2025-07-02T02:22:11Z) - Beyond Patterns: Harnessing Causal Logic for Autonomous Driving Trajectory Prediction [10.21659221112514]
本稿では、因果推論を利用して予測堅牢性、一般化、精度を向上させる新しい軌道予測フレームワークを提案する。
本研究は、軌跡予測の因果推論の可能性を強調し、ロバストな自律運転システムへの道を開くものである。
論文 参考訳(メタデータ) (2025-05-11T05:56:07Z) - On Minimizing Adversarial Counterfactual Error in Adversarial RL [18.044879441434432]
敵の騒音は、安全クリティカルなシナリオにおいて重大なリスクを生じさせる。
我々は,ACoE(Adversarial Counterfactual Error)と呼ばれる新しい目標を導入する。
本手法は, 対向RL問題に対処するための最先端手法を著しく上回っている。
論文 参考訳(メタデータ) (2024-06-07T08:14:24Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Reinforcement Learning with a Terminator [80.34572413850186]
我々は, TerMDP のパラメータを学習し, 推定問題の構造を活用し, 状態ワイドな信頼境界を提供する。
我々はこれらを用いて証明可能な効率のよいアルゴリズムを構築し、終端を考慮し、その後悔を抑える。
論文 参考訳(メタデータ) (2022-05-30T18:40:28Z) - Active Uncertainty Learning for Human-Robot Interaction: An Implicit
Dual Control Approach [5.05828899601167]
暗黙的な二重制御パラダイムに基づくループ内動作計画のための不確実性学習を実現するアルゴリズムを提案する。
提案手法は,動的プログラミングモデル予測制御問題のサンプリングに基づく近似に依拠する。
結果として得られたポリシーは、連続的およびカテゴリー的不確実性を持つ一般的な人間の予測モデルに対する二重制御効果を維持することが示されている。
論文 参考訳(メタデータ) (2022-02-15T20:40:06Z) - Risk-Sensitive Sequential Action Control with Multi-Modal Human
Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。
私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。
シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文 参考訳(メタデータ) (2020-09-12T02:02:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。