論文の概要: Mixed Strategy Nash Equilibrium for Crowd Navigation
- arxiv url: http://arxiv.org/abs/2403.01537v5
- Date: Mon, 04 Nov 2024 03:49:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 21:25:45.490733
- Title: Mixed Strategy Nash Equilibrium for Crowd Navigation
- Title(参考訳): 群集ナビゲーションのための混合戦略ナッシュ平衡
- Authors: Max M. Sun, Francesca Baldini, Katie Hughes, Peter Trautman, Todd Murphey,
- Abstract要約: ゲーム理論は、ロボットが経路計画中に衝突回避のために人間と協力する可能性について推論するための枠組みを提供する。
混合戦略 ナッシュ均衡は不確実性の下での交渉行動を捉え、群衆のナビゲーションに適している。
提案アルゴリズムは,Byesian Recursive Nash Equilibrium (BRNE) と命名し,リアルタイムモデル予測クラウドナビゲーションフレームワークを開発した。
- 参考スコア(独自算出の注目度): 0.41942958779358663
- License:
- Abstract: Robots navigating in crowded areas should negotiate free space with humans rather than fully controlling collision avoidance, as this can lead to freezing behavior. Game theory provides a framework for the robot to reason about potential cooperation from humans for collision avoidance during path planning. In particular, the mixed strategy Nash equilibrium captures the negotiation behavior under uncertainty, making it well suited for crowd navigation. However, computing the mixed strategy Nash equilibrium is often prohibitively expensive for real-time decision-making. In this paper, we propose an iterative Bayesian update scheme over probability distributions of trajectories. The algorithm simultaneously generates a stochastic plan for the robot and probabilistic predictions of other pedestrians' paths. We prove that the proposed algorithm is equivalent to solving a mixed strategy game for crowd navigation, and the algorithm guarantees the recovery of the global Nash equilibrium of the game. We name our algorithm Bayesian Recursive Nash Equilibrium (BRNE) and develop a real-time model prediction crowd navigation framework. Since BRNE is not solving a general-purpose mixed strategy Nash equilibrium but a tailored formula specifically for crowd navigation, it can compute the solution in real-time on a low-power embedded computer. We evaluate BRNE in both simulated environments and real-world pedestrian datasets. BRNE consistently outperforms non-learning and learning-based methods regarding safety and navigation efficiency. It also reaches human-level crowd navigation performance in the pedestrian dataset benchmark. Lastly, we demonstrate the practicality of our algorithm with real humans on an untethered quadruped robot with fully onboard perception and computation.
- Abstract(参考訳): 混雑した地域で移動するロボットは、衝突回避を完全に制御するのではなく、人間と自由空間を交渉する必要がある。
ゲーム理論は、ロボットが経路計画中に衝突回避のために人間と協力する可能性について推論するための枠組みを提供する。
特に、混合戦略ナッシュ均衡は不確実性の下での交渉行動を捉え、群衆のナビゲーションに適している。
しかし、混合戦略のナッシュ均衡の計算は、しばしばリアルタイムな意思決定には不当に高価である。
本稿では,軌道の確率分布の反復的ベイズ更新方式を提案する。
アルゴリズムはロボットの確率的計画と他の歩行者の進路の確率論的予測を同時に生成する。
提案アルゴリズムは,クラウドナビゲーションのための混合戦略ゲームと等価であり,このアルゴリズムはゲーム全体のナッシュ均衡の回復を保証する。
提案アルゴリズムは,Byesian Recursive Nash Equilibrium (BRNE) と命名し,リアルタイムモデル予測クラウドナビゲーションフレームワークを開発した。
BRNEは汎用的な混合戦略ナッシュ均衡を解くのではなく、特に群集ナビゲーションに適した公式を解くため、低消費電力の組込みコンピュータ上でリアルタイムで解を計算することができる。
シミュレーション環境と実世界の歩行者データの両方においてBRNEを評価する。
BRNEは、安全性とナビゲーション効率に関する非学習および学習ベースの手法を一貫して上回っている。
また、歩行者データセットのベンチマークでは、人レベルの群衆ナビゲーションのパフォーマンスにも到達している。
最後に,本アルゴリズムの実際の人間による実用性を,完全に搭載された知覚と計算能力を備えた四足歩行ロボット上で実証する。
関連論文リスト
- Generalizability of Graph Neural Networks for Decentralized Unlabeled Motion Planning [72.86540018081531]
ラベルなしの動作計画では、衝突回避を確保しながら、ロボットのセットを目標の場所に割り当てる。
この問題は、探査、監視、輸送などの応用において、マルチロボットシステムにとって不可欠なビルディングブロックを形成している。
この問題に対処するために、各ロボットは、その400ドルのアネレストロボットと$k$アネレストターゲットの位置のみを知っている分散環境で対処する。
論文 参考訳(メタデータ) (2024-09-29T23:57:25Z) - Uncertainty-Aware DRL for Autonomous Vehicle Crowd Navigation in Shared Space [3.487370856323828]
本研究は,モデルフリーDRLアルゴリズムのトレーニングにおいて,予測歩行者状態の不確かさを取り入れた統合予測と計画手法を導入する。
新たな報酬関数により、AVは歩行者の個人的な空間を尊重し、接近中の速度を減少させ、予測された経路との衝突確率を最小化する。
その結果, 衝突速度は40%減少し, 予測の不確実性を考慮しない技術モデルと比較すると, 歩行者との距離は15%増加した。
論文 参考訳(メタデータ) (2024-05-22T20:09:21Z) - TransPath: Learning Heuristics For Grid-Based Pathfinding via
Transformers [64.88759709443819]
探索の効率を顕著に向上させると考えられる,インスタンス依存のプロキシを学習することを提案する。
私たちが最初に学ぶことを提案するプロキシは、補正係数、すなわち、インスタンスに依存しないコスト・ツー・ゴの見積もりと完璧な見積もりの比率である。
第2のプロキシはパス確率であり、グリッドセルが最も短いパスに横たわっている可能性を示している。
論文 参考訳(メタデータ) (2022-12-22T14:26:11Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - SocialVAE: Human Trajectory Prediction using Timewise Latents [4.640835690336652]
SocialVAEは、後部ニューラルネットワークを利用して予測を行う、時間的に変化するオートエンコーダアーキテクチャである。
そこで,SocialVAEは,現在最先端の歩行者軌道予測ベンチマークを改善していることを示す。
論文 参考訳(メタデータ) (2022-03-15T19:14:33Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - XAI-N: Sensor-based Robot Navigation using Expert Policies and Decision
Trees [55.9643422180256]
本稿では,ロボットの密集した動的環境における衝突のない軌道を計算するためのセンサベース学習ナビゲーションアルゴリズムを提案する。
我々のアプローチは、sim2realパラダイムを用いて訓練された深層強化学習に基づくエキスパートポリシーを使用する。
シミュレーション環境でのアルゴリズムの利点を強調し、移動中の歩行者の間でClearpath Jackalロボットをナビゲートする。
論文 参考訳(メタデータ) (2021-04-22T01:33:10Z) - Towards a Systematic Computational Framework for Modeling Multi-Agent
Decision-Making at Micro Level for Smart Vehicles in a Smart World [8.899670429041453]
スマートカーのマイクロレベルにおける意思決定と戦略的相互作用をモデル化するためのマルチエージェントベースの計算フレームワークを提案する。
本研究の目的は,自律走行車のためのマイクロパス計画など,様々な現実的なアプリケーションに対して,概念的に健全かつ実用的なフレームワークを提供することである。
論文 参考訳(メタデータ) (2020-09-25T13:05:28Z) - Spatial-Temporal Block and LSTM Network for Pedestrian Trajectories
Prediction [0.0]
本稿では,軌道予測のためのLSTMに基づく新しいアルゴリズムを提案する。
我々は静的なシーンと歩行者を考慮することでこの問題に対処する。
この関係を符号化したのはLSTMであり,我々のモデルは群集シナリオにおけるノードの軌跡を同時に予測する。
論文 参考訳(メタデータ) (2020-09-22T11:43:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。