Fugu-MT 論文翻訳(概要): Mixed-Strategy Nash Equilibrium for Crowd Navigation

論文の概要: Mixed-Strategy Nash Equilibrium for Crowd Navigation

arxiv url: http://arxiv.org/abs/2403.01537v2
Date: Tue, 5 Mar 2024 15:48:15 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-06 20:56:17.937891
Title: Mixed-Strategy Nash Equilibrium for Crowd Navigation
Title（参考訳）: 群集ナビゲーションのための混合ストラテジーナッシュ平衡
Authors: Muchen Sun, Francesca Baldini, Peter Trautman, Todd Murphey
Abstract要約: 混合ストラテジー・ナッシュ均衡は、ロボットが群衆の中で不確実で協調的な人間の行動を予測するための厳密なモデルを提供する。単純な反復的ベイズ更新スキームが混合ストラテジーなソーシャルナビゲーションゲームのナッシュ平衡に収束することを証明する。我々は,既存のナビゲーション手法に統合可能なサンプリングベースのクラウドナビゲーションフレームワークを開発し,ラップトップCPU上でリアルタイムに動作させる。
参考スコア（独自算出の注目度）: 0.4915744683251149
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We address the problem of finding mixed-strategy Nash equilibrium for crowd navigation. Mixed-strategy Nash equilibrium provides a rigorous model for the robot to anticipate uncertain yet cooperative human behavior in crowds, but the computation cost is often too high for scalable and real-time decision-making. Here we prove that a simple iterative Bayesian updating scheme converges to the Nash equilibrium of a mixed-strategy social navigation game. Furthermore, we propose a data-driven framework to construct the game by initializing agent strategies as Gaussian processes learned from human datasets. Based on the proposed mixed-strategy Nash equilibrium model, we develop a sampling-based crowd navigation framework that can be integrated into existing navigation methods and runs in real-time on a laptop CPU. We evaluate our framework in both simulated environments and real-world human datasets in unstructured environments. Our framework consistently outperforms both non-learning and learning-based methods on both safety and navigation efficiency and reaches human-level crowd navigation performance on top of a meta-planner.
Abstract（参考訳）: 群集ナビゲーションのための混合戦略ナッシュ均衡を求める問題に対処する。混合戦略のナッシュ均衡は、ロボットが群衆の中で不確実で協調的な人間の行動を予測するための厳密なモデルを提供するが、その計算コストはスケーラブルでリアルタイムな意思決定には高すぎることが多い。ここでは、単純反復ベイズ更新スキームが混合戦略ソーシャルナビゲーションゲームのナッシュ平衡に収束することを証明する。さらに,人間のデータセットから学習したガウス過程としてエージェント戦略を初期化することにより,ゲーム構築のためのデータ駆動フレームワークを提案する。提案する混合戦略nash均衡モデルに基づき,既存のナビゲーション手法に統合し,ラップトップcpu上でリアルタイムに動作可能なサンプリングベースのクラウドナビゲーションフレームワークを開発した。我々は、非構造化環境におけるシミュレーション環境と実世界の人的データセットの両方において、我々のフレームワークを評価する。本フレームワークは,安全性とナビゲーション効率の両面において,非学習的手法と学習的手法の両方を一貫して上回り,メタプランナ上での人間レベルの集団ナビゲーション性能に達する。

関連論文リスト

From Obstacles to Etiquette: Robot Social Navigation with VLM-Informed Path Selection [57.74400052368147]
本稿では,幾何学的計画と文脈的社会的推論を統合した社会ロボットナビゲーションフレームワークを提案する。このシステムはまず障害物や人間の力学を抽出し、幾何学的に実現可能な候補経路を生成し、次に細調整された視覚言語モデル(VLM)を利用してこれらの経路を評価する。 4つのソーシャルナビゲーション環境における実験により, 生活空間違反の最小期間, 歩行者面の最小時間, 社会ゾーンの侵入がない場合に, ベストな総合的なパフォーマンスを達成できることが実証された。
論文参考訳（メタデータ） (2026-02-09T18:46:12Z)
Multi-Step Alignment as Markov Games: An Optimistic Online Gradient Descent Approach with Convergence Guarantees [91.88803125231189]
マルチステップ優先最適化(MPO)は、自然なアクター批判フレームワークciteprakhlin2013online,joulani17a上に構築されている。我々はOMPOが$mathcalO(epsilon-1)$ポリシー更新を必要とし、$epsilon$-approximate Nash平衡に収束することを示した。また,本手法がマルチターン会話データセットと数理推論データセットに与える影響についても検証した。
論文参考訳（メタデータ） (2025-02-18T09:33:48Z)
Generalizability of Graph Neural Networks for Decentralized Unlabeled Motion Planning [72.86540018081531]
ラベルなしの動作計画では、衝突回避を確保しながら、ロボットのセットを目標の場所に割り当てる。この問題は、探査、監視、輸送などの応用において、マルチロボットシステムにとって不可欠なビルディングブロックを形成している。この問題に対処するために、各ロボットは、その400ドルのアネレストロボットと$k$アネレストターゲットの位置のみを知っている分散環境で対処する。
論文参考訳（メタデータ） (2024-09-29T23:57:25Z)
Uncertainty-Aware DRL for Autonomous Vehicle Crowd Navigation in Shared Space [3.487370856323828]
本研究は,モデルフリーDRLアルゴリズムのトレーニングにおいて,予測歩行者状態の不確かさを取り入れた統合予測と計画手法を導入する。新たな報酬関数により、AVは歩行者の個人的な空間を尊重し、接近中の速度を減少させ、予測された経路との衝突確率を最小化する。その結果, 衝突速度は40%減少し, 予測の不確実性を考慮しない技術モデルと比較すると, 歩行者との距離は15%増加した。
論文参考訳（メタデータ） (2024-05-22T20:09:21Z)
Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文参考訳（メタデータ） (2024-01-22T18:58:22Z)
REBEL: Reward Regularization-Based Approach for Robotic Reinforcement Learning from Human Feedback [61.54791065013767]
報酬関数と人間の嗜好の相違は、現実世界で破滅的な結果をもたらす可能性がある。近年の手法は、人間の嗜好から報酬関数を学習することで、不適応を緩和することを目的としている。本稿では,ロボットRLHFフレームワークにおける報酬正規化の新たな概念を提案する。
論文参考訳（メタデータ） (2023-12-22T04:56:37Z)
Decentralized Social Navigation with Non-Cooperative Robots via Bi-Level Optimization [11.638394339813154]
本稿では,ソーシャルミニゲームにおけるリアルタイム非協調型マルチロボットナビゲーションのための,完全に分散化されたアプローチを提案する。我々のコントリビューションは新しいリアルタイムバイレベル最適化アルゴリズムであり、トップレベルの最適化は公正で衝突のない順序付けを演算する。 F$1/10のロボット、Clearpath Jackal、Boston Dynamics Spotを使って提案したアルゴリズムを現実世界に展開することに成功しました。
論文参考訳（メタデータ） (2023-06-15T02:18:21Z)
Finding mixed-strategy equilibria of continuous-action games without gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文参考訳（メタデータ） (2022-11-29T05:16:41Z)
SocialVAE: Human Trajectory Prediction using Timewise Latents [4.640835690336652]
SocialVAEは、後部ニューラルネットワークを利用して予測を行う、時間的に変化するオートエンコーダアーキテクチャである。そこで,SocialVAEは,現在最先端の歩行者軌道予測ベンチマークを改善していることを示す。
論文参考訳（メタデータ） (2022-03-15T19:14:33Z)
Efficient Model-based Multi-agent Reinforcement Learning via Optimistic Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文参考訳（メタデータ） (2022-03-14T17:24:03Z)
SABER: Data-Driven Motion Planner for Autonomously Navigating Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文参考訳（メタデータ） (2021-08-03T02:56:21Z)
XAI-N: Sensor-based Robot Navigation using Expert Policies and Decision Trees [55.9643422180256]
本稿では,ロボットの密集した動的環境における衝突のない軌道を計算するためのセンサベース学習ナビゲーションアルゴリズムを提案する。我々のアプローチは、sim2realパラダイムを用いて訓練された深層強化学習に基づくエキスパートポリシーを使用する。シミュレーション環境でのアルゴリズムの利点を強調し、移動中の歩行者の間でClearpath Jackalロボットをナビゲートする。
論文参考訳（メタデータ） (2021-04-22T01:33:10Z)
Towards a Systematic Computational Framework for Modeling Multi-Agent Decision-Making at Micro Level for Smart Vehicles in a Smart World [8.899670429041453]
スマートカーのマイクロレベルにおける意思決定と戦略的相互作用をモデル化するためのマルチエージェントベースの計算フレームワークを提案する。本研究の目的は,自律走行車のためのマイクロパス計画など,様々な現実的なアプリケーションに対して,概念的に健全かつ実用的なフレームワークを提供することである。
論文参考訳（メタデータ） (2020-09-25T13:05:28Z)
Spatial-Temporal Block and LSTM Network for Pedestrian Trajectories Prediction [0.0]
本稿では,軌道予測のためのLSTMに基づく新しいアルゴリズムを提案する。我々は静的なシーンと歩行者を考慮することでこの問題に対処する。この関係を符号化したのはLSTMであり,我々のモデルは群集シナリオにおけるノードの軌跡を同時に予測する。
論文参考訳（メタデータ） (2020-09-22T11:43:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。