論文の概要: Bayesian Inverse Games with High-Dimensional Multi-Modal Observations
- arxiv url: http://arxiv.org/abs/2601.00696v1
- Date: Fri, 02 Jan 2026 14:23:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-05 15:04:33.582266
- Title: Bayesian Inverse Games with High-Dimensional Multi-Modal Observations
- Title(参考訳): 高次元多モード観測によるベイズ逆ゲーム
- Authors: Yash Jain, Xinjie Liu, Lasse Peters, David Fridovich-Keil, Ufuk Topcu,
- Abstract要約: マルチエージェントの相互作用シナリオは自然に非協調ゲームとしてモデル化され、各エージェントの判断は他のエージェントの将来の行動に依存する。
逆ゲーム問題を解くための近似ベイズ推論手法を提案する。
提案フレームワークは,事前および後続分布の学習に成功し,推論品質を向上し,下流での意思決定をより安全に行えることを示す。
- 参考スコア(独自算出の注目度): 23.911680800112375
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many multi-agent interaction scenarios can be naturally modeled as noncooperative games, where each agent's decisions depend on others' future actions. However, deploying game-theoretic planners for autonomous decision-making requires a specification of all agents' objectives. To circumvent this practical difficulty, recent work develops maximum likelihood techniques for solving inverse games that can identify unknown agent objectives from interaction data. Unfortunately, these methods only infer point estimates and do not quantify estimator uncertainty; correspondingly, downstream planning decisions can overconfidently commit to unsafe actions. We present an approximate Bayesian inference approach for solving the inverse game problem, which can incorporate observation data from multiple modalities and be used to generate samples from the Bayesian posterior over the hidden agent objectives given limited sensor observations in real time. Concretely, the proposed Bayesian inverse game framework trains a structured variational autoencoder with an embedded differentiable Nash game solver on interaction datasets and does not require labels of agents' true objectives. Extensive experiments show that our framework successfully learns prior and posterior distributions, improves inference quality over maximum likelihood estimation-based inverse game approaches, and enables safer downstream decision-making without sacrificing efficiency. When trajectory information is uninformative or unavailable, multimodal inference further reduces uncertainty by exploiting additional observation modalities.
- Abstract(参考訳): 多くのマルチエージェント相互作用シナリオは自然に非協調ゲームとしてモデル化され、各エージェントの判断は他のエージェントの将来の行動に依存する。
しかし、自律的な意思決定のためにゲーム理論的なプランナーを配置するには、すべてのエージェントの目的の仕様が必要である。
この現実的な困難を回避するため、近年の研究では、未知のエージェント目的を対話データから識別できる逆ゲーム(英語版)を解くための最大限の手法が開発されている。
残念なことに、これらの手法は点推定のみを推測し、推定器の不確かさを定量化しない。
逆ゲーム問題を解くための近似ベイズ推論手法を提案し、複数のモードからの観測データを組み込んで、センサーの限られた観測をリアルタイムに行うことで、隠れたエージェントの目的に対してベイズ後部からサンプルを生成する。
具体的には、ベイズ逆ゲームフレームワークは、エージェントの真の目的のラベルを必要とせず、相互作用データセットに組み込みの微分可能なナッシュゲームソルバで構造化された変分オートエンコーダを訓練する。
大規模な実験により,我々のフレームワークは,事前および後続分布の学習に成功し,最大推定に基づく逆ゲームアプローチよりも推論品質を向上し,効率を犠牲にすることなく,より安全な下流意思決定を可能にした。
軌道情報が非形式的または利用できない場合、マルチモーダル推論は追加の観測モダリティを利用して不確実性をさらに低減する。
関連論文リスト
- Auto-Encoding Bayesian Inverse Games [36.06617326128679]
ゲームの性質が不明な逆ゲーム問題を考える。
既存の最大推定手法は、未知のパラメータの点推定のみを提供する。
ベイズ的視点を採り、ゲームパラメータの後方分布を構成する。
この構造化されたVAEは、観測された相互作用のラベルのないデータセットから訓練することができる。
論文 参考訳(メタデータ) (2024-02-14T02:17:37Z) - Online Decision Mediation [72.80902932543474]
意思決定支援アシスタントを学習し、(好奇心)専門家の行動と(不完全)人間の行動の仲介役として機能することを検討する。
臨床診断では、完全に自律的な機械行動は倫理的余裕を超えることが多い。
論文 参考訳(メタデータ) (2023-10-28T05:59:43Z) - A Closer Look at the Intervention Procedure of Concept Bottleneck Models [18.222350428973343]
概念ボトルネックモデル(コンセプションボトルネックモデル、CBM)は、その高レベルな概念に基づいて与えられた入力のターゲット応答を予測する、解釈可能なニューラルネットワークモデルのクラスである。
CBMは、ドメインの専門家が予測された概念に介入し、テスト時に間違いを修正できるので、最後にもっと正確なタスク予測ができる。
本研究では,介入効果を向上させるために介入概念を選択する様々な方法を開発し,異なる状況下でどのように進化するかを詳細に分析する。
論文 参考訳(メタデータ) (2023-02-28T02:37:24Z) - Rethinking Missing Data: Aleatoric Uncertainty-Aware Recommendation [59.500347564280204]
本稿では, Aleatoric Uncertainty-aware Recommendation (AUR) フレームワークを提案する。
AURは、新しい不確実性推定器と通常のレコメンデータモデルで構成されている。
誤ラベルの可能性がペアの可能性を反映しているため、AURは不確実性に応じてレコメンデーションを行う。
論文 参考訳(メタデータ) (2022-09-22T04:32:51Z) - Collaborative Uncertainty Benefits Multi-Agent Multi-Modal Trajectory Forecasting [61.02295959343446]
この研究はまず、相互作用モジュールから生じる不確実性をモデル化する新しい概念であるコラボレーティブ不確実性(CU)を提案する。
我々は、回帰と不確実性推定の両方を行うために、元の置換同変不確かさ推定器を備えた一般的なCU対応回帰フレームワークを構築した。
提案するフレームワークを,プラグインモジュールとして現在のSOTAマルチエージェント軌道予測システムに適用する。
論文 参考訳(メタデータ) (2022-07-11T21:17:41Z) - Reinforcement Learning with a Terminator [80.34572413850186]
我々は, TerMDP のパラメータを学習し, 推定問題の構造を活用し, 状態ワイドな信頼境界を提供する。
我々はこれらを用いて証明可能な効率のよいアルゴリズムを構築し、終端を考慮し、その後悔を抑える。
論文 参考訳(メタデータ) (2022-05-30T18:40:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。