論文の概要: Auto-Encoding Bayesian Inverse Games
- arxiv url: http://arxiv.org/abs/2402.08902v2
- Date: Fri, 16 Feb 2024 22:27:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-21 00:40:00.792058
- Title: Auto-Encoding Bayesian Inverse Games
- Title(参考訳): ベイズ逆ゲームの自動エンコーディング
- Authors: Xinjie Liu, Lasse Peters, Javier Alonso-Mora, Ufuk Topcu, David
Fridovich-Keil
- Abstract要約: ゲームの性質が未知であり、観察から推測しなければならない逆ゲーム問題を考える。
既存の最大推定手法は、未知のパラメータの点推定のみを提供する。
可変オートエンコーダと組込み微分可能ゲームソルバを用いて推論を抽出する。
- 参考スコア(独自算出の注目度): 38.69344806372856
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When multiple agents interact in a common environment, each agent's actions
impact others' future decisions, and noncooperative dynamic games naturally
capture this coupling. In interactive motion planning, however, agents
typically do not have access to a complete model of the game, e.g., due to
unknown objectives of other players. Therefore, we consider the inverse game
problem, in which some properties of the game are unknown a priori and must be
inferred from observations. Existing maximum likelihood estimation (MLE)
approaches to solve inverse games provide only point estimates of unknown
parameters without quantifying uncertainty, and perform poorly when many
parameter values explain the observed behavior. To address these limitations,
we take a Bayesian perspective and construct posterior distributions of game
parameters. To render inference tractable, we employ a variational autoencoder
(VAE) with an embedded differentiable game solver. This structured VAE can be
trained from an unlabeled dataset of observed interactions, naturally handles
continuous, multi-modal distributions, and supports efficient sampling from the
inferred posteriors without computing game solutions at runtime. Extensive
evaluations in simulated driving scenarios demonstrate that the proposed
approach successfully learns the prior and posterior objective distributions,
provides more accurate objective estimates than MLE baselines, and facilitates
safer and more efficient game-theoretic motion planning.
- Abstract(参考訳): 複数のエージェントが共通の環境で相互作用すると、それぞれのエージェントのアクションが他人の将来の決定に影響を与え、非協力的な動的ゲームは自然にこの結合を捉えます。
しかし、インタラクティブなモーションプランニングでは、エージェントは通常、他のプレイヤーの目的が不明であるなど、ゲームの完全なモデルにアクセスできない。
したがって,ゲームの性質が不明であり,観測結果から推測しなければならない,逆ゲーム問題を考える。
既存の最大誤差推定(MLE)アプローチは、不確実性を定量化せずに未知のパラメータの点推定のみを提供し、多くのパラメータ値が観測された振る舞いを説明すると性能が低下する。
これらの制限に対処するため、ベイズ的視点を採り、ゲームパラメータの後方分布を構築する。
Inference tractable のレンダリングには、可変オートエンコーダ(VAE)と組込み微分可能なゲームソルバを用いる。
この構造化されたVAEは、観測された相互作用のラベルのないデータセットからトレーニングすることができ、自然に連続したマルチモーダル分布を処理し、実行時にゲームソリューションを計算せずに推論後部からの効率的なサンプリングをサポートする。
シミュレーション運転シナリオにおける広範な評価は,提案手法が先行的および後方的目標分布を学習し,mleベースラインよりも客観的な推定を精度良く提供し,より安全かつ効率的なゲーム理論的動作計画を支援することを示す。
関連論文リスト
- Blending Data-Driven Priors in Dynamic Games [6.410110981612053]
KLGameはKulback-Leibler(KL)正規化を用いた非協調型動的ゲームである。
我々は,KLGameのNash平衡戦略を,マルチモーダル近似フィードバックをリアルタイムに計算するための効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-21T23:22:32Z) - Uncertainty-Aware Pedestrian Trajectory Prediction via Distributional
Diffusion [37.160767002270525]
本研究では,不確実性を考慮した歩行者軌道予測手法を提案する。
従来の研究とは異なり、予測性は明示的な分布に変換する。
我々のフレームワークは、異なるニューラルネットワークアーキテクチャとの互換性について、モデルに依存しない。
論文 参考訳(メタデータ) (2023-03-15T04:58:43Z) - On the Convergence of No-Regret Learning Dynamics in Time-Varying Games [89.96815099996132]
時間変化ゲームにおける楽観的勾配降下(OGD)の収束を特徴付ける。
我々のフレームワークは、ゼロサムゲームにおけるOGDの平衡ギャップに対して鋭い収束境界をもたらす。
また,静的ゲームにおける動的後悔の保証に関する新たな洞察も提供する。
論文 参考訳(メタデータ) (2023-01-26T17:25:45Z) - H-SAUR: Hypothesize, Simulate, Act, Update, and Repeat for Understanding
Object Articulations from Interactions [62.510951695174604]
The Hypothesize, Simulate, Act, Update, and Repeat (H-SAUR) is a probabilistic generative framework that generated hypotheses about objects articulate given input observed。
提案手法は,現在最先端のオブジェクト操作フレームワークよりも優れていることを示す。
我々は、学習に基づく視覚モデルから学習前の学習を統合することにより、H-SAURのテスト時間効率をさらに向上する。
論文 参考訳(メタデータ) (2022-10-22T18:39:33Z) - Rethinking Missing Data: Aleatoric Uncertainty-Aware Recommendation [59.500347564280204]
本稿では, Aleatoric Uncertainty-aware Recommendation (AUR) フレームワークを提案する。
AURは、新しい不確実性推定器と通常のレコメンデータモデルで構成されている。
誤ラベルの可能性がペアの可能性を反映しているため、AURは不確実性に応じてレコメンデーションを行う。
論文 参考訳(メタデータ) (2022-09-22T04:32:51Z) - Domain Knowledge Driven Pseudo Labels for Interpretable Goal-Conditioned
Interactive Trajectory Prediction [29.701029725302586]
目標条件付きフレームワークを用いた共同軌道予測問題について検討する。
本研究では,条件付き変分自動エンコーダ(CVAE)モデルを導入し,異なる相互作用モードを潜在空間に明示的にエンコードする。
KLの消滅を回避する新しい手法を提案し、擬似ラベルを用いた解釈可能な対話型潜在空間を誘導する。
論文 参考訳(メタデータ) (2022-03-28T21:41:21Z) - You Mostly Walk Alone: Analyzing Feature Attribution in Trajectory
Prediction [52.442129609979794]
軌道予測のための最近の深層学習手法は有望な性能を示す。
そのようなブラックボックスモデルが実際にどのモデルを予測するために使うのかは、まだ不明である。
本稿では,モデル性能に対する異なるキューの貢献度を定量化する手法を提案する。
論文 参考訳(メタデータ) (2021-10-11T14:24:15Z) - Time-series Imputation of Temporally-occluded Multiagent Trajectories [18.862173210927658]
エージェントのサブセットの過去と将来の観測が、他のエージェントの欠落した観察を推定するために使用される、マルチエージェントの時系列計算の問題について検討する。
グラフインプタ(Graph Imputer)と呼ばれる我々の手法は,グラフネットワークと変分オートエンコーダを組み合わせた前方情報と後方情報を利用する。
提案手法は,プロジェクティブカメラモジュールを用いて,オフスクリーンプレーヤの状態推定設定のためのモデルをトレーニングし,評価する。
論文 参考訳(メタデータ) (2021-06-08T09:58:43Z) - End-to-End Learning and Intervention in Games [60.41921763076017]
ゲームにおける学習と介入のための統一的なフレームワークを提供する。
明示的および暗黙的な区別に基づく2つのアプローチを提案する。
分析結果は、実世界のいくつかの問題を用いて検証される。
論文 参考訳(メタデータ) (2020-10-26T18:39:32Z) - Diversity in Action: General-Sum Multi-Agent Continuous Inverse Optimal
Control [12.771478252695399]
上記の全ての点に対処するゲーム理論法を提案する。
AV に使われている多くの既存手法と比較して,1) 完全通信を必要としない,2) エージェントごとの報奨が可能である。
我々の実験は、これらのより現実的な仮定が、期待される現実世界の行動によく一致する、質的かつ定量的に異なる報酬予測と将来の行動予測をもたらすことを示した。
論文 参考訳(メタデータ) (2020-04-27T09:53:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。