Fugu-MT 論文翻訳(概要): Auto-Encoding Bayesian Inverse Games

論文の概要: Auto-Encoding Bayesian Inverse Games

arxiv url: http://arxiv.org/abs/2402.08902v2
Date: Fri, 16 Feb 2024 22:27:13 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-21 00:40:00.792058
Title: Auto-Encoding Bayesian Inverse Games
Title（参考訳）: ベイズ逆ゲームの自動エンコーディング
Authors: Xinjie Liu, Lasse Peters, Javier Alonso-Mora, Ufuk Topcu, David Fridovich-Keil
Abstract要約: ゲームの性質が未知であり、観察から推測しなければならない逆ゲーム問題を考える。既存の最大推定手法は、未知のパラメータの点推定のみを提供する。可変オートエンコーダと組込み微分可能ゲームソルバを用いて推論を抽出する。
参考スコア（独自算出の注目度）: 38.69344806372856
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: When multiple agents interact in a common environment, each agent's actions impact others' future decisions, and noncooperative dynamic games naturally capture this coupling. In interactive motion planning, however, agents typically do not have access to a complete model of the game, e.g., due to unknown objectives of other players. Therefore, we consider the inverse game problem, in which some properties of the game are unknown a priori and must be inferred from observations. Existing maximum likelihood estimation (MLE) approaches to solve inverse games provide only point estimates of unknown parameters without quantifying uncertainty, and perform poorly when many parameter values explain the observed behavior. To address these limitations, we take a Bayesian perspective and construct posterior distributions of game parameters. To render inference tractable, we employ a variational autoencoder (VAE) with an embedded differentiable game solver. This structured VAE can be trained from an unlabeled dataset of observed interactions, naturally handles continuous, multi-modal distributions, and supports efficient sampling from the inferred posteriors without computing game solutions at runtime. Extensive evaluations in simulated driving scenarios demonstrate that the proposed approach successfully learns the prior and posterior objective distributions, provides more accurate objective estimates than MLE baselines, and facilitates safer and more efficient game-theoretic motion planning.
Abstract（参考訳）: 複数のエージェントが共通の環境で相互作用すると、それぞれのエージェントのアクションが他人の将来の決定に影響を与え、非協力的な動的ゲームは自然にこの結合を捉えます。しかし、インタラクティブなモーションプランニングでは、エージェントは通常、他のプレイヤーの目的が不明であるなど、ゲームの完全なモデルにアクセスできない。したがって,ゲームの性質が不明であり,観測結果から推測しなければならない,逆ゲーム問題を考える。既存の最大誤差推定(MLE)アプローチは、不確実性を定量化せずに未知のパラメータの点推定のみを提供し、多くのパラメータ値が観測された振る舞いを説明すると性能が低下する。これらの制限に対処するため、ベイズ的視点を採り、ゲームパラメータの後方分布を構築する。 Inference tractable のレンダリングには、可変オートエンコーダ(VAE)と組込み微分可能なゲームソルバを用いる。この構造化されたVAEは、観測された相互作用のラベルのないデータセットからトレーニングすることができ、自然に連続したマルチモーダル分布を処理し、実行時にゲームソリューションを計算せずに推論後部からの効率的なサンプリングをサポートする。シミュレーション運転シナリオにおける広範な評価は,提案手法が先行的および後方的目標分布を学習し,mleベースラインよりも客観的な推定を精度良く提供し,より安全かつ効率的なゲーム理論的動作計画を支援することを示す。

関連論文リスト

Bayesian Inverse Games with High-Dimensional Multi-Modal Observations [23.911680800112375]
マルチエージェントの相互作用シナリオは自然に非協調ゲームとしてモデル化され、各エージェントの判断は他のエージェントの将来の行動に依存する。逆ゲーム問題を解くための近似ベイズ推論手法を提案する。提案フレームワークは,事前および後続分布の学習に成功し,推論品質を向上し,下流での意思決定をより安全に行えることを示す。
論文参考訳（メタデータ） (2026-01-02T14:23:38Z)
Expandable Decision-Making States for Multi-Agent Deep Reinforcement Learning in Soccer Tactical Analysis [6.8055385768376615]
サッカーなどの侵入チームスポーツは、多くの選手が共有フィールドで相互作用するときに、高次元で強く結合された状態空間を作り出す。従来のルールに基づく分析は直感的であるが、現代の予測機械学習モデルは明示的なエージェント表現なしでパターンマッチングを行うことが多い。本稿では,関係変数による原位置と速度を増大させる意味的にリッチな状態表現である拡張可能意思決定状態(EDMS)を提案する。
論文参考訳（メタデータ） (2025-10-01T04:01:51Z)
Peer-Aware Cost Estimation in Nonlinear General-Sum Dynamic Games for Mutual Learning and Intent Inference [7.1177896599806205]
汎用動的ゲームのための非線形ピアアウェアコスト推定アルゴリズムを提案する。 N-PACEは、目的関数を推論しながら、ピアエージェントの学習ダイナミクスを明示的にモデル化する。我々は、N-PACEが、ピアの学習力学を明示的にモデル化することにより、このようなマルチエージェントシステムにおけるテキスト境界通信を実現する方法を示す。
論文参考訳（メタデータ） (2025-04-23T22:47:20Z)
TRACE: A Self-Improving Framework for Robot Behavior Forecasting with Vision-Language Models [1.3408365072149797]
反応剤の短期的挙動を予測することは、多くのロボットシナリオにおいて重要である。本稿では,ツリー・オブ・ソート・ジェネレーションとドメイン・アウェア・フィードバックを結合した推論フレームワークTRACEを提案する。我々は,地上車両シミュレーションと実世界海面車両の両面においてTRACEを検証した。
論文参考訳（メタデータ） (2025-03-02T06:58:02Z)
Towards a Game-theoretic Understanding of Explanation-based Membership Inference Attacks [8.06071340190569]
ブラックボックス機械学習(ML)モデルは、メンバーシップ推論攻撃(MIA)のようなプライバシ脅威を実行するために利用することができる。既存の作業は、敵とターゲットMLモデルの間の単一の"What if"相互作用シナリオにおいてのみ、MIAを分析している。このような最適しきい値が存在することを証明し、MIAの起動に使用できる音響数学的定式化を提案する。
論文参考訳（メタデータ） (2024-04-10T16:14:05Z)
Blending Data-Driven Priors in Dynamic Games [9.085463548798366]
Kullback-Leibler (KL) 正規化による非協調的ダイナミックゲームの解法を定式化する。我々は,KLGameのNash平衡戦略を,マルチモーダル近似フィードバックをリアルタイムに計算するための効率的なアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-02-21T23:22:32Z)
Uncertainty-Aware Pedestrian Trajectory Prediction via Distributional Diffusion [26.715578412088327]
モデルに依存しない不確実性を考慮した歩行者軌道予測手法を提案する。従来の研究とは異なり、予測性は明示的な分布に変換され、予測可能な将来の軌道を生成することができる。私たちのフレームワークは、さまざまなニューラルネットアーキテクチャと互換性があります。
論文参考訳（メタデータ） (2023-03-15T04:58:43Z)
On the Convergence of No-Regret Learning Dynamics in Time-Varying Games [89.96815099996132]
時間変化ゲームにおける楽観的勾配降下(OGD)の収束を特徴付ける。我々のフレームワークは、ゼロサムゲームにおけるOGDの平衡ギャップに対して鋭い収束境界をもたらす。また,静的ゲームにおける動的後悔の保証に関する新たな洞察も提供する。
論文参考訳（メタデータ） (2023-01-26T17:25:45Z)
Finding mixed-strategy equilibria of continuous-action games without gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文参考訳（メタデータ） (2022-11-29T05:16:41Z)
H-SAUR: Hypothesize, Simulate, Act, Update, and Repeat for Understanding Object Articulations from Interactions [62.510951695174604]
The Hypothesize, Simulate, Act, Update, and Repeat (H-SAUR) is a probabilistic generative framework that generated hypotheses about objects articulate given input observed。提案手法は,現在最先端のオブジェクト操作フレームワークよりも優れていることを示す。我々は、学習に基づく視覚モデルから学習前の学習を統合することにより、H-SAURのテスト時間効率をさらに向上する。
論文参考訳（メタデータ） (2022-10-22T18:39:33Z)
You Mostly Walk Alone: Analyzing Feature Attribution in Trajectory Prediction [52.442129609979794]
軌道予測のための最近の深層学習手法は有望な性能を示す。そのようなブラックボックスモデルが実際にどのモデルを予測するために使うのかは、まだ不明である。本稿では,モデル性能に対する異なるキューの貢献度を定量化する手法を提案する。
論文参考訳（メタデータ） (2021-10-11T14:24:15Z)
Time-series Imputation of Temporally-occluded Multiagent Trajectories [18.862173210927658]
エージェントのサブセットの過去と将来の観測が、他のエージェントの欠落した観察を推定するために使用される、マルチエージェントの時系列計算の問題について検討する。グラフインプタ(Graph Imputer)と呼ばれる我々の手法は,グラフネットワークと変分オートエンコーダを組み合わせた前方情報と後方情報を利用する。提案手法は,プロジェクティブカメラモジュールを用いて,オフスクリーンプレーヤの状態推定設定のためのモデルをトレーニングし,評価する。
論文参考訳（メタデータ） (2021-06-08T09:58:43Z)
End-to-End Learning and Intervention in Games [60.41921763076017]
ゲームにおける学習と介入のための統一的なフレームワークを提供する。明示的および暗黙的な区別に基づく2つのアプローチを提案する。分析結果は、実世界のいくつかの問題を用いて検証される。
論文参考訳（メタデータ） (2020-10-26T18:39:32Z)
Diversity in Action: General-Sum Multi-Agent Continuous Inverse Optimal Control [12.771478252695399]
上記の全ての点に対処するゲーム理論法を提案する。 AV に使われている多くの既存手法と比較して,1) 完全通信を必要としない,2) エージェントごとの報奨が可能である。我々の実験は、これらのより現実的な仮定が、期待される現実世界の行動によく一致する、質的かつ定量的に異なる報酬予測と将来の行動予測をもたらすことを示した。
論文参考訳（メタデータ） (2020-04-27T09:53:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。