論文の概要: Using Inverse Optimization to Learn Cost Functions in Generalized Nash
Games
- arxiv url: http://arxiv.org/abs/2102.12415v1
- Date: Wed, 24 Feb 2021 17:13:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-25 13:26:37.070497
- Title: Using Inverse Optimization to Learn Cost Functions in Generalized Nash
Games
- Title(参考訳): 一般化ナッシュゲームにおける逆最適化によるコスト関数の学習
- Authors: Stephanie Allen and John P. Dickerson and Steven A. Gabriel
- Abstract要約: 逆最適化は、マルチプレイヤーナッシュゲームにおけるプレイヤーの目的関数パラメータの復元に使用できる。
Ratliff et al.のフレームワークを拡張します。
2014年、一般化ナッシュ均衡問題(GNEP)の逆最適化解を求める
得られた定式化は、道路網上の模擬マルチプレイヤー輸送問題に適用される。
- 参考スコア(独自算出の注目度): 25.565930018608558
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As demonstrated by Ratliff et al. (2014), inverse optimization can be used to
recover the objective function parameters of players in multi-player Nash
games. These games involve the optimization problems of multiple players in
which the players can affect each other in their objective functions. In
generalized Nash equilibrium problems (GNEPs), a player's set of feasible
actions is also impacted by the actions taken by other players in the game; see
Facchinei and Kanzow (2010) for more background on this problem. One example of
such impact comes in the form of joint/"coupled" constraints as referenced by
Rosen (1965), Harker (1991), and Facchinei et al. (2007) which involve other
players' variables in the constraints of the feasible region. We extend the
framework of Ratliff et al. (2014) to find inverse optimization solutions for
the class of GNEPs with joint constraints. The resulting formulation is then
applied to a simulated multi-player transportation problem on a road network.
Also, we provide some theoretical results related to this transportation
problem regarding runtime of the extended framework as well as uniqueness and
non-uniqueness of solutions to our simulation experiments. We see that our
model recovers parameterizations that produce the same flow patterns as the
original parameterizations and that this holds true across multiple networks,
different assumptions regarding players' perceived costs, and the majority of
restrictive capacity settings and the associated numbers of players. Code for
the project can be found at: https://github.com/sallen7/IO_GNEP.
- Abstract(参考訳): Ratliffらによって実証された。
(2014)では,マルチプレイヤーナッシュゲームにおけるプレイヤーの目的関数パラメータの復元に逆最適化を用いることができる。
これらのゲームは、プレイヤーが客観的機能において互いに影響を及ぼすことのできる複数のプレイヤーの最適化問題を含む。
一般化されたナッシュ平衡問題(GNEPs)では、プレイヤーの可能なアクションのセットは、ゲーム内の他のプレイヤーが行った行動によっても影響されます。
このような影響の1つの例は、rosen (1965)、harker (1991)、facchinei et alによって参照されるジョイント/"結合"制約の形式である。
(2007年) 実現可能領域の制約に他のプレイヤーの変数が関与する。
Ratliff et al.のフレームワークを拡張します。
(2014)共同制約のあるGNEPのクラスのための逆最適化ソリューションを見つける。
得られた定式化は、道路網上の模擬マルチプレイヤー輸送問題に適用される。
また、拡張フレームワークのランタイムに関するこの輸送問題と、シミュレーション実験におけるソリューションの特異性と非特異性に関する理論的結果も提示する。
私たちのモデルは、元のパラメータ化と同じフローパターンを生成するパラメータ化を回復し、これは複数のネットワーク、プレイヤーの知覚コストに関するさまざまな仮定、および制限容量設定および関連するプレーヤーの数に当てはまります。
プロジェクトのコードはhttps://github.com/sallen7/io_gnep.com/で確認できる。
関連論文リスト
- Learning to Control Unknown Strongly Monotone Games [16.327788209492805]
制御された係数をオンラインで調整し,線形制約を満たすためにゲームのNEをシフトする簡単なアルゴリズムを提案する。
我々は,2つの時間スケール近似に基づくアルゴリズムが,目的とする線形制約を満たすNEの集合に対する確率1との収束を保証することを証明した。
本稿では,NEにおけるグローバル2次コストの最適化と資源配分ゲームにおけるロードバランシングに,我々の手法を適用する方法を示す。
論文 参考訳(メタデータ) (2024-06-30T03:33:42Z) - Imperfect-Recall Games: Equilibrium Concepts and Their Complexity [74.01381499760288]
エージェントが以前保持していた情報を忘れたとき、不完全なリコールの下で最適な意思決定を行う。
不完全なリコールを伴う広範囲形式のゲームフレームワークにおいて、マルチプレイヤー設定における平衡を求める際の計算複雑性を解析する。
論文 参考訳(メタデータ) (2024-06-23T00:27:28Z) - Auto-Encoding Bayesian Inverse Games [36.06617326128679]
ゲームの性質が不明な逆ゲーム問題を考える。
既存の最大推定手法は、未知のパラメータの点推定のみを提供する。
ベイズ的視点を採り、ゲームパラメータの後方分布を構成する。
この構造化されたVAEは、観測された相互作用のラベルのないデータセットから訓練することができる。
論文 参考訳(メタデータ) (2024-02-14T02:17:37Z) - Global Nash Equilibrium in Non-convex Multi-player Game: Theory and
Algorithms [66.8634598612777]
ナッシュ均衡(NE)はマルチプレイヤーゲームにおいて全てのプレイヤーに受け入れられることを示す。
また、一般理論から一歩ずつ一方的に利益を得ることはできないことも示している。
論文 参考訳(メタデータ) (2023-01-19T11:36:50Z) - Function Approximation for Solving Stackelberg Equilibrium in Large
Perfect Information Games [115.77438739169155]
汎用ゲームにおける状態値関数の一般化であるtextitEnforceable Payoff Frontier (EPF) の学習を提案する。
Stackelbergの設定にFAを適用する最初の方法です。
論文 参考訳(メタデータ) (2022-12-29T19:05:50Z) - Learning Correlated Equilibria in Mean-Field Games [62.14589406821103]
我々は平均場相関と粗相関平衡の概念を発展させる。
ゲームの構造に関する仮定を必要とせず,効率よくゲーム内で学習できることが示される。
論文 参考訳(メタデータ) (2022-08-22T08:31:46Z) - Provably Efficient Fictitious Play Policy Optimization for Zero-Sum
Markov Games with Structured Transitions [145.54544979467872]
本研究では,ゼロサムマルコフゲームに対して,構造的だが未知の遷移を伴う架空のプレイポリシー最適化アルゴリズムを提案し,解析する。
我々は、2年制の競争ゲームシナリオで、$K$のエピソードに続き、$widetildemathcalO(sqrtK)$ regret boundsを証明した。
提案アルゴリズムは,アッパー信頼境界(UCB)型最適化と,同時政策最適化の範囲内での架空のプレイの組み合わせを特徴とする。
論文 参考訳(メタデータ) (2022-07-25T18:29:16Z) - Learning in Congestion Games with Bandit Feedback [45.4542525044623]
我々は、良質な理論構造と広い実世界の応用を持つゲームのクラスである混雑ゲームについて検討する。
まず,渋滞ゲームにおける不確実性原理に直面する楽観性に基づく集中型アルゴリズムを提案する。
次に,Frank-Wolfe法とG-Optimal設計を組み合わせた分散アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-04T02:32:26Z) - Towards convergence to Nash equilibria in two-team zero-sum games [17.4461045395989]
2チームゼロサムゲームは、プレイヤーが2つの競合するエージェントに分割されるマルチプレイヤーゲームとして定義される。
我々はNash equilibria(NE)の解の概念に焦点をあてる。
このクラスのゲームに対する計算 NE は、複雑性クラス $mathrm$ に対して $textithard$ であることを示す。
論文 参考訳(メタデータ) (2021-11-07T21:15:35Z) - Empirical Analysis of Fictitious Play for Nash Equilibrium Computation in Multiplayer Games [0.4895118383237099]
架空のプレイは、2つのプレイヤーゼロサムゲームのような特定のゲームクラスにおいてナッシュ均衡に収束することが保証される。
実のところ、架空の遊びは、様々なゲームクラスやサイズに対するナッシュ均衡近似の改善につながることを示す。
論文 参考訳(メタデータ) (2020-01-30T03:47:09Z) - Non-Cooperative Game Theory Based Rate Adaptation for Dynamic Video
Streaming over HTTP [89.30855958779425]
Dynamic Adaptive Streaming over HTTP (DASH)は、新興かつ有望なマルチメディアストリーミング技術であることを示した。
本稿では,サーバの限られた輸出帯域幅をマルチユーザに対して最適に割り当てるアルゴリズムを提案し,その品質・オブ・エクスペリエンス(QoE)を公平性で最大化する。
論文 参考訳(メタデータ) (2019-12-27T01:19:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。