Fugu-MT 論文翻訳(概要): Using Inverse Optimization to Learn Cost Functions in Generalized Nash Games

論文の概要: Using Inverse Optimization to Learn Cost Functions in Generalized Nash Games

arxiv url: http://arxiv.org/abs/2102.12415v1
Date: Wed, 24 Feb 2021 17:13:27 GMT
ステータス: 翻訳完了
システム内更新日: 2021-02-25 13:26:37.070497
Title: Using Inverse Optimization to Learn Cost Functions in Generalized Nash Games
Title（参考訳）: 一般化ナッシュゲームにおける逆最適化によるコスト関数の学習
Authors: Stephanie Allen and John P. Dickerson and Steven A. Gabriel
Abstract要約: 逆最適化は、マルチプレイヤーナッシュゲームにおけるプレイヤーの目的関数パラメータの復元に使用できる。 Ratliff et al.のフレームワークを拡張します。 2014年、一般化ナッシュ均衡問題(GNEP)の逆最適化解を求める得られた定式化は、道路網上の模擬マルチプレイヤー輸送問題に適用される。
参考スコア（独自算出の注目度）: 25.565930018608558
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: As demonstrated by Ratliff et al. (2014), inverse optimization can be used to recover the objective function parameters of players in multi-player Nash games. These games involve the optimization problems of multiple players in which the players can affect each other in their objective functions. In generalized Nash equilibrium problems (GNEPs), a player's set of feasible actions is also impacted by the actions taken by other players in the game; see Facchinei and Kanzow (2010) for more background on this problem. One example of such impact comes in the form of joint/"coupled" constraints as referenced by Rosen (1965), Harker (1991), and Facchinei et al. (2007) which involve other players' variables in the constraints of the feasible region. We extend the framework of Ratliff et al. (2014) to find inverse optimization solutions for the class of GNEPs with joint constraints. The resulting formulation is then applied to a simulated multi-player transportation problem on a road network. Also, we provide some theoretical results related to this transportation problem regarding runtime of the extended framework as well as uniqueness and non-uniqueness of solutions to our simulation experiments. We see that our model recovers parameterizations that produce the same flow patterns as the original parameterizations and that this holds true across multiple networks, different assumptions regarding players' perceived costs, and the majority of restrictive capacity settings and the associated numbers of players. Code for the project can be found at: https://github.com/sallen7/IO_GNEP.
Abstract（参考訳）: Ratliffらによって実証された。 (2014)では,マルチプレイヤーナッシュゲームにおけるプレイヤーの目的関数パラメータの復元に逆最適化を用いることができる。これらのゲームは、プレイヤーが客観的機能において互いに影響を及ぼすことのできる複数のプレイヤーの最適化問題を含む。一般化されたナッシュ平衡問題(GNEPs)では、プレイヤーの可能なアクションのセットは、ゲーム内の他のプレイヤーが行った行動によっても影響されます。このような影響の1つの例は、rosen (1965)、harker (1991)、facchinei et alによって参照されるジョイント/"結合"制約の形式である。 (2007年) 実現可能領域の制約に他のプレイヤーの変数が関与する。 Ratliff et al.のフレームワークを拡張します。 (2014)共同制約のあるGNEPのクラスのための逆最適化ソリューションを見つける。得られた定式化は、道路網上の模擬マルチプレイヤー輸送問題に適用される。また、拡張フレームワークのランタイムに関するこの輸送問題と、シミュレーション実験におけるソリューションの特異性と非特異性に関する理論的結果も提示する。私たちのモデルは、元のパラメータ化と同じフローパターンを生成するパラメータ化を回復し、これは複数のネットワーク、プレイヤーの知覚コストに関するさまざまな仮定、および制限容量設定および関連するプレーヤーの数に当てはまります。プロジェクトのコードはhttps://github.com/sallen7/io_gnep.com/で確認できる。

関連論文リスト

Learning to Control Unknown Strongly Monotone Games [16.327788209492805]
制御された係数をオンラインで調整し,線形制約を満たすためにゲームのNEをシフトする簡単なアルゴリズムを提案する。我々は,2つの時間スケール近似に基づくアルゴリズムが,目的とする線形制約を満たすNEの集合に対する確率1との収束を保証することを証明した。本稿では,NEにおけるグローバル2次コストの最適化と資源配分ゲームにおけるロードバランシングに,我々の手法を適用する方法を示す。
論文参考訳（メタデータ） (2024-06-30T03:33:42Z)
Imperfect-Recall Games: Equilibrium Concepts and Their Complexity [74.01381499760288]
エージェントが以前保持していた情報を忘れたとき、不完全なリコールの下で最適な意思決定を行う。不完全なリコールを伴う広範囲形式のゲームフレームワークにおいて、マルチプレイヤー設定における平衡を求める際の計算複雑性を解析する。
論文参考訳（メタデータ） (2024-06-23T00:27:28Z)
Auto-Encoding Bayesian Inverse Games [36.06617326128679]
ゲームの性質が不明な逆ゲーム問題を考える。既存の最大推定手法は、未知のパラメータの点推定のみを提供する。ベイズ的視点を採り、ゲームパラメータの後方分布を構成する。この構造化されたVAEは、観測された相互作用のラベルのないデータセットから訓練することができる。
論文参考訳（メタデータ） (2024-02-14T02:17:37Z)
Pontryagin Neural Operator for Solving Parametric General-Sum Differential Games [24.012924492073974]
本稿では,ポントリャーギンモード型ニューラルオペレータが,パラメトリック状態制約のあるゲーム間での安全性能において,現在最先端のハイブリッドPINNモデルより優れていることを示す。私たちの重要な貢献は、前方と後方のコストトロールアウトの相違について定義されたコストト損失の導入です。状態制約違反を反映できるコストトダイナミクスにより,大きなリプシッツ定数を持つ微分可能な値の学習が効果的に可能であることを示す。
論文参考訳（メタデータ） (2024-01-03T02:15:32Z)
Global Nash Equilibrium in Non-convex Multi-player Game: Theory and Algorithms [66.8634598612777]
ナッシュ均衡(NE)はマルチプレイヤーゲームにおいて全てのプレイヤーに受け入れられることを示す。また、一般理論から一歩ずつ一方的に利益を得ることはできないことも示している。
論文参考訳（メタデータ） (2023-01-19T11:36:50Z)
Function Approximation for Solving Stackelberg Equilibrium in Large Perfect Information Games [115.77438739169155]
汎用ゲームにおける状態値関数の一般化であるtextitEnforceable Payoff Frontier (EPF) の学習を提案する。 Stackelbergの設定にFAを適用する最初の方法です。
論文参考訳（メタデータ） (2022-12-29T19:05:50Z)
Learning Correlated Equilibria in Mean-Field Games [62.14589406821103]
我々は平均場相関と粗相関平衡の概念を発展させる。ゲームの構造に関する仮定を必要とせず,効率よくゲーム内で学習できることが示される。
論文参考訳（メタデータ） (2022-08-22T08:31:46Z)
Provably Efficient Fictitious Play Policy Optimization for Zero-Sum Markov Games with Structured Transitions [145.54544979467872]
本研究では,ゼロサムマルコフゲームに対して,構造的だが未知の遷移を伴う架空のプレイポリシー最適化アルゴリズムを提案し,解析する。我々は、2年制の競争ゲームシナリオで、$K$のエピソードに続き、$widetildemathcalO(sqrtK)$ regret boundsを証明した。提案アルゴリズムは,アッパー信頼境界(UCB)型最適化と,同時政策最適化の範囲内での架空のプレイの組み合わせを特徴とする。
論文参考訳（メタデータ） (2022-07-25T18:29:16Z)
Learning in Congestion Games with Bandit Feedback [45.4542525044623]
我々は、良質な理論構造と広い実世界の応用を持つゲームのクラスである混雑ゲームについて検討する。まず,渋滞ゲームにおける不確実性原理に直面する楽観性に基づく集中型アルゴリズムを提案する。次に,Frank-Wolfe法とG-Optimal設計を組み合わせた分散アルゴリズムを提案する。
論文参考訳（メタデータ） (2022-06-04T02:32:26Z)
Towards convergence to Nash equilibria in two-team zero-sum games [17.4461045395989]
2チームゼロサムゲームは、プレイヤーが2つの競合するエージェントに分割されるマルチプレイヤーゲームとして定義される。我々はNash equilibria(NE)の解の概念に焦点をあてる。このクラスのゲームに対する計算 NE は、複雑性クラス $mathrm$ に対して $textithard$ であることを示す。
論文参考訳（メタデータ） (2021-11-07T21:15:35Z)
Empirical Analysis of Fictitious Play for Nash Equilibrium Computation in Multiplayer Games [0.4895118383237099]
架空のプレイは、2つのプレイヤーゼロサムゲームのような特定のゲームクラスにおいてナッシュ均衡に収束することが保証される。実のところ、架空の遊びは、様々なゲームクラスやサイズに対するナッシュ均衡近似の改善につながることを示す。
論文参考訳（メタデータ） (2020-01-30T03:47:09Z)
Non-Cooperative Game Theory Based Rate Adaptation for Dynamic Video Streaming over HTTP [89.30855958779425]
Dynamic Adaptive Streaming over HTTP (DASH)は、新興かつ有望なマルチメディアストリーミング技術であることを示した。本稿では,サーバの限られた輸出帯域幅をマルチユーザに対して最適に割り当てるアルゴリズムを提案し,その品質・オブ・エクスペリエンス(QoE)を公平性で最大化する。
論文参考訳（メタデータ） (2019-12-27T01:19:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。