論文の概要: Learning equilibria with personalized incentives in a class of
nonmonotone games
- arxiv url: http://arxiv.org/abs/2111.03854v1
- Date: Sat, 6 Nov 2021 11:18:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-09 17:47:32.606863
- Title: Learning equilibria with personalized incentives in a class of
nonmonotone games
- Title(参考訳): 非単調ゲームにおけるパーソナライズインセンティブを用いた学習平衡
- Authors: Filippo Fabiani, Andrea Simonetto and Paul J. Goulart
- Abstract要約: 我々は、ポテンシャルであることが知られているエージェント間の対称相互作用を伴う二次的、非単調なナッシュ均衡問題を考察する。
提案手法では,コーディネータが騒音エージェントのフィードバックを反復的に統合し,エージェントの擬似階調を学習し,パーソナライズされたインセンティブを設計する。
我々は,コーディネータに標準学習ポリシーが与えられた場合,アルゴリズムが平衡を返すことを示す。
- 参考スコア(独自算出の注目度): 7.713240800142863
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider quadratic, nonmonotone generalized Nash equilibrium problems with
symmetric interactions among the agents, which are known to be potential. As
may happen in practical cases, we envision a scenario in which an explicit
expression of the underlying potential function is not available, and we design
a two-layer Nash equilibrium seeking algorithm. In the proposed scheme, a
coordinator iteratively integrates the noisy agents' feedback to learn the
pseudo-gradients of the agents, and then design personalized incentives for
them. On their side, the agents receive those personalized incentives, compute
a solution to an extended game, and then return feedback measures to the
coordinator. We show that our algorithm returns an equilibrium in case the
coordinator is endowed with standard learning policies, and corroborate our
results on a numerical instance of a hypomonotone game.
- Abstract(参考訳): 我々は、ポテンシャルであることが知られているエージェント間の対称相互作用を伴う二次的、非単調なナッシュ均衡問題を考察する。
実際に起こりうるように、基礎となるポテンシャル関数の明示的な表現が利用できないシナリオを想定し、2層ナッシュ平衡探索アルゴリズムを設計する。
提案手法では,コーディネータが騒音エージェントのフィードバックを反復的に統合し,エージェントの擬似階調を学習し,パーソナライズされたインセンティブを設計する。
彼らの側では、エージェントはパーソナライズされたインセンティブを受け取り、拡張されたゲームに対する解決策を計算し、コーディネータにフィードバック対策を返す。
本アルゴリズムは,コーディネータが標準的な学習方針を付与された場合,均衡を返し,ハイポモノトーンゲームの数値インスタンスで結果を照合する。
関連論文リスト
- Independent Learning in Constrained Markov Potential Games [19.083595175045073]
制約付きマルコフゲームは、マルチエージェント強化学習問題をモデル化するための正式なフレームワークを提供する。
近似的制約付きナッシュ平衡を学習するための独立ポリシー勾配アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-27T20:57:35Z) - Differentiable Arbitrating in Zero-sum Markov Games [59.62061049680365]
ゼロサムマルコフゲームにおいて、2人のプレイヤーが望ましいナッシュ均衡、すなわち仲裁を誘導する報酬を摂動する方法を研究する。
低いレベルでは、与えられた報酬関数の下でのナッシュ均衡の解決が必要であり、それによって全体的な問題をエンドツーエンドで最適化することが難しくなる。
上層階の勾配フィードバックを提供するナッシュ平衡を微分するバックプロパゲーション方式を提案する。
論文 参考訳(メタデータ) (2023-02-20T16:05:04Z) - Offline Learning in Markov Games with General Function Approximation [22.2472618685325]
マルコフゲームにおけるオフラインマルチエージェント強化学習(RL)について検討する。
マルコフゲームにおけるサンプル効率のよいオフライン学習のための最初のフレームワークを提供する。
論文 参考訳(メタデータ) (2023-02-06T05:22:27Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Game-Theoretical Perspectives on Active Equilibria: A Preferred Solution
Concept over Nash Equilibria [61.093297204685264]
マルチエージェント強化学習における効果的なアプローチは,エージェントの学習プロセスを検討し,今後の政策に影響を与えることである。
この新たな解の概念は、ナッシュ均衡のような標準解の概念が活性平衡の特別な場合である、という一般的なものである。
我々は,ゲーム理論の観点から,ナッシュ平衡が知られている実例を綿密に研究することにより,アクティブ平衡を解析する。
論文 参考訳(メタデータ) (2022-10-28T14:45:39Z) - Personalized incentives as feedback design in generalized Nash
equilibrium problems [6.10183951877597]
定常および時間変化の非単調なナッシュ平衡問題について検討する。
半分散Nash平衡探索アルゴリズムを設計する。
いくつかの企業が提供している配車サービスについては,サービスオーケストレーションとして検討しています。
論文 参考訳(メタデータ) (2022-03-24T09:24:29Z) - Inducing Equilibria via Incentives: Simultaneous Design-and-Play Finds
Global Optima [114.31577038081026]
本稿では,デザイナーとエージェントの問題を同時に1ループで解くための効率的な手法を提案する。
設計者は平衡問題を何度も解決しないが、エージェントに対するインセンティブの全体的な影響を予測できる。
このアルゴリズムは,幅広い種類のゲームに対して,サブ線形速度で大域的最適値に収束することを示す。
論文 参考訳(メタデータ) (2021-10-04T06:53:59Z) - End-to-End Learning and Intervention in Games [60.41921763076017]
ゲームにおける学習と介入のための統一的なフレームワークを提供する。
明示的および暗黙的な区別に基づく2つのアプローチを提案する。
分析結果は、実世界のいくつかの問題を用いて検証される。
論文 参考訳(メタデータ) (2020-10-26T18:39:32Z) - On Information Asymmetry in Competitive Multi-Agent Reinforcement
Learning: Convergence and Optimality [78.76529463321374]
協調的でない2つのQ-ラーニングエージェントの相互作用システムについて検討する。
この情報非対称性は、集団学習の安定した結果をもたらす可能性があることを示す。
論文 参考訳(メタデータ) (2020-10-21T11:19:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。