論文の概要: Personalized incentives as feedback design in generalized Nash
equilibrium problems
- arxiv url: http://arxiv.org/abs/2203.12948v3
- Date: Mon, 22 May 2023 07:34:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 06:24:57.903713
- Title: Personalized incentives as feedback design in generalized Nash
equilibrium problems
- Title(参考訳): 一般化ナッシュ均衡問題におけるフィードバック設計としてのパーソナライズドインセンティブ
- Authors: Filippo Fabiani, Andrea Simonetto, Paul J. Goulart
- Abstract要約: 定常および時間変化の非単調なナッシュ平衡問題について検討する。
半分散Nash平衡探索アルゴリズムを設計する。
いくつかの企業が提供している配車サービスについては,サービスオーケストレーションとして検討しています。
- 参考スコア(独自算出の注目度): 6.10183951877597
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate both stationary and time-varying, nonmonotone generalized Nash
equilibrium problems that exhibit symmetric interactions among the agents,
which are known to be potential. As may happen in practical cases, however, we
envision a scenario in which the formal expression of the underlying potential
function is not available, and we design a semi-decentralized Nash equilibrium
seeking algorithm. In the proposed two-layer scheme, a coordinator iteratively
integrates the (possibly noisy and sporadic) agents' feedback to learn the
pseudo-gradients of the agents, and then design personalized incentives for
them. On their side, the agents receive those personalized incentives, compute
a solution to an extended game, and then return feedback measurements to the
coordinator. In the stationary setting, our algorithm returns a Nash
equilibrium in case the coordinator is endowed with standard learning policies,
while it returns a Nash equilibrium up to a constant, yet adjustable, error in
the time-varying case. As a motivating application, we consider the ridehailing
service provided by several companies with mobility as a service orchestration,
necessary to both handle competition among firms and avoid traffic congestion,
which is also adopted to run numerical experiments verifying our results.
- Abstract(参考訳): 定時的および時間的に変化する非単調なナッシュ平衡問題について検討し, ポテンシャルが知られているエージェント間の対称相互作用を示す。
しかし,実例では起こりうるように,基礎となるポテンシャル関数の形式的表現が利用できないシナリオを想定し,半分散なナッシュ均衡探索アルゴリズムを設計する。
提案した2層方式では,コーディネータがエージェントのフィードバックを反復的に統合し,エージェントの擬似階調を学習し,パーソナライズされたインセンティブを設計する。
彼らの側では、エージェントはパーソナライズされたインセンティブを受け取り、拡張されたゲームに対する解決策を計算し、コーディネータにフィードバックの測定結果を返す。
定常環境では、我々のアルゴリズムは、コーディネータが標準学習ポリシーを付与された場合にnash平衡を返すが、時間変動の場合ではnash平衡を一定だが調整可能な誤差まで返す。
モビリティを持つ複数の企業がサービスオーケストレーションとして提供する配車サービスをモチベーションアプリケーションとして検討し,企業間の競争に対処し,交通渋滞を回避し,その結果を検証する数値実験も実施する。
関連論文リスト
- An Online Feasible Point Method for Benign Generalized Nash Equilibrium Problems [4.243592852049963]
一般化されたナッシュ均衡ゲームのための新しいオンライン実現可能な点法を提案する。
エージェント間の通信が制限されているという仮定の下で、本手法は実現可能性を保証する。
我々は、我々の方法の平衡への収束が保証される良性一般化ナッシュ均衡問題のクラスを特定する。
論文 参考訳(メタデータ) (2024-10-03T11:27:55Z) - Differentiable Arbitrating in Zero-sum Markov Games [59.62061049680365]
ゼロサムマルコフゲームにおいて、2人のプレイヤーが望ましいナッシュ均衡、すなわち仲裁を誘導する報酬を摂動する方法を研究する。
低いレベルでは、与えられた報酬関数の下でのナッシュ均衡の解決が必要であり、それによって全体的な問題をエンドツーエンドで最適化することが難しくなる。
上層階の勾配フィードバックを提供するナッシュ平衡を微分するバックプロパゲーション方式を提案する。
論文 参考訳(メタデータ) (2023-02-20T16:05:04Z) - Game-Theoretical Perspectives on Active Equilibria: A Preferred Solution
Concept over Nash Equilibria [61.093297204685264]
マルチエージェント強化学習における効果的なアプローチは,エージェントの学習プロセスを検討し,今後の政策に影響を与えることである。
この新たな解の概念は、ナッシュ均衡のような標準解の概念が活性平衡の特別な場合である、という一般的なものである。
我々は,ゲーム理論の観点から,ナッシュ平衡が知られている実例を綿密に研究することにより,アクティブ平衡を解析する。
論文 参考訳(メタデータ) (2022-10-28T14:45:39Z) - Decentralized Policy Gradient for Nash Equilibria Learning of
General-sum Stochastic Games [8.780797886160402]
遷移確率密度関数の未知な一般サムゲームのナッシュ平衡学習について検討する。
正確な擬似勾配を持つ場合、ナッシュ平衡と変分不等式の問題の等価性による2ループアルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-14T09:09:56Z) - On the Nash equilibrium of moment-matching GANs for stationary Gaussian
processes [2.25477613430341]
我々は、一貫したナッシュ均衡の存在は、判別器ファミリーの選択に大きく依存していることを示す。
さらに、一貫した平衡に向けた勾配降下法における局所安定性と大域収束について検討する。
論文 参考訳(メタデータ) (2022-03-14T14:30:23Z) - Learning equilibria with personalized incentives in a class of
nonmonotone games [7.713240800142863]
我々は、ポテンシャルであることが知られているエージェント間の対称相互作用を伴う二次的、非単調なナッシュ均衡問題を考察する。
提案手法では,コーディネータが騒音エージェントのフィードバックを反復的に統合し,エージェントの擬似階調を学習し,パーソナライズされたインセンティブを設計する。
我々は,コーディネータに標準学習ポリシーが与えられた場合,アルゴリズムが平衡を返すことを示す。
論文 参考訳(メタデータ) (2021-11-06T11:18:59Z) - Inducing Equilibria via Incentives: Simultaneous Design-and-Play Finds
Global Optima [114.31577038081026]
本稿では,デザイナーとエージェントの問題を同時に1ループで解くための効率的な手法を提案する。
設計者は平衡問題を何度も解決しないが、エージェントに対するインセンティブの全体的な影響を予測できる。
このアルゴリズムは,幅広い種類のゲームに対して,サブ線形速度で大域的最適値に収束することを示す。
論文 参考訳(メタデータ) (2021-10-04T06:53:59Z) - End-to-End Learning and Intervention in Games [60.41921763076017]
ゲームにおける学習と介入のための統一的なフレームワークを提供する。
明示的および暗黙的な区別に基づく2つのアプローチを提案する。
分析結果は、実世界のいくつかの問題を用いて検証される。
論文 参考訳(メタデータ) (2020-10-26T18:39:32Z) - On Information Asymmetry in Competitive Multi-Agent Reinforcement
Learning: Convergence and Optimality [78.76529463321374]
協調的でない2つのQ-ラーニングエージェントの相互作用システムについて検討する。
この情報非対称性は、集団学習の安定した結果をもたらす可能性があることを示す。
論文 参考訳(メタデータ) (2020-10-21T11:19:53Z) - Distributing entanglement with separable states: assessment of encoding
and decoding imperfections [55.41644538483948]
絡み合いは、常に関連する他のシステムと分離可能なキャリアを使って分散することができる。
不完全なユニタリ相互作用と協調して作用する不整合力学の影響を考察する。
絡み合いの利得は、相当な単元誤差があっても可能であることを示す。
論文 参考訳(メタデータ) (2020-02-11T15:25:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。