論文の概要: Subsidy design for better social outcomes
- arxiv url: http://arxiv.org/abs/2409.03129v1
- Date: Wed, 4 Sep 2024 23:38:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 22:44:13.268766
- Title: Subsidy design for better social outcomes
- Title(参考訳): より良い社会的成果のためのサブシディデザイン
- Authors: Maria-Florina Balcan, Matteo Pozzi, Dravyansh Sharma,
- Abstract要約: セントラルプランナーは これらの問題を 大幅に軽減できる 補助金を注入することで システムに関連する コストを削減できる
我々は、社会的利益を完璧に最適化する補助金の設計について、アナーキー価格の最小化や情報回避行動の防止の観点から、標準的な複雑性理論の仮定の下で計算的に困難であることを示す。
- 参考スコア(独自算出の注目度): 24.2043855572415
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Overcoming the impact of selfish behavior of rational players in multiagent systems is a fundamental problem in game theory. Without any intervention from a central agent, strategic users take actions in order to maximize their personal utility, which can lead to extremely inefficient overall system performance, often indicated by a high Price of Anarchy. Recent work (Lin et al. 2021) investigated and formalized yet another undesirable behavior of rational agents, that of avoiding freely available information about the game for selfish reasons, leading to worse social outcomes. A central planner can significantly mitigate these issues by injecting a subsidy to reduce certain costs associated with the system and obtain net gains in the system performance. Crucially, the planner needs to determine how to allocate this subsidy effectively. We formally show that designing subsidies that perfectly optimize the social good, in terms of minimizing the Price of Anarchy or preventing the information avoidance behavior, is computationally hard under standard complexity theoretic assumptions. On the positive side, we show that we can learn provably good values of subsidy in repeated games coming from the same domain. This data-driven subsidy design approach avoids solving computationally hard problems for unseen games by learning over polynomially many games. We also show that optimal subsidy can be learned with no-regret given an online sequence of games, under mild assumptions on the cost matrix. Our study focuses on two distinct games: a Bayesian extension of the well-studied fair cost-sharing game, and a component maintenance game with engineering applications.
- Abstract(参考訳): マルチエージェントシステムにおける合理的プレイヤーの利己的行動の影響を克服することはゲーム理論における根本的な問題である。
中央のエージェントからの介入がなければ、戦略的なユーザは個人のユーティリティを最大限にするために行動を起こす。
最近の研究(Lin et al 2021)は、合理的エージェントの別の望ましくない行動を調査し、形式化した。
中央プランナーは、補助金を注入してシステムに関連するコストを低減し、システム性能の純利を得ることにより、これらの問題を著しく軽減することができる。
重要なことは、プランナーがこの補助金を効果的に割り当てる方法を決定する必要がある。
我々は、社会的利益を完璧に最適化する補助金の設計について、アナーキー価格の最小化や情報回避行動の防止の観点から、標準的な複雑性理論の仮定の下で計算的に困難であることを正式に示す。
肯定的な側面から、同じドメインから来る繰り返しゲームにおいて、補助金の優れた価値を確実に学習できることが示される。
このデータ駆動補助設計アプローチは、多項式的に多くのゲームから学習することで、目に見えないゲームの計算的に難しい問題を解くことを避ける。
また,オンラインゲームのオンラインシーケンスを考慮すれば,コスト行列の軽度な仮定の下で,最適助成金を学習できることも示している。
本研究は2つの異なるゲームに焦点を当てる: よく研究されている公正なコスト共有ゲームのベイズ拡張と、エンジニアリング応用によるコンポーネントメンテナンスゲームである。
関連論文リスト
- Learning to Mitigate Externalities: the Coase Theorem with Hindsight Rationality [62.18973784316808]
経済理論において、外部性の概念は、社会的福祉に影響を与えるプレイヤー間の相互作用から生じる間接的な効果を指す。
我々の研究は、バーゲンが根底にあるゲームについて完全な知識を持っているという古典的な仮定を取り除いている。
次に、プレイヤーが全福祉を最大化する交渉戦略を学習できるようにするための政策を設計する。
論文 参考訳(メタデータ) (2024-06-28T11:00:53Z) - Learning Optimal Tax Design in Nonatomic Congestion Games [63.89699366726275]
我々は,非原子的混雑ゲームにおいて,最適な税制設計を学習し,効率を最大化する方法について検討する。
プレイヤー間の自己関心行動がシステムの効率を損なうことが知られている。
論文 参考訳(メタデータ) (2024-02-12T06:32:53Z) - Abstracting Imperfect Information Away from Two-Player Zero-Sum Games [85.27865680662973]
Nayyar et al. (2013) は、プレイヤーがプレイ中にポリシーを公に発表することで、不完全な情報を共通のペイオフゲームから抽象化できることを示した。
この研究は、ある正規化された平衡が上記の非対応問題を持たないことを示している。
これらの正規化された平衡はナッシュ平衡に任意に近づくことができるので、この結果は2つのプレイヤーゼロサムゲームを解くための新たな視点への扉を開く。
論文 参考訳(メタデータ) (2023-01-22T16:54:06Z) - How Bad is Selfish Driving? Bounding the Inefficiency of Equilibria in
Urban Driving Games [64.71476526716668]
我々は,任意の平衡選手がプレーに同意するであろう効率について検討する。
我々は、アナーキーの価格に関する既存の境界を洗練させる保証を得る。
提案手法はオープンループ軌道に対する懸念を保証しているが,エージェントがクローズドループポリシーを採用する場合においても,効率的な平衡を観測する。
論文 参考訳(メタデータ) (2022-10-24T09:32:40Z) - Inducing Equilibria via Incentives: Simultaneous Design-and-Play Finds
Global Optima [114.31577038081026]
本稿では,デザイナーとエージェントの問題を同時に1ループで解くための効率的な手法を提案する。
設計者は平衡問題を何度も解決しないが、エージェントに対するインセンティブの全体的な影響を予測できる。
このアルゴリズムは,幅広い種類のゲームに対して,サブ線形速度で大域的最適値に収束することを示す。
論文 参考訳(メタデータ) (2021-10-04T06:53:59Z) - Solving Graph-based Public Good Games with Tree Search and Imitation
Learning [4.499055111059408]
我々は,自己関心エージェントのネットワークをグローバルに捉えた中心的プランナーの視点と,ベストショットの公共商品ゲームにおける所望の資産の最大化を目標とする。
この既知のNP完全問題に対する既存のアルゴリズムは、社会福祉以外の基準に最適化できない準最適解を見つける。
提案手法は,グラフの平衡と最大独立集合(mIS)構造特性の対応性を直接活用する。
論文 参考訳(メタデータ) (2021-06-12T12:46:44Z) - Multi-Principal Assistance Games [11.85513759444069]
社会的選択論や投票理論における不合理性定理はそのようなゲームに適用できる。
我々は特に、人間がまず腕の好みを示すために行動するバンディットの見習いゲームを分析する。
本稿では,選好推論と社会福祉最適化を組み合わせるために,システムの共有制御を用いた社会的選択手法を提案する。
論文 参考訳(メタデータ) (2020-07-19T00:23:25Z) - Signaling in Bayesian Network Congestion Games: the Subtle Power of
Symmetry [66.82463322411614]
本論文は, 最適遠点透過型シグナリング方式の問題点に焦点をあて, 対称性がその解法において重要な性質であることを示す。
プレイヤーが対称でアフィンコスト関数を持つとき,最適なエクアント説得スキームが計算可能であることを示す。
論文 参考訳(メタデータ) (2020-02-12T19:38:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。