論文の概要: Last-iterate Convergence for Symmetric, General-sum, $2 \times 2$ Games Under The Exponential Weights Dynamic
- arxiv url: http://arxiv.org/abs/2502.08063v2
- Date: Wed, 08 Oct 2025 16:32:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:19.977747
- Title: Last-iterate Convergence for Symmetric, General-sum, $2 \times 2$ Games Under The Exponential Weights Dynamic
- Title(参考訳): 指数重み動的条件下での2ドル・2ドルゲームにおけるラストイテレート収束
- Authors: Guanghui Wang, Krishna Acharya, Lokranjan Lakshmikanthan, Juba Ziani, Vidya Muthukumar,
- Abstract要約: 離散時間指数重みの包括的解析を行い、すべてのエンファンジェラルサムおよび対称2倍の正規形式ゲームにおいて一定のステップサイズで行う。
第一原理解析を通して、指数重みはそのようなゲームの最終回において動的に収束することを示す。
我々は、上記のゲーム理論の相互作用に対する広範なシミュレーションと応用について説明する。
- 参考スコア(独自算出の注目度): 15.036423818666774
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We conduct a comprehensive analysis of the discrete-time exponential-weights dynamic with a constant step size on all \emph{general-sum and symmetric} $2 \times 2$ normal-form games, i.e. games with $2$ pure strategies per player, and where the ensuing payoff tuple is of the form $(A,A^\top)$ (where $A$ is the $2 \times 2$ payoff matrix corresponding to the first player). Such symmetric games commonly arise in real-world interactions between "symmetric" agents who have identically defined utility functions -- such as Bertrand competition, multi-agent performative prediction, and certain congestion games -- and display a rich multiplicity of equilibria despite the seemingly simple setting. Somewhat surprisingly, we show through a first-principles analysis that the exponential weights dynamic, which is popular in online learning, converges in the last iterate for such games regardless of initialization with an appropriately chosen step size. For certain games and/or initializations, we further show that the convergence rate is in fact exponential and holds for any step size. We illustrate our theory with extensive simulations and applications to the aforementioned game-theoretic interactions. In the case of multi-agent performative prediction, we formulate a new "mortgage competition" game between lenders (i.e. banks) who interact with a population of customers, and show that it fits into our framework.
- Abstract(参考訳): 我々は、すべての \emph{general-sum and symmetric} $2 \times 2$ normal-form games, すなわち、プレイヤーごとに2ドル純粋な戦略を持つゲーム、そして続くペイオフタプルが$(A,A^\top)$(A$は第1のプレイヤーに対応する2ドル以上のペイオフ行列である)の形式であるような離散時間指数重み運動の包括的解析を行う。
このような対称ゲームは、ベルトランド競合、マルチエージェントパフォーマンス予測、ある種の混雑ゲームなど、同一に定義されたユーティリティ関数を持つ「対称」エージェント間の実世界の相互作用によく現れ、一見単純な設定にもかかわらず、平衡の豊富な多重度を示す。
意外なことに、オンライン学習で人気のある指数重みのダイナミクスは、初期化に関係なく適切なステップサイズで初期化しても、最後のイテレーションに収束する。
特定のゲームや初期化に対して、収束速度は実際指数関数であり、任意のステップサイズを保っていることを示す。
我々は、上記のゲーム理論の相互作用に対する広範なシミュレーションと応用について説明する。
マルチエージェント・パフォーマンス予測では,顧客集団と対話する金融機関(銀行)間の新たな「致命的競争」を定式化し,我々の枠組みに適合することを示す。
関連論文リスト
- Convergence of Agnostic Federated Averaging [0.0]
フェデレートラーニング(FL)は、生データを集中化せずに、分散モデルトレーニングを可能にする。
クライアントは、サーバアグリゲーションに断続的に参加し、未知の、おそらくバイアスのある参加確率で参加する。
論文 参考訳(メタデータ) (2025-07-14T14:32:46Z) - Towards Collaborative Fairness in Federated Learning Under Imbalanced Covariate Shift [38.61713097663966]
FedAKD(Federated Asynchronous Knowledge Distillation)は、正確な予測と協調的公正さのバランスをとる、シンプルで効果的なアプローチである。
我々はFedAKDが協調的公正性を大幅に改善し、予測精度を高め、高度に異種なデータ分布であってもクライアントの参加を促進することを示した。
論文 参考訳(メタデータ) (2025-07-11T14:13:41Z) - Collaborative Value Function Estimation Under Model Mismatch: A Federated Temporal Difference Analysis [55.13545823385091]
フェデレーション強化学習(FedRL)は、エージェント間のデータ交換を防止し、データのプライバシを維持しながら協調学習を可能にする。
現実世界のアプリケーションでは、各エージェントは若干異なる遷移ダイナミクスを経験し、固有のモデルミスマッチを引き起こす。
我々は、中程度のレベルの情報共有でも、環境固有のエラーを著しく軽減できることを示した。
論文 参考訳(メタデータ) (2025-03-21T18:06:28Z) - On Feasible Rewards in Multi-Agent Inverse Reinforcement Learning [8.284137254112848]
逆強化学習(IRL)は、専門家の行動を分析してユーティリティを明らかにする。
本稿では,マルチエージェントIRLにおいて実現可能な報酬セットを厳密に分析する。
エントロピー規則化されたゲームを導入し、平衡一意性を確保し、解釈可能性を高める。
論文 参考訳(メタデータ) (2024-11-22T16:31:36Z) - Achieving Fairness in Predictive Process Analytics via Adversarial Learning [50.31323204077591]
本稿では、デバイアスフェーズを予測ビジネスプロセス分析に組み込むことの課題に対処する。
本研究の枠組みは, 4つのケーススタディで検証し, 予測値に対する偏り変数の寄与を著しく低減することを示した。
論文 参考訳(メタデータ) (2024-10-03T15:56:03Z) - Editable Fairness: Fine-Grained Bias Mitigation in Language Models [52.66450426729818]
個々人の社会的偏見をきめ細かなキャリブレーションを可能にする新しいデバイアス・アプローチであるFairness Stamp(FAST)を提案する。
FASTは最先端のベースラインを超え、デバイアス性能が優れている。
これは、大きな言語モデルにおける公平性を達成するためのきめ細かいデバイアス戦略の可能性を強調している。
論文 参考訳(メタデータ) (2024-08-07T17:14:58Z) - AMA-LSTM: Pioneering Robust and Fair Financial Audio Analysis for Stock Volatility Prediction [25.711345527738068]
マルチモーダル法は 2つの欠点に直面しています
彼らはしばしば、信頼できるモデルを得るのに失敗し、株式市場からの情報の吸収のためにデータを過大評価する。
株のボラティリティを予測するためにマルチモーダルモデルを使用することは、性別バイアスに悩まされ、そのようなバイアスを取り除く効率的な方法が欠如している。
我々は,ロバストネス・ワールド・ファイナンシャル・オーディオ・データセットに関する包括的な実験を行い,この手法が現在の最先端ソリューションの性能を上回ることを示した。
論文 参考訳(メタデータ) (2024-07-03T18:40:53Z) - Prediction-sharing During Training and Inference [12.461217702808202]
予測モデルのみを共有する契約、推論時間のみを共有する契約、両方を共有する契約の違いについて検討する。
まず,本研究を円滑に進める一般ベイズ的枠組みを構築した。
分析の第3段階において、実ローンデータを用いた合成シミュレーションにおいて、概念の適用性を示す。
論文 参考訳(メタデータ) (2024-03-26T09:18:50Z) - Improved Bayes Risk Can Yield Reduced Social Welfare Under Competition [99.7047087527422]
本研究は,機械学習のスケーリングトレンドの振る舞いを根本的に変化させることを実証する。
データ表現品質の改善により、ユーザ間での全体的な予測精度が低下する、多くの設定が見つかる。
概念レベルでは,各モデルプロジェクタのスケーリング傾向が,社会福祉の下流改善に寄与する必要はないことが示唆された。
論文 参考訳(メタデータ) (2023-06-26T13:06:34Z) - Competition over data: how does data purchase affect users? [15.644822986029377]
競合する予測者がラベル付きデータを取得して予測品質を向上させるとどうなるかを検討する。
この現象は、競合が各予測者に集団のサブセットを専門化するよう促すトレードオフによって自然に起こることを示す。
論文 参考訳(メタデータ) (2022-01-26T06:44:55Z) - Multi-agent Performative Prediction: From Global Stability and
Optimality to Chaos [42.40985526691935]
このフレームワークの自然なマルチエージェントバージョンを導入し、複数の意思決定者が同じ結果を予測しようとします。
このような競合は、安定性から不安定性、そして最終的にはカオスへの相転移の可能性を証明することによって、興味深い現象をもたらす可能性があることを示す。
論文 参考訳(メタデータ) (2022-01-25T17:26:12Z) - Alternative Microfoundations for Strategic Classification [33.67797984699066]
完全な情報を持つ合理的なエージェントは、決定規則に対する集合的応答において不連続を生じさせることを示す。
標準的なマイクロファウンデーションの下での最適決定ルールは、社会的負担として知られる負の外部性の尺度を最大化する。
我々のモデルは、分析的トラクタビリティを保持し、安定点に関するより堅牢な洞察をもたらし、最適性において社会的負担を低くする。
論文 参考訳(メタデータ) (2021-06-24T00:30:58Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - Characterizing Fairness Over the Set of Good Models Under Selective
Labels [69.64662540443162]
同様の性能を実現するモデルセットに対して,予測公正性を特徴付けるフレームワークを開発する。
到達可能なグループレベルの予測格差の範囲を計算するためのトラクタブルアルゴリズムを提供します。
選択ラベル付きデータの実証的な課題に対処するために、我々のフレームワークを拡張します。
論文 参考訳(メタデータ) (2021-01-02T02:11:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。