論文の概要: Towards Performatively Stable Equilibria in Decision-Dependent Games for Arbitrary Data Distribution Maps
- arxiv url: http://arxiv.org/abs/2509.02619v1
- Date: Mon, 01 Sep 2025 04:48:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.26314
- Title: Towards Performatively Stable Equilibria in Decision-Dependent Games for Arbitrary Data Distribution Maps
- Title(参考訳): 任意データ分布図における決定依存ゲームにおける変形安定平衡に向けて
- Authors: Guangzheng Zhong, Yang Liu, Jiming Liu,
- Abstract要約: 決定に依存したゲームでは、複数のプレイヤーは、共同アクションでシフトするデータ分散の下で決定を最適化する。
本稿では,決定誘起分布シフトの影響を直接定量化する勾配に基づく感度測定法を提案する。
そこで我々は,感性尺度に基づいてプレイヤーの損失関数を調整した,感性インフォームド・リトレーニングアルゴリズムを開発した。
- 参考スコア(独自算出の注目度): 6.621349481928294
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In decision-dependent games, multiple players optimize their decisions under a data distribution that shifts with their joint actions, creating complex dynamics in applications like market pricing. A practical consequence of these dynamics is the \textit{performatively stable equilibrium}, where each player's strategy is a best response under the induced distribution. Prior work relies on $\beta$-smoothness, assuming Lipschitz continuity of loss function gradients with respect to the data distribution, which is impractical as the data distribution maps, i.e., the relationship between joint decision and the resulting distribution shifts, are typically unknown, rendering $\beta$ unobtainable. To overcome this limitation, we propose a gradient-based sensitivity measure that directly quantifies the impact of decision-induced distribution shifts. Leveraging this measure, we derive convergence guarantees for performatively stable equilibria under a practically feasible assumption of strong monotonicity. Accordingly, we develop a sensitivity-informed repeated retraining algorithm that adjusts players' loss functions based on the sensitivity measure, guaranteeing convergence to performatively stable equilibria for arbitrary data distribution maps. Experiments on prediction error minimization game, Cournot competition, and revenue maximization game show that our approach outperforms state-of-the-art baselines, achieving lower losses and faster convergence.
- Abstract(参考訳): 意思決定に依存したゲームでは、複数のプレイヤーが、共同アクションによって変化するデータ分散の下で意思決定を最適化し、市場価格のようなアプリケーションに複雑なダイナミクスを生み出す。
これらの力学の実践的な結果として、各プレイヤーの戦略が誘導分布の下で最良の反応となる「textit{performatively stable equilibrium}」がある。
それまでの研究は$\beta$-smoothnessに依存しており、データ分布マップとして実用的ではないデータ分布に関して、損失関数勾配のリプシッツ連続性を仮定する。
この制限を克服するために、決定誘起分布シフトの影響を直接定量化する勾配に基づく感度測定法を提案する。
この測度を応用して、強い単調性の事実上可能な仮定の下で、実効的に安定な平衡に対する収束保証を導出する。
そこで我々は, 任意のデータ分布マップに対して, 選手の損失関数を感度測定値に基づいて調整し, 安定な平衡値の収束を保証する, 感性インフォームド・リトレーニングアルゴリズムを開発した。
予測誤差最小化ゲーム,Cournotコンペティション,収益最大化ゲームの実験により,我々のアプローチは最先端のベースラインよりも優れ,損失の低減と収束の高速化を実現していることがわかった。
関連論文リスト
- A Distributionally-Robust Framework for Nuisance in Causal Effect Estimation [1.3053649021965603]
因果推論では、治療群と対照群の間のバランスの取れた分布のモデルを評価する必要がある。
最も一般的な統計手法は、逆確率重み付け(IPW)によるこの分布シフトに対処するものである。
誤差一般化を分解してこれらの問題 - 正当性あいまいさと統計的不安定さ - を分離し, 対向損失関数を通して対処する。
論文 参考訳(メタデータ) (2025-05-23T10:34:28Z) - Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - Between Stochastic and Adversarial Online Convex Optimization: Improved
Regret Bounds via Smoothness [2.628557920905129]
我々は,オンライン凸最適化において,対人的損失と完全対人的損失を補間する新たな後悔境界を確立する。
この目的を達成するために、損失系列に関連する2つの重要な量を導入し、累積分散と対角変動と呼ぶ。
完全な i.d. の場合、我々の境界は加速の結果から期待される速度と一致し、完全に反対の場合、ミニマックスの後悔と一致するように優雅に劣化する。
論文 参考訳(メタデータ) (2022-02-15T16:39:33Z) - Label Distributionally Robust Losses for Multi-class Classification:
Consistency, Robustness and Adaptivity [55.29408396918968]
多クラス分類のためのラベル分布ロバスト(LDR)損失という損失関数群について検討した。
我々の貢献は、多クラス分類のためのLDR損失のトップ$kの一貫性を確立することによって、一貫性と堅牢性の両方を含んでいる。
本稿では,各インスタンスのクラスラベルの雑音度に個別化温度パラメータを自動的に適応させる適応型LDR損失を提案する。
論文 参考訳(メタデータ) (2021-12-30T00:27:30Z) - Which Invariance Should We Transfer? A Causal Minimax Learning Approach [18.71316951734806]
本稿では、因果的観点からの包括的ミニマックス分析について述べる。
最小の最悪のリスクを持つサブセットを探索する効率的なアルゴリズムを提案する。
本手法の有効性と有効性は, 合成データとアルツハイマー病の診断で実証された。
論文 参考訳(メタデータ) (2021-07-05T09:07:29Z) - Distributional Reinforcement Learning via Moment Matching [54.16108052278444]
ニューラルネットワークを用いて各戻り分布から統計量の有限集合を学習する手法を定式化する。
我々の手法は、戻り分布とベルマン目標の間のモーメントの全ての順序を暗黙的に一致させるものとして解釈できる。
Atariゲームスイートの実験により,本手法は標準分布RLベースラインよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-07-24T05:18:17Z) - Fair Regression with Wasserstein Barycenters [39.818025466204055]
本稿では, 実数値関数を学習し, 実数値関数の制約を満たす問題について検討する。
予測された出力の分布は、センシティブな属性から独立することを要求する。
フェア回帰と最適輸送理論の関連性を確立し、最適なフェア予測器に対するクローズドフォーム表現を導出する。
論文 参考訳(メタデータ) (2020-06-12T16:10:41Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。