Fugu-MT 論文翻訳(概要): Multi-Agent Performative Prediction Beyond the Insensitivity Assumption: A Case Study for Mortgage Competition

論文の概要: Multi-Agent Performative Prediction Beyond the Insensitivity Assumption: A Case Study for Mortgage Competition

arxiv url: http://arxiv.org/abs/2502.08063v1
Date: Wed, 12 Feb 2025 02:04:46 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-13 18:10:00.837107
Title: Multi-Agent Performative Prediction Beyond the Insensitivity Assumption: A Case Study for Mortgage Competition
Title（参考訳）: 過敏性推定を超えた多エージェント適応予測 : モーゲージ競争を事例として
Authors: Guanghui Wang, Krishna Acharya, Lokranjan Lakshmikanthan, Vidya Muthukumar, Juba Ziani,
Abstract要約: 不感な仮定が持たないパフォーマンス予測の代表的な設定について検討する。私たちは「バンクゲーム」と呼ぶ特定のゲームに焦点を当てています我々の分析は、このゲームの平衡を特徴付け、両企業が共通かつ自然な非回帰学習ダイナミクスを使用する場合、そのダイナミクスは常に安定な結果に収束することを示した。
参考スコア（独自算出の注目度）: 9.76109892287411
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Performative prediction models account for feedback loops in decision-making processes where predictions influence future data distributions. While existing work largely assumes insensitivity of data distributions to small strategy changes, this assumption usually fails in real-world competitive (i.e. multi-agent) settings. For example, in Bertrand-type competitions, a small reduction in one firm's price can lead that firm to capture the entire demand, while all others sharply lose all of their customers. We study a representative setting of multi-agent performative prediction in which insensitivity assumptions do not hold, and investigate the convergence of natural dynamics. To do so, we focus on a specific game that we call the ''Bank Game'', where two lenders compete over interest rates and credit score thresholds. Consumers act similarly as to in a Bertrand Competition, with each consumer selecting the firm with the lowest interest rate that they are eligible for based on the firms' credit thresholds. Our analysis characterizes the equilibria of this game and demonstrates that when both firms use a common and natural no-regret learning dynamic -- exponential weights -- with proper initialization, the dynamics always converge to stable outcomes despite the general-sum structure. Notably, our setting admits multiple stable equilibria, with convergence dependent on initial conditions. We also provide theoretical convergence results in the stochastic case when the utility matrix is not fully known, but each learner can observe sufficiently many samples of consumers at each time step to estimate it, showing robustness to slight mis-specifications. Finally, we provide experimental results that validate our theoretical findings.
Abstract（参考訳）: 適応予測モデルは、予測が将来のデータ分布に影響を与える意思決定プロセスにおけるフィードバックループを説明できる。既存の作業では、データ分散の感度を小さな戦略変更と仮定することが多いが、この仮定は通常、現実の競合(マルチエージェント)設定で失敗する。例えば、ベルトランド方式の競争では、ある企業の価格が小額の値下げによって、その会社は全需要を捉え、他の企業は全顧客を失う。本研究では,不感な仮定が持たないマルチエージェント動作予測の代表的な設定について検討し,自然力学の収束について検討する。そのため、我々は「バンクゲーム」と呼ばれる特定のゲームに焦点を合わせ、2つの銀行が金利と信用スコアの閾値をめぐって競う。消費者はベルトランド・コンペティションと同様に行動し、各消費者は企業の信用基準に基づいて最低金利で会社を選択する。我々の分析は、このゲームの平衡を特徴付け、両方の会社が固有初期化を伴う共通かつ自然な非回帰学習力学(指数重み付け)を用いる場合、一般サム構造にもかかわらず、ダイナミクスは常に安定な結果に収束することを示した。特に、我々の設定は、初期条件に依存する収束性を持つ複数の安定平衡を許容する。また,実用的行列が十分に知られていない場合の確率論的収束結果も提供するが,各学習者は各段階において十分な数の消費者のサンプルを観測でき,誤特定に対する堅牢性を示すことができる。最後に, 理論的知見を検証した実験結果について報告する。

関連論文リスト

Scale-Invariant Fast Convergence in Games [67.02769061793619]
我々は,スケールフリーでもスケール不変でも,高速収束を実現する学習力学を開発した。 2プレーヤゼロサムゲームに対しては、$tildeO(A_mathrmdiff)$で有界な外部後悔を伴うスケールフリーかつスケール不変のダイナミクスが得られる。マルチプレイヤーの汎用ゲームでは、過去の観測に基づいて観察された勾配をクリップする2倍のクリッピングと呼ばれる手法によって、スケールフリーの学習も可能となる。
論文参考訳（メタデータ） (2026-02-12T11:57:20Z)
Convergence of Agnostic Federated Averaging [0.0]
フェデレートラーニング(FL)は、生データを集中化せずに、分散モデルトレーニングを可能にする。クライアントは、サーバアグリゲーションに断続的に参加し、未知の、おそらくバイアスのある参加確率で参加する。
論文参考訳（メタデータ） (2025-07-14T14:32:46Z)
Towards Collaborative Fairness in Federated Learning Under Imbalanced Covariate Shift [38.61713097663966]
FedAKD(Federated Asynchronous Knowledge Distillation)は、正確な予測と協調的公正さのバランスをとる、シンプルで効果的なアプローチである。我々はFedAKDが協調的公正性を大幅に改善し、予測精度を高め、高度に異種なデータ分布であってもクライアントの参加を促進することを示した。
論文参考訳（メタデータ） (2025-07-11T14:13:41Z)
From Average-Iterate to Last-Iterate Convergence in Games: A Reduction and Its Applications [54.49053278073321]
大規模なゲームでは、非結合学習ダイナミクスの平均的な繰り返しを新しい非結合学習ダイナミクスの最後の繰り返しに変換する単純なブラックボックス還元が存在することを示す。我々の削減は、各プレイヤーの効用が自身の戦略と全ての対戦者の共同戦略の両方において線形であるゲームに適用される。
論文参考訳（メタデータ） (2025-06-04T00:24:14Z)
Collaborative Value Function Estimation Under Model Mismatch: A Federated Temporal Difference Analysis [55.13545823385091]
フェデレーション強化学習(FedRL)は、エージェント間のデータ交換を防止し、データのプライバシを維持しながら協調学習を可能にする。現実世界のアプリケーションでは、各エージェントは若干異なる遷移ダイナミクスを経験し、固有のモデルミスマッチを引き起こす。我々は、中程度のレベルの情報共有でも、環境固有のエラーを著しく軽減できることを示した。
論文参考訳（メタデータ） (2025-03-21T18:06:28Z)
On Feasible Rewards in Multi-Agent Inverse Reinforcement Learning [8.284137254112848]
逆強化学習(IRL)は、専門家の行動を分析してユーティリティを明らかにする。本稿では,マルチエージェントIRLにおいて実現可能な報酬セットを厳密に分析する。エントロピー規則化されたゲームを導入し、平衡一意性を確保し、解釈可能性を高める。
論文参考訳（メタデータ） (2024-11-22T16:31:36Z)
Achieving Fairness in Predictive Process Analytics via Adversarial Learning [50.31323204077591]
本稿では、デバイアスフェーズを予測ビジネスプロセス分析に組み込むことの課題に対処する。本研究の枠組みは, 4つのケーススタディで検証し, 予測値に対する偏り変数の寄与を著しく低減することを示した。
論文参考訳（メタデータ） (2024-10-03T15:56:03Z)
Exploiting Approximate Symmetry for Efficient Multi-Agent Reinforcement Learning [19.543995541149897]
我々は、任意の有限プレイヤー、おそらく非対称なゲームから「誘導MFG」に拡張する方法論を提供する。まず、$N$-player の動的ゲームは、明示的な Kirszbraun 拡張によって、無限プレーヤ連続体に対称性を持ち、滑らかに拡張できることを示す。単調性を満たす特定のゲームに対しては、$widetildemathcalO(varepsilon-6)$のサンプル複雑性を証明し、$N$エージェントゲームに対して、$varepsilon$-Nashを対称性バイアスまで学習する。
論文参考訳（メタデータ） (2024-08-27T16:11:20Z)
Editable Fairness: Fine-Grained Bias Mitigation in Language Models [52.66450426729818]
個々人の社会的偏見をきめ細かなキャリブレーションを可能にする新しいデバイアス・アプローチであるFairness Stamp(FAST)を提案する。 FASTは最先端のベースラインを超え、デバイアス性能が優れている。これは、大きな言語モデルにおける公平性を達成するためのきめ細かいデバイアス戦略の可能性を強調している。
論文参考訳（メタデータ） (2024-08-07T17:14:58Z)
AMA-LSTM: Pioneering Robust and Fair Financial Audio Analysis for Stock Volatility Prediction [25.711345527738068]
マルチモーダル法は 2つの欠点に直面しています彼らはしばしば、信頼できるモデルを得るのに失敗し、株式市場からの情報の吸収のためにデータを過大評価する。株のボラティリティを予測するためにマルチモーダルモデルを使用することは、性別バイアスに悩まされ、そのようなバイアスを取り除く効率的な方法が欠如している。我々は,ロバストネス・ワールド・ファイナンシャル・オーディオ・データセットに関する包括的な実験を行い,この手法が現在の最先端ソリューションの性能を上回ることを示した。
論文参考訳（メタデータ） (2024-07-03T18:40:53Z)
MF-OML: Online Mean-Field Reinforcement Learning with Occupation Measures for Large Population Games [3.179831861897336]
本稿では,シーケンシャルゲームのナッシュ平衡計算のためのオンライン平均場強化学習アルゴリズムを提案する。 MFOMLは、ナッシュ平衡を実証的に解くための、最初の完全近似マルチエージェント強化学習アルゴリズムである。副生成物として、モノトーン平均場ゲームの近似計算のための最初のトラクタブル大域収束計算も得られる。
論文参考訳（メタデータ） (2024-05-01T02:19:31Z)
Prediction-sharing During Training and Inference [12.461217702808202]
予測モデルのみを共有する契約、推論時間のみを共有する契約、両方を共有する契約の違いについて検討する。まず,本研究を円滑に進める一般ベイズ的枠組みを構築した。分析の第3段階において、実ローンデータを用いた合成シミュレーションにおいて、概念の適用性を示す。
論文参考訳（メタデータ） (2024-03-26T09:18:50Z)
Optimistic Policy Gradient in Multi-Player Markov Games with a Single Controller: Convergence Beyond the Minty Property [89.96815099996132]
単一コントローラを用いたマルチプレイヤーゲームにおいて,楽観的なポリシー勾配手法を特徴付ける新しいフレームワークを開発した。我々のアプローチは、我々が導入する古典的なミニティの自然一般化に依存しており、マルコフゲームを超えてさらなる応用が期待できる。
論文参考訳（メタデータ） (2023-12-19T11:34:10Z)
Improved Bayes Risk Can Yield Reduced Social Welfare Under Competition [99.7047087527422]
本研究は,機械学習のスケーリングトレンドの振る舞いを根本的に変化させることを実証する。データ表現品質の改善により、ユーザ間での全体的な予測精度が低下する、多くの設定が見つかる。概念レベルでは,各モデルプロジェクタのスケーリング傾向が,社会福祉の下流改善に寄与する必要はないことが示唆された。
論文参考訳（メタデータ） (2023-06-26T13:06:34Z)
Instance-dependent Sample Complexity Bounds for Zero-sum Matrix Games [19.723551683930776]
2人プレイヤゼロサム$ntimes 2$行列ゲームにおける近似平衡を同定するサンプル複雑性について検討する。ゲーム行列上の順序付けを定義するインスタンス依存境界を導出する。この低い境界を達成するためのプレイヤー戦略が存在する。
論文参考訳（メタデータ） (2023-03-19T04:51:28Z)
Representation Learning for General-sum Low-rank Markov Games [63.119870889883224]
非線形関数近似を用いたマルチエージェント汎用マルコフゲームについて検討する。遷移行列が未知の非線形表現の上に隠れた低ランク構造を持つ低ランクマルコフゲームに焦点を当てる。
論文参考訳（メタデータ） (2022-10-30T22:58:22Z)
Learning Correlated Equilibria in Mean-Field Games [62.14589406821103]
我々は平均場相関と粗相関平衡の概念を発展させる。ゲームの構造に関する仮定を必要とせず,効率よくゲーム内で学習できることが示される。
論文参考訳（メタデータ） (2022-08-22T08:31:46Z)
Provably Efficient Fictitious Play Policy Optimization for Zero-Sum Markov Games with Structured Transitions [145.54544979467872]
本研究では,ゼロサムマルコフゲームに対して,構造的だが未知の遷移を伴う架空のプレイポリシー最適化アルゴリズムを提案し,解析する。我々は、2年制の競争ゲームシナリオで、$K$のエピソードに続き、$widetildemathcalO(sqrtK)$ regret boundsを証明した。提案アルゴリズムは,アッパー信頼境界(UCB)型最適化と,同時政策最適化の範囲内での架空のプレイの組み合わせを特徴とする。
論文参考訳（メタデータ） (2022-07-25T18:29:16Z)
Evolutionary Game-Theoretical Analysis for General Multiplayer Asymmetric Games [22.753799819424785]
不正確さなしに、ペイオフテーブルと動的分析のギャップを埋める。いくつかの古典ゲームにおいて,本手法を最先端のゲームと比較する。
論文参考訳（メタデータ） (2022-06-22T14:06:23Z)
Competition over data: how does data purchase affect users? [15.644822986029377]
競合する予測者がラベル付きデータを取得して予測品質を向上させるとどうなるかを検討する。この現象は、競合が各予測者に集団のサブセットを専門化するよう促すトレードオフによって自然に起こることを示す。
論文参考訳（メタデータ） (2022-01-26T06:44:55Z)
Multi-agent Performative Prediction: From Global Stability and Optimality to Chaos [42.40985526691935]
このフレームワークの自然なマルチエージェントバージョンを導入し、複数の意思決定者が同じ結果を予測しようとします。このような競合は、安定性から不安定性、そして最終的にはカオスへの相転移の可能性を証明することによって、興味深い現象をもたらす可能性があることを示す。
論文参考訳（メタデータ） (2022-01-25T17:26:12Z)
Towards convergence to Nash equilibria in two-team zero-sum games [17.4461045395989]
2チームゼロサムゲームは、プレイヤーが2つの競合するエージェントに分割されるマルチプレイヤーゲームとして定義される。我々はNash equilibria(NE)の解の概念に焦点をあてる。このクラスのゲームに対する計算 NE は、複雑性クラス $mathrm$ に対して $textithard$ であることを示す。
論文参考訳（メタデータ） (2021-11-07T21:15:35Z)
Alternative Microfoundations for Strategic Classification [33.67797984699066]
完全な情報を持つ合理的なエージェントは、決定規則に対する集合的応答において不連続を生じさせることを示す。標準的なマイクロファウンデーションの下での最適決定ルールは、社会的負担として知られる負の外部性の尺度を最大化する。我々のモデルは、分析的トラクタビリティを保持し、安定点に関するより堅牢な洞察をもたらし、最適性において社会的負担を低くする。
論文参考訳（メタデータ） (2021-06-24T00:30:58Z)
Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文参考訳（メタデータ） (2021-06-22T18:29:58Z)
Characterizing Fairness Over the Set of Good Models Under Selective Labels [69.64662540443162]
同様の性能を実現するモデルセットに対して,予測公正性を特徴付けるフレームワークを開発する。到達可能なグループレベルの予測格差の範囲を計算するためのトラクタブルアルゴリズムを提供します。選択ラベル付きデータの実証的な課題に対処するために、我々のフレームワークを拡張します。
論文参考訳（メタデータ） (2021-01-02T02:11:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。