論文の概要: Robust equilibria in continuous games: From strategic to dynamic robustness
- arxiv url: http://arxiv.org/abs/2512.08138v1
- Date: Tue, 09 Dec 2025 00:30:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.768573
- Title: Robust equilibria in continuous games: From strategic to dynamic robustness
- Title(参考訳): 連続ゲームにおけるロバスト均衡:戦略的から動的ロバスト性へ
- Authors: Kyriakos Lotidis, Panayotis Mertikopoulos, Nicholas Bambos, Jose Blanchet,
- Abstract要約: 連続ゲームにおけるナッシュ均衡のロバスト性について、戦略的および動的不確実性の両方の下で検討する。
それらとは全く異なる起源にもかかわらず、ロバスト性という2つの概念の間の構造的対応を確立する。
エントロピカルに規則化された学習は、親和性に制約されたアクション空間を持つゲームにおいて幾何的な速度で収束することを示す。
- 参考スコア(独自算出の注目度): 25.372363445606265
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we examine the robustness of Nash equilibria in continuous games, under both strategic and dynamic uncertainty. Starting with the former, we introduce the notion of a robust equilibrium as those equilibria that remain invariant to small -- but otherwise arbitrary -- perturbations to the game's payoff structure, and we provide a crisp geometric characterization thereof. Subsequently, we turn to the question of dynamic robustness, and we examine which equilibria may arise as stable limit points of the dynamics of "follow the regularized leader" (FTRL) in the presence of randomness and uncertainty. Despite their very distinct origins, we establish a structural correspondence between these two notions of robustness: strategic robustness implies dynamic robustness, and, conversely, the requirement of strategic robustness cannot be relaxed if dynamic robustness is to be maintained. Finally, we examine the rate of convergence to robust equilibria as a function of the underlying regularizer, and we show that entropically regularized learning converges at a geometric rate in games with affinely constrained action spaces.
- Abstract(参考訳): 本稿では,連続ゲームにおけるナッシュ均衡のロバスト性について,戦略的および動的不確かさの両面から検討する。
前者から始めると、ゲームのペイオフ構造に対する小さな(しかし任意ではない)摂動に不変な平衡として頑健な平衡の概念を導入し、その明快な幾何学的特徴を提供する。
その後、動的ロバスト性の問題に目を向け、ランダム性と不確実性の存在下で「正規化リーダ」の力学の安定な限界点として平衡が生じるかを検討する。
戦略的ロバスト性は動的ロバスト性を意味し、逆に、動的ロバスト性を維持するためには戦略的ロバスト性の必要性は緩和できない。
最後に、基礎となる正則化の関数としてのロバスト均衡への収束率について検討し、親和性に制約されたアクション空間を持つゲームにおいて、エントロピカル正規化学習が幾何速度で収束することを示す。
関連論文リスト
- Learnable Mixed Nash Equilibria are Collectively Rational [17.93053401419066]
等安定性は, 漸進的スムーズな最適応答ダイナミクスの族に対する最終点収束挙動を決定することを示す。
社会的に非効率な解に安定化できる厳密な平衡に関する力学とは異なり、混合ナッシュ平衡の近傍での個別に実用性を求める挙動は合理性をもたらす。
論文 参考訳(メタデータ) (2025-10-16T17:25:32Z) - Zubov-Net: Adaptive Stability for Neural ODEs Reconciling Accuracy with Robustness [0.16355471507854133]
本稿ではZubovNetという適応型安定学習フレームワークを提案する。
本稿では,PRoAsを直接最適化することで,ロアの形状を積極的に制御する新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2025-09-26T05:01:51Z) - Critical dynamics and superconducting state preparation in the quenched Kitaev chain with pairing imbalance [0.0]
ペアリング項のバランスは、p波スピンレスキタエフ鎖におけるトポロジカル超伝導の出現に重要な役割を果たしている。
北エフ鎖の平衡現象と非平衡現象に対する非エルミートペアリング項の影響について検討する。
論文 参考訳(メタデータ) (2025-09-25T20:28:58Z) - Noradrenergic-inspired gain modulation attenuates the stability gap in joint training [44.99833362998488]
連続学習の研究は、安定性ギャップとして知られる新しいタスクを同化する際に、マスターされたタスクのパフォーマンスが過度に低下することを発見した。
タスク境界における迅速な適応と堅牢な保持のバランスの不均衡を反映していると我々は主張する。
結節性好中球を介するノルアドレナリン系バーストに着想を得て,不確実性変調ゲインダイナミクスを提案する。
論文 参考訳(メタデータ) (2025-07-18T16:34:06Z) - Overcoming Non-stationary Dynamics with Evidential Proximal Policy Optimization [11.320660946946523]
非定常環境の継続的な制御は、深層強化学習アルゴリズムの大きな課題である。
我々は、明白な批評家と政治上の強化学習を行うことが両立していることを示す。
我々は,政策評価と政策改善の段階において,明らかな不確実性定量化の不可欠な役割から,結果のアルゴリズムであるemphEvidential Proximal Policy Optimization (EPPO) を命名した。
論文 参考訳(メタデータ) (2025-03-03T12:23:07Z) - The equivalence of dynamic and strategic stability under regularized
learning in games [33.74394172275373]
有限ゲームにおける正規化学習の長時間動作について検討する。
戦略的安定性と動的安定性の等価性を得る。
エントロピー正則化に基づく手法は幾何速度で収束することを示す。
論文 参考訳(メタデータ) (2023-11-04T14:07:33Z) - Dynamics with autoregressive neural quantum states: application to
critical quench dynamics [41.94295877935867]
本稿では、量子系の長時間のダイナミクスを安定的に捉えるための代替の汎用スキームを提案する。
二次元量子イジングモデルにおけるキブル・ズレーク機構の解明により,時間依存性のクエンチ力学にこのスキームを適用した。
論文 参考訳(メタデータ) (2022-09-07T15:50:00Z) - Pareto Adversarial Robustness: Balancing Spatial Robustness and Sensitivity-based Robustness [53.4380239739108]
我々は、普遍的な敵の堅牢性を達成するための戦略を設計する。
我々の知識を最大限に活用するために、我々は多目的最適化による普遍的敵の堅牢性を考える最初の人物である。
論文 参考訳(メタデータ) (2021-11-03T03:28:30Z) - Fine-Grained Analysis of Stability and Generalization for Stochastic
Gradient Descent [55.85456985750134]
我々は,SGDの反復的リスクによって制御される新しい境界を開発する,平均モデル安定性と呼ばれる新しい安定性尺度を導入する。
これにより、最良のモデルの振舞いによって一般化境界が得られ、低雑音環境における最初の既知の高速境界が導かれる。
我々の知る限りでは、このことはSGDの微分不能な損失関数でさえも初めて知られている安定性と一般化を与える。
論文 参考訳(メタデータ) (2020-06-15T06:30:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。