論文の概要: Learning Distributed Equilibria in Linear-Quadratic Stochastic Differential Games: An $α$-Potential Approach
- arxiv url: http://arxiv.org/abs/2602.16555v1
- Date: Wed, 18 Feb 2026 15:55:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.639082
- Title: Learning Distributed Equilibria in Linear-Quadratic Stochastic Differential Games: An $α$-Potential Approach
- Title(参考訳): 線形量子確率微分ゲームにおける分散平衡学習:$α$-Potentialアプローチ
- Authors: Philipp Plank, Yufei Zhang,
- Abstract要約: 我々は$N$player linear-quadratic (LQ) 差分ゲームにおける独立ポリシー勾配学習を解析する。
非対称相互作用に対しては、独立射影PGアルゴリズムが近似平衡に線形に収束することが証明される。
- 参考スコア(独自算出の注目度): 1.4576165959001435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We analyze independent policy-gradient (PG) learning in $N$-player linear-quadratic (LQ) stochastic differential games. Each player employs a distributed policy that depends only on its own state and updates the policy independently using the gradient of its own objective. We establish global linear convergence of these methods to an equilibrium by showing that the LQ game admits an $α$-potential structure, with $α$ determined by the degree of pairwise interaction asymmetry. For pairwise-symmetric interactions, we construct an affine distributed equilibrium by minimizing the potential function and show that independent PG methods converge globally to this equilibrium, with complexity scaling linearly in the population size and logarithmically in the desired accuracy. For asymmetric interactions, we prove that independent projected PG algorithms converge linearly to an approximate equilibrium, with suboptimality proportional to the degree of asymmetry. Numerical experiments confirm the theoretical results across both symmetric and asymmetric interaction networks.
- Abstract(参考訳): 我々は,$N$-player linear-quadratic (LQ) 確率微分ゲームにおける独立ポリシー勾配(PG)学習を解析する。
各プレイヤーは自身の状態にのみ依存する分散ポリシーを採用し、自身の目的の勾配を使って独立してポリシーを更新する。
我々は、LQゲームが対の相互作用非対称性の次数によって決定される$α$-ポテンシャル構造を持つことを示すことによって、これらの方法の平衡への大域的線型収束を確立する。
一対の対称相互作用に対して、ポテンシャル関数を最小化してアフィン分散平衡を構築し、独立PG法がこの平衡にグローバルに収束し、複雑性は集団サイズと対数的に所望の精度で線形にスケールすることを示す。
非対称な相互作用に対して、独立射影PGアルゴリズムは非対称性の次数に比例して近似平衡に線形に収束することが証明される。
数値実験により、対称相互作用ネットワークと非対称相互作用ネットワークの両方における理論的結果が確認される。
関連論文リスト
- Asymmetric regularization mechanism for GAN training with Variational Inequalities [1.529943343419486]
我々は,GANの学習をナッシュ均衡問題として定式化する。
古典的チホノフステップと新しいゼロ中心勾配ペナルティに基づく非対称正則化機構を提案する。
論文 参考訳(メタデータ) (2026-01-20T12:50:18Z) - Symmetric Behavior Regularization via Taylor Expansion of Symmetry [8.032060509915821]
対称発散は正規化として解析政策を許さず、損失として数値問題を生じさせることを示した。
対称分岐を持つ最初の実用的BRPOアルゴリズムであるSymmetric $f$ Actor-Critic (S$f$-AC)を提案する。
論文 参考訳(メタデータ) (2025-08-06T09:01:29Z) - On Tractable $Φ$-Equilibria in Non-Concave Games [53.212133025684224]
非コンケーブゲームにおいて、抽出可能な$Phi$-equilibriaについて検討する。
Phi$が有限であるとき、対応する$Phi$-equilibriaに収束する効率的な非結合学習アルゴリズムが存在することを示す。
論文 参考訳(メタデータ) (2024-03-13T01:51:30Z) - Kernel-based off-policy estimation without overlap: Instance optimality
beyond semiparametric efficiency [53.90687548731265]
本研究では,観測データに基づいて線形関数を推定するための最適手順について検討する。
任意の凸および対称函数クラス $mathcalF$ に対して、平均二乗誤差で有界な非漸近局所ミニマックスを導出する。
論文 参考訳(メタデータ) (2023-01-16T02:57:37Z) - Global Convergence of Over-parameterized Deep Equilibrium Models [52.65330015267245]
ディープ均衡モデル(Deep equilibrium model, DEQ)は、入射を伴う無限深度重み付きモデルの平衡点を通して暗黙的に定義される。
無限の計算の代わりに、ルートフィンディングで直接平衡点を解き、暗黙の微分で勾配を計算する。
本稿では,無限深度重み付きモデルの非漸近解析における技術的困難を克服する新しい確率的枠組みを提案する。
論文 参考訳(メタデータ) (2022-05-27T08:00:13Z) - Single Trajectory Nonparametric Learning of Nonlinear Dynamics [8.438421942654292]
力学系の1つの軌道が与えられた場合、非パラメトリック最小二乗推定器(LSE)の性能を解析する。
我々は最近開発された情報理論手法を活用し、非仮説クラスに対するLSEの最適性を確立する。
我々は、リプシッツ力学、一般化線形モデル、再生ケルネルヒルベルト空間(RKHS)のある種のクラスで記述される関数によって記述される力学など、実用上の関心のあるいくつかのシナリオを専門とする。
論文 参考訳(メタデータ) (2022-02-16T19:38:54Z) - On Linear Stochastic Approximation: Fine-grained Polyak-Ruppert and
Non-Asymptotic Concentration [115.1954841020189]
The inequality and non-asymptotic properties of approximation procedure with Polyak-Ruppert averaging。
一定のステップサイズと無限大となる反復数を持つ平均的反復数に対する中心極限定理(CLT)を証明する。
論文 参考訳(メタデータ) (2020-04-09T17:54:18Z) - A Precise High-Dimensional Asymptotic Theory for Boosting and
Minimum-$\ell_1$-Norm Interpolated Classifiers [3.167685495996986]
本稿では,分離可能なデータの強化に関する高精度な高次元理論を確立する。
統計モデルのクラスでは、ブースティングの普遍性誤差を正確に解析する。
また, 推力試験誤差と最適ベイズ誤差の関係を明示的に説明する。
論文 参考訳(メタデータ) (2020-02-05T00:24:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。