論文の概要: On the Decomposition of Differential Game
- arxiv url: http://arxiv.org/abs/2411.03802v1
- Date: Wed, 06 Nov 2024 09:55:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-07 19:22:21.845746
- Title: On the Decomposition of Differential Game
- Title(参考訳): ディファレンシャルゲームの分解について
- Authors: Nanxiang Zhou, Jing Dong, Yutian Li, Baoxiang Wang,
- Abstract要約: 微分ゲームは、動的に理解されたコンポーネントに分解する。
我々は、スカラーポテンシャルゲームは、フロモデラーポテンシャル1996によって提案された潜在的なゲームと一致することを示す。
ベクトルポテンシャルゲームでは、個々の勾配場が発散しないことを示す。
- 参考スコア(独自算出の注目度): 10.44920684595193
- License:
- Abstract: To understand the complexity of the dynamic of learning in differential games, we decompose the game into components where the dynamic is well understood. One of the possible tools is Helmholtz's theorem, which can decompose a vector field into a potential and a harmonic component. This has been shown to be effective in finite and normal-form games. However, applying Helmholtz's theorem by connecting it with the Hodge theorem on $\mathbb{R}^n$ (which is the strategy space of differential game) is non-trivial due to the non-compactness of $\mathbb{R}^n$. Bridging the dynamic-strategic disconnect through Hodge/Helmoltz's theorem in differential games is then left as an open problem \cite{letcher2019differentiable}. In this work, we provide two decompositions of differential games to answer this question: the first as an exact scalar potential part, a near vector potential part, and a non-strategic part; the second as a near scalar potential part, an exact vector potential part, and a non-strategic part. We show that scalar potential games coincide with potential games proposed by \cite{monderer1996potential}, where the gradient descent dynamic can successfully find the Nash equilibrium. For the vector potential game, we show that the individual gradient field is divergence-free, in which case the gradient descent dynamic may either be divergent or recurrent.
- Abstract(参考訳): ディファレンシャルゲームにおける学習のダイナミクスの複雑さを理解するため、ゲームはダイナミックがよく理解されているコンポーネントに分解する。
可能なツールの1つはヘルムホルツの定理であり、これはベクトル場をポテンシャルと調和成分に分解することができる。
これは有限形式および正規形式ゲームにおいて有効であることが示されている。
しかし、ヘルムホルツの定理を$\mathbb{R}^n$(微分ゲームの戦略空間である)上のホッジの定理と接続することで適用することは、$\mathbb{R}^n$の非コンパクト性のために非自明である。
微分ゲームにおけるホッジ/ヘルモルツの定理によるダイナミック・ストラテジックな切断をブリッジすると、開問題 \cite{letcher2019differentiable} として残される。
本研究では、この問題に答えるために微分ゲーム分解を2つ提供し、第1は正確なスカラーポテンシャル部分、第2は近いベクトルポテンシャル部分、第2は近いスカラーポテンシャル部分、第2は正確なベクトルポテンシャル部分、第2は非ストラテジック部分である。
我々は、スカラーポテンシャルゲームは、勾配降下ダイナミクスがナッシュ平衡をうまく見つけることができるような \cite{monderer 1996potential} によって提案されたポテンシャルゲームと一致することを示す。
ベクトルポテンシャルゲームでは、個々の勾配場が発散しないことを示す。
関連論文リスト
- Exact dynamics of quantum dissipative $XX$ models: Wannier-Stark localization in the fragmented operator space [49.1574468325115]
振動と非振動崩壊を分離する臨界散逸強度において例外的な点が見つかる。
また、演算子部分空間全体の単一減衰モードにつながる異なるタイプの散逸についても記述する。
論文 参考訳(メタデータ) (2024-05-27T16:11:39Z) - A geometric decomposition of finite games: Convergence vs. recurrence under exponential weights [24.800126996235512]
ゲームは、ダイナミクスの長時間動作がよく理解されている単純なコンポーネントに分解する。
特に指数的/乗法的重み(EW)スキームの力学はヘルムホルツの定理のユークリッドアンダーピンニングとは相容れない。
我々は、よく知られたゲームの分解と、ポテンシャルおよび調和成分への深い関係を確立する。
論文 参考訳(メタデータ) (2024-05-12T08:58:35Z) - Tensor cumulants for statistical inference on invariant distributions [49.80012009682584]
我々は,PCAが信号の大きさの臨界値で計算的に困難になることを示す。
我々は、与えられた次数の不変量に対して明示的でほぼ直交的な基底を与える新しい対象の集合を定義する。
また、異なるアンサンブルを区別する新しい問題も分析できます。
論文 参考訳(メタデータ) (2024-04-29T14:33:24Z) - Optimistic Policy Gradient in Multi-Player Markov Games with a Single
Controller: Convergence Beyond the Minty Property [89.96815099996132]
単一コントローラを用いたマルチプレイヤーゲームにおいて,楽観的なポリシー勾配手法を特徴付ける新しいフレームワークを開発した。
我々のアプローチは、我々が導入する古典的なミニティの自然一般化に依存しており、マルコフゲームを超えてさらなる応用が期待できる。
論文 参考訳(メタデータ) (2023-12-19T11:34:10Z) - Scalable and Independent Learning of Nash Equilibrium Policies in
$n$-Player Stochastic Games with Unknown Independent Chains [1.0878040851638]
独立な連鎖と未知の遷移行列を持つゲームについて研究する。
このクラスのゲームでは、プレイヤーは他のプレイヤーの状態や行動に依存しない内部マルコフ連鎖を制御する。
我々は、$epsilon$-NEポリシーを学ぶために、完全に分散化されたミラー降下アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-04T03:04:09Z) - Local Convergence of Gradient Methods for Min-Max Games: Partial
Curvature Generically Suffices [0.5439020425819]
2つのプレイヤーゼロサム微分可能なゲームに対する勾配法の局所的ナッシュ平衡の収束について検討する。
偏曲のおかげで、円錐粒子法 -- 重みを最適化し、混合戦略をサポートする -- は、固定支持法よりも一般的に収束する。
論文 参考訳(メタデータ) (2023-05-26T21:43:56Z) - An Explicit Expansion of the Kullback-Leibler Divergence along its
Fisher-Rao Gradient Flow [8.052709336750823]
$pirhollback$が複数のモードを示すとき、$pirhollback$は、潜在的な関数とは無関係であることを示す。
私たちは$textKLの明示的な拡張を提供します。
KL。
KL。
KL。
KL。
KL。
KL。
KL。
KL。
KL。
KL。
KL。
KL。
論文 参考訳(メタデータ) (2023-02-23T18:47:54Z) - Global Nash Equilibrium in Non-convex Multi-player Game: Theory and
Algorithms [66.8634598612777]
ナッシュ均衡(NE)はマルチプレイヤーゲームにおいて全てのプレイヤーに受け入れられることを示す。
また、一般理論から一歩ずつ一方的に利益を得ることはできないことも示している。
論文 参考訳(メタデータ) (2023-01-19T11:36:50Z) - The Franke-Gorini-Kossakowski-Lindblad-Sudarshan (FGKLS) Equation for
Two-Dimensional Systems [62.997667081978825]
開量子系は、FGKLS(Franke-Gorini-Kossakowski-Lindblad-Sudarshan)方程式に従うことができる。
我々はヒルベルト空間次元が 2$ である場合を徹底的に研究する。
論文 参考訳(メタデータ) (2022-04-16T07:03:54Z) - The world as a neural network [0.0]
我々は、宇宙が最も基本的なレベルでニューラルネットワークである可能性について議論する。
我々は「訓練可能な」変数と「隠された」変数の2種類の動的自由度を識別する。
そのような系におけるエントロピー生成は、オンサーガー・ヒルベルト項の対称性の局所函数であると主張する。
論文 参考訳(メタデータ) (2020-08-04T17:10:46Z) - Accelerating Smooth Games by Manipulating Spectral Shapes [51.366219027745174]
滑らかなゲームにおけるアクセラレーションを特徴付けるために行列反復理論を用いる。
スペクトル形状の変換として, 勾配法, 指数勾配法について述べる。
バイリニアゲームに最適なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-02T19:21:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。