論文の概要: Second-Order Mirror Descent: Convergence in Games Beyond Averaging and
Discounting
- arxiv url: http://arxiv.org/abs/2111.09982v1
- Date: Thu, 18 Nov 2021 23:51:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-23 03:54:54.903620
- Title: Second-Order Mirror Descent: Convergence in Games Beyond Averaging and
Discounting
- Title(参考訳): 第2次ミラーダイス:ゲームにおける平均とカウント以上の収束性
- Authors: Bolin Gao, Lacra Pavel
- Abstract要約: MD2は, 若干の修正を加えて, 強いVSSへの収束率と指数的収束率を享受できることが示される。
離散時間MD2の収束保証を行い,内部VSSに対するノイズ観測を行った。
- 参考スコア(独自算出の注目度): 1.6752182911522522
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose a second-order extension of the continuous-time
game-theoretic mirror descent (MD) dynamics, referred to as MD2, which
converges to mere (but not necessarily strict) variationally stable states
(VSS) without using common auxiliary techniques such as averaging or
discounting. We show that MD2 enjoys no-regret as well as exponential rate of
convergence towards a strong VSS upon a slight modification. Furthermore, MD2
can be used to derive many novel primal-space dynamics. Lastly, using
stochastic approximation techniques, we provide a convergence guarantee of
discrete-time MD2 with noisy observations towards interior mere VSS. Selected
simulations are provided to illustrate our results.
- Abstract(参考訳): 本稿では、平均化や割引といった一般的な補助技術を用いることなく、単に(必ずしも厳密ではない)変分安定状態(VSS)に収束する連続時間ゲーム理論ミラー降下(MD2)ダイナミクスの2次拡張を提案する。
MD2は, 若干の修正を加えて, 強いVSSへの収束率と指数的収束率を享受できることを示す。
さらに、md2は多くの新しい原始空間ダイナミクスを導出するために使うことができる。
最後に,確率近似法を用いた離散時間md2の収束保証と,内部vssに対するノイズ観測について述べる。
結果を説明するために選択されたシミュレーションが提供される。
関連論文リスト
- Poisson-Gamma Dynamical Systems with Non-Stationary Transition Dynamics [54.19709905569658]
非定常PGDSは、基礎となる遷移行列が時間とともに進化できるように提案されている。
後続シミュレーションを行うために, 完全共役かつ効率的なギブスサンプリング装置を開発した。
実験により,提案した非定常PGDSは,関連するモデルと比較して予測性能が向上することを示した。
論文 参考訳(メタデータ) (2024-02-26T04:39:01Z) - Generative Modeling of Regular and Irregular Time Series Data via
Koopman VAEs [53.91784369229405]
モデルの新しい設計に基づく新しい生成フレームワークであるKoopman VAEを紹介する。
クープマン理論に触発され、線形写像を用いて潜在条件事前力学を表現する。
以上の結果から,KVAEは,合成および実世界の時系列生成ベンチマークにおいて,最先端のGAN法およびVAE法よりも優れていた。
論文 参考訳(メタデータ) (2023-10-04T07:14:43Z) - Meta-Learning Adversarial Bandit Algorithms [55.72892209124227]
我々は,バンディットフィードバックを用いたオンラインメタラーニングについて研究する。
我々は自己協和障壁正規化器を用いてオンラインミラー降下一般化(OMD)をチューニングすることを学ぶ。
論文 参考訳(メタデータ) (2023-07-05T13:52:10Z) - Neural Continuous-Discrete State Space Models for Irregularly-Sampled
Time Series [18.885471782270375]
NCDSSMは補助変数を用いて力学からの認識をアンタングルし、補助変数のみに償却推論を必要とする。
本稿では、潜在力学の3つのフレキシブルパラメータ化と、推論中の動的状態の辺りを生かした効率的な学習目標を提案する。
複数のベンチマークデータセットの実証結果は、既存のモデルよりもNCDSSMの計算性能と予測性能が改善されたことを示している。
論文 参考訳(メタデータ) (2023-01-26T18:45:04Z) - On the Convergence of No-Regret Learning Dynamics in Time-Varying Games [89.96815099996132]
時間変化ゲームにおける楽観的勾配降下(OGD)の収束を特徴付ける。
我々のフレームワークは、ゼロサムゲームにおけるOGDの平衡ギャップに対して鋭い収束境界をもたらす。
また,静的ゲームにおける動的後悔の保証に関する新たな洞察も提供する。
論文 参考訳(メタデータ) (2023-01-26T17:25:45Z) - Generative Time Series Forecasting with Diffusion, Denoise, and
Disentanglement [51.55157852647306]
時系列予測は多くのアプリケーションにおいて非常に重要な課題である。
実世界の時系列データが短時間に記録されることが一般的であり、これはディープモデルと限られたノイズのある時系列との間に大きなギャップをもたらす。
本稿では,生成モデルを用いた時系列予測問題に対処し,拡散,雑音,ゆがみを備えた双方向変分自動エンコーダを提案する。
論文 参考訳(メタデータ) (2023-01-08T12:20:46Z) - Gait Recognition in the Wild with Multi-hop Temporal Switch [81.35245014397759]
野生での歩行認識は、より実践的な問題であり、マルチメディアとコンピュータビジョンのコミュニティの注目を集めています。
本稿では,現実のシーンにおける歩行パターンの効果的な時間的モデリングを実現するために,新しいマルチホップ時間スイッチ方式を提案する。
論文 参考訳(メタデータ) (2022-09-01T10:46:09Z) - Robust Time Series Dissimilarity Measure for Outlier Detection and
Periodicity Detection [16.223509730658513]
本稿では,ノイズや外れ値の影響を低減するため,RobostDTWという新しい時系列差分尺度を提案する。
具体的には、ロバストDTWは、設計した時間グラフトレンドフィルタリングを利用して、トレンドを推定し、時間ワープを交互に最適化する。
実世界のデータセットを用いた実験では、外乱時系列検出と周期性検出の両方において、DTWの変種と比較してロバストDTWの優れた性能を示す。
論文 参考訳(メタデータ) (2022-06-07T00:49:16Z) - Deep Switching State Space Model (DS$^3$M) for Nonlinear Time Series
Forecasting with Regime Switching [3.3970049571884204]
本稿では,非線形時系列の効率的な推測と予測を行うための切替状態空間モデル(DS$3$M)を提案する。
レギュラー間のスイッチングは、離散変数と連続変数の両方によって、繰り返しニューラルネットワークによって捉えられる。
論文 参考訳(メタデータ) (2021-06-04T08:25:47Z) - On Centralized and Distributed Mirror Descent: Exponential Convergence
Analysis Using Quadratic Constraints [8.336315962271396]
ミラー降下(MD)は、勾配降下(GD)を含むいくつかのアルゴリズムを仮定する強力な一階最適化手法である。
本研究では,強い凸と滑らかな問題に対して,集中型および分散型のMDの正確な収束率について検討した。
論文 参考訳(メタデータ) (2021-05-29T23:05:56Z) - Online mirror descent and dual averaging: keeping pace in the dynamic
case [11.572321455920164]
オンラインミラー降下(OMD)と二重平均化(DA)は、オンライン凸最適化の基本的なアルゴリズムである。
我々はOMDアルゴリズムを安定化と呼ぶ単純な手法で修正する。
安定化とDAを持つOMDが、動的学習率の下でも、多くのアプリケーションで同じパフォーマンス保証を享受していることを示します。
論文 参考訳(メタデータ) (2020-06-03T23:41:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。