Fugu-MT 論文翻訳(概要): Second-Order Mirror Descent: Convergence in Games Beyond Averaging and Discounting

論文の概要: Second-Order Mirror Descent: Convergence in Games Beyond Averaging and Discounting

arxiv url: http://arxiv.org/abs/2111.09982v4
Date: Fri, 30 Jun 2023 20:18:52 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-04 16:26:04.740964
Title: Second-Order Mirror Descent: Convergence in Games Beyond Averaging and Discounting
Title（参考訳）: 第2次ミラーダイス:ゲームにおける平均とカウント以上の収束性
Authors: Bolin Gao, Lacra Pavel
Abstract要約: MD2は, 若干の修正を加えて, 強いVSSへの収束率を指数的に向上させるとともに, 自由度を保っていることを示す。 MD2は、多くの新しい連続時間原始空間力学を導出するためにも用いられる。
参考スコア（独自算出の注目度）: 1.2183405753834562
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: In this paper, we propose a second-order extension of the continuous-time game-theoretic mirror descent (MD) dynamics, referred to as MD2, which provably converges to mere (but not necessarily strict) variationally stable states (VSS) without using common auxiliary techniques such as time-averaging or discounting. We show that MD2 enjoys no-regret as well as an exponential rate of convergence towards strong VSS upon a slight modification. MD2 can also be used to derive many novel continuous-time primal-space dynamics. We then use stochastic approximation techniques to provide a convergence guarantee of discrete-time MD2 with noisy observations towards interior mere VSS. Selected simulations are provided to illustrate our results.
Abstract（参考訳）: 本稿では,連続時間ゲーム理論ミラー降下(mdd)ダイナミクスの2次拡張法を提案する。md2は時間平均やディスカウントといった一般的な補助技術を用いずに,単に(必ずしも厳密ではないが)変分安定状態(vss)に収束する。 MD2 は, 若干の修正を加えて, 強い VSS への収束率と指数関数的収束率を満足することを示す。 md2は、多くの新しい連続時間原始空間ダイナミクスを導出するためにも用いられる。次に,確率近似法を用いて離散時間MD2の収束保証を行い,内部VSSに対するノイズ観測を行った。結果を説明するために選択されたシミュレーションが提供される。

関連論文リスト

On Separation Between Best-Iterate, Random-Iterate, and Last-Iterate Convergence of Learning in Games [71.73971094342349]
ゲームにおける学習力学の非エルゴード収束は、理論と実践の両方において重要であるため、広く研究されている。近年の研究では、最適乗算重み更新を含む学習力学の幅広いクラスが、任意に遅い最終項目収束を示すことが示されている。 OMWUは、同じクラスのゲームにおいて、その遅い最終点収束とは対照的に、$O(T-1/6)$est-iterate convergence rateを達成することを示す。
論文参考訳（メタデータ） (2025-03-04T17:49:24Z)
Lightweight Channel-wise Dynamic Fusion Model: Non-stationary Time Series Forecasting via Entropy Analysis [25.291749176117662]
我々は、分散が時系列の非定常性に対する有効かつ解釈可能なプロキシであることを示す。軽量なtextitChannel-wise textitDynamic textitFusion textitModel(textitCDFM)を提案する。 7つの時系列データセットに関する総合的な実験は、CDFMの優位性と一般化能力を示している。
論文参考訳（メタデータ） (2025-03-04T13:29:42Z)
DeSiRe-GS: 4D Street Gaussians for Static-Dynamic Decomposition and Surface Reconstruction for Urban Driving Scenes [71.61083731844282]
本稿では,自己教師型ガウススプラッティング表現であるDeSiRe-GSについて述べる。複雑な駆動シナリオにおいて、効率的な静的・動的分解と高忠実な表面再構成を可能にする。
論文参考訳（メタデータ） (2024-11-18T05:49:16Z)
Mutual Learning for Acoustic Matching and Dereverberation via Visual Scene-driven Diffusion [93.32354378820648]
本稿では拡散モデルに基づく相互学習フレームワークMVSDを紹介する。 MVSDは2つのタスクを対称的に考慮し、逆タスクからの学習を容易にするために相互関係を利用する。我々のフレームワークは、残響器と残響器の性能を向上させることができる。
論文参考訳（メタデータ） (2024-07-15T00:47:56Z)
Non-Adversarial Learning: Vector-Quantized Common Latent Space for Multi-Sequence MRI [15.4894593374853]
本稿では,各列の離散表現を圧縮し,列間の共通潜在空間のガウス分布を推定する生成モデルを提案する。 BraTS2021データセットを用いた実験では、我々の非敵モデルは他のGANベースの手法よりも優れていた。
論文参考訳（メタデータ） (2024-07-03T08:37:01Z)
Chimera: Effectively Modeling Multivariate Time Series with 2-Dimensional State Space Models [5.37935922811333]
State Space Models (SSM) は、一変量時系列モデリングのための古典的なアプローチである。本稿では、2つの入力依存型2次元SSMヘッドと異なる離散化プロセスを用いて長期進行と季節パターンを学習するチメラについて述べる。実験により,広範囲で多様なベンチマークにおいて,Chimeraの優れた性能を示す。
論文参考訳（メタデータ） (2024-06-06T17:58:09Z)
A Poisson-Gamma Dynamic Factor Model with Time-Varying Transition Dynamics [51.147876395589925]
非定常PGDSは、基礎となる遷移行列が時間とともに進化できるように提案されている。後続シミュレーションを行うために, 完全共役かつ効率的なギブスサンプリング装置を開発した。実験により,提案した非定常PGDSは,関連するモデルと比較して予測性能が向上することを示した。
論文参考訳（メタデータ） (2024-02-26T04:39:01Z)
Meta-Learning Adversarial Bandit Algorithms [55.72892209124227]
我々は,バンディットフィードバックを用いたオンラインメタラーニングについて研究する。我々は自己協和障壁正規化器を用いてオンラインミラー降下一般化(OMD)をチューニングすることを学ぶ。
論文参考訳（メタデータ） (2023-07-05T13:52:10Z)
On the Convergence of No-Regret Learning Dynamics in Time-Varying Games [89.96815099996132]
時間変化ゲームにおける楽観的勾配降下(OGD)の収束を特徴付ける。我々のフレームワークは、ゼロサムゲームにおけるOGDの平衡ギャップに対して鋭い収束境界をもたらす。また,静的ゲームにおける動的後悔の保証に関する新たな洞察も提供する。
論文参考訳（メタデータ） (2023-01-26T17:25:45Z)
Generative Time Series Forecasting with Diffusion, Denoise, and Disentanglement [51.55157852647306]
時系列予測は多くのアプリケーションにおいて非常に重要な課題である。実世界の時系列データが短時間に記録されることが一般的であり、これはディープモデルと限られたノイズのある時系列との間に大きなギャップをもたらす。本稿では,生成モデルを用いた時系列予測問題に対処し,拡散,雑音,ゆがみを備えた双方向変分自動エンコーダを提案する。
論文参考訳（メタデータ） (2023-01-08T12:20:46Z)
Deep Switching State Space Model (DS$^3$M) for Nonlinear Time Series Forecasting with Regime Switching [3.3970049571884204]
本稿では,非線形時系列の効率的な推測と予測を行うための切替状態空間モデル(DS$3$M)を提案する。レギュラー間のスイッチングは、離散変数と連続変数の両方によって、繰り返しニューラルネットワークによって捉えられる。
論文参考訳（メタデータ） (2021-06-04T08:25:47Z)
On Centralized and Distributed Mirror Descent: Exponential Convergence Analysis Using Quadratic Constraints [8.336315962271396]
ミラー降下(MD)は、勾配降下(GD)を含むいくつかのアルゴリズムを仮定する強力な一階最適化手法である。本研究では,強い凸と滑らかな問題に対して,集中型および分散型のMDの正確な収束率について検討した。
論文参考訳（メタデータ） (2021-05-29T23:05:56Z)
Online mirror descent and dual averaging: keeping pace in the dynamic case [11.572321455920164]
オンラインミラー降下(OMD)と二重平均化(DA)は、オンライン凸最適化の基本的なアルゴリズムである。我々はOMDアルゴリズムを安定化と呼ぶ単純な手法で修正する。安定化とDAを持つOMDが、動的学習率の下でも、多くのアプリケーションで同じパフォーマンス保証を享受していることを示します。
論文参考訳（メタデータ） (2020-06-03T23:41:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。