Fugu-MT 論文翻訳(概要): Second-Order Mirror Descent: Convergence in Games Beyond Averaging and Discounting

論文の概要: Second-Order Mirror Descent: Convergence in Games Beyond Averaging and Discounting

arxiv url: http://arxiv.org/abs/2111.09982v1
Date: Thu, 18 Nov 2021 23:51:38 GMT
ステータス: 翻訳完了
システム内更新日: 2021-11-23 03:54:54.903620
Title: Second-Order Mirror Descent: Convergence in Games Beyond Averaging and Discounting
Title（参考訳）: 第2次ミラーダイス:ゲームにおける平均とカウント以上の収束性
Authors: Bolin Gao, Lacra Pavel
Abstract要約: MD2は, 若干の修正を加えて, 強いVSSへの収束率と指数的収束率を享受できることが示される。離散時間MD2の収束保証を行い,内部VSSに対するノイズ観測を行った。
参考スコア（独自算出の注目度）: 1.6752182911522522
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this paper, we propose a second-order extension of the continuous-time game-theoretic mirror descent (MD) dynamics, referred to as MD2, which converges to mere (but not necessarily strict) variationally stable states (VSS) without using common auxiliary techniques such as averaging or discounting. We show that MD2 enjoys no-regret as well as exponential rate of convergence towards a strong VSS upon a slight modification. Furthermore, MD2 can be used to derive many novel primal-space dynamics. Lastly, using stochastic approximation techniques, we provide a convergence guarantee of discrete-time MD2 with noisy observations towards interior mere VSS. Selected simulations are provided to illustrate our results.
Abstract（参考訳）: 本稿では、平均化や割引といった一般的な補助技術を用いることなく、単に(必ずしも厳密ではない)変分安定状態(VSS)に収束する連続時間ゲーム理論ミラー降下(MD2)ダイナミクスの2次拡張を提案する。 MD2は, 若干の修正を加えて, 強いVSSへの収束率と指数的収束率を享受できることを示す。さらに、md2は多くの新しい原始空間ダイナミクスを導出するために使うことができる。最後に,確率近似法を用いた離散時間md2の収束保証と,内部vssに対するノイズ観測について述べる。結果を説明するために選択されたシミュレーションが提供される。

関連論文リスト

FoSS: Modeling Long Range Dependencies and Multimodal Uncertainty in Trajectory Prediction via Fourier State Space Integration [21.39395366378851]
本稿では,周波数領域推論と線形時間列モデリングを融合した二分岐フレームワークFoSSを提案する。 Argoverse 1とArgoverse 2ベンチマークの実験では、FoSSが最先端の精度を実現し、22.5%、パラメータが40%以上削減された。
論文参考訳（メタデータ） (2026-03-01T21:38:59Z)
RI-Loss: A Learnable Residual-Informed Loss for Time Series Forecasting [13.117430904377905]
時系列予測は、過去のデータから将来の値を予測することに依存する。 MSEには2つの根本的な弱点がある:そのポイントワイドエラーは時間的関係を捉えるのに失敗し、データに固有のノイズを考慮しない。我々は,Hilbert-Schmidt Independence Criterion(HSIC)に基づく新たな目的関数であるResidual-Informed Loss(RI-Loss)を紹介する。
論文参考訳（メタデータ） (2025-11-13T09:36:00Z)
OneVAE: Joint Discrete and Continuous Optimization Helps Discrete Video VAE Train Better [75.24657690640525]
FSQは、他の量子化法と比較して、実効的に事前学習された連続VAE前処理を行えることを示す。トークン圧縮比を損なうことなくPSNR次元を約1倍改善するマルチトークン量子化機構を提案する。本稿では,この2つのパラダイムを統一した離散連続最適化手法を提案する。
論文参考訳（メタデータ） (2025-08-13T14:49:54Z)
FindRec: Stein-Guided Entropic Flow for Multi-Modal Sequential Recommendation [50.438552588818]
textbfFindRec (textbfFlexible unified textbfinformation textbfdisentanglement for multi-modal sequence textbfRecommendation)を提案する。 Stein kernel-based Integrated Information Coordination Module (IICM) は理論上、マルチモーダル特徴とIDストリーム間の分散一貫性を保証する。マルチモーダル特徴を文脈的関連性に基づいて適応的にフィルタリング・結合するクロスモーダル・エキスパート・ルーティング機構。
論文参考訳（メタデータ） (2025-07-07T04:09:45Z)
Sequential-Parallel Duality in Prefix Scannable Models [68.39855814099997]
近年では Gated Linear Attention (GLA) や Mamba など様々なモデルが開発されている。ニアコンスタント時間並列評価と線形時間、定数空間シーケンシャル推論をサポートするニューラルネットワークモデルの全クラスを特徴付けることができるだろうか?
論文参考訳（メタデータ） (2025-06-12T17:32:02Z)
On Separation Between Best-Iterate, Random-Iterate, and Last-Iterate Convergence of Learning in Games [71.73971094342349]
ゲームにおける学習力学の非エルゴード収束は、理論と実践の両方において重要であるため、広く研究されている。近年の研究では、最適乗算重み更新を含む学習力学の幅広いクラスが、任意に遅い最終項目収束を示すことが示されている。 OMWUは、同じクラスのゲームにおいて、その遅い最終点収束とは対照的に、$O(T-1/6)$est-iterate convergence rateを達成することを示す。
論文参考訳（メタデータ） (2025-03-04T17:49:24Z)
Lightweight Channel-wise Dynamic Fusion Model: Non-stationary Time Series Forecasting via Entropy Analysis [25.291749176117662]
我々は、分散が時系列の非定常性に対する有効かつ解釈可能なプロキシであることを示す。軽量なtextitChannel-wise textitDynamic textitFusion textitModel(textitCDFM)を提案する。 7つの時系列データセットに関する総合的な実験は、CDFMの優位性と一般化能力を示している。
論文参考訳（メタデータ） (2025-03-04T13:29:42Z)
DeSiRe-GS: 4D Street Gaussians for Static-Dynamic Decomposition and Surface Reconstruction for Urban Driving Scenes [71.61083731844282]
本稿では,自己教師型ガウススプラッティング表現であるDeSiRe-GSについて述べる。複雑な駆動シナリオにおいて、効率的な静的・動的分解と高忠実な表面再構成を可能にする。
論文参考訳（メタデータ） (2024-11-18T05:49:16Z)
Mutual Learning for Acoustic Matching and Dereverberation via Visual Scene-driven Diffusion [93.32354378820648]
本稿では拡散モデルに基づく相互学習フレームワークMVSDを紹介する。 MVSDは2つのタスクを対称的に考慮し、逆タスクからの学習を容易にするために相互関係を利用する。我々のフレームワークは、残響器と残響器の性能を向上させることができる。
論文参考訳（メタデータ） (2024-07-15T00:47:56Z)
Non-Adversarial Learning: Vector-Quantized Common Latent Space for Multi-Sequence MRI [15.4894593374853]
本稿では,各列の離散表現を圧縮し,列間の共通潜在空間のガウス分布を推定する生成モデルを提案する。 BraTS2021データセットを用いた実験では、我々の非敵モデルは他のGANベースの手法よりも優れていた。
論文参考訳（メタデータ） (2024-07-03T08:37:01Z)
Chimera: Effectively Modeling Multivariate Time Series with 2-Dimensional State Space Models [5.37935922811333]
State Space Models (SSM) は、一変量時系列モデリングのための古典的なアプローチである。本稿では、2つの入力依存型2次元SSMヘッドと異なる離散化プロセスを用いて長期進行と季節パターンを学習するチメラについて述べる。実験により,広範囲で多様なベンチマークにおいて,Chimeraの優れた性能を示す。
論文参考訳（メタデータ） (2024-06-06T17:58:09Z)
A Poisson-Gamma Dynamic Factor Model with Time-Varying Transition Dynamics [51.147876395589925]
非定常PGDSは、基礎となる遷移行列が時間とともに進化できるように提案されている。後続シミュレーションを行うために, 完全共役かつ効率的なギブスサンプリング装置を開発した。実験により,提案した非定常PGDSは,関連するモデルと比較して予測性能が向上することを示した。
論文参考訳（メタデータ） (2024-02-26T04:39:01Z)
Meta-Learning Adversarial Bandit Algorithms [55.72892209124227]
我々は,バンディットフィードバックを用いたオンラインメタラーニングについて研究する。我々は自己協和障壁正規化器を用いてオンラインミラー降下一般化(OMD)をチューニングすることを学ぶ。
論文参考訳（メタデータ） (2023-07-05T13:52:10Z)
On the Convergence of No-Regret Learning Dynamics in Time-Varying Games [89.96815099996132]
時間変化ゲームにおける楽観的勾配降下(OGD)の収束を特徴付ける。我々のフレームワークは、ゼロサムゲームにおけるOGDの平衡ギャップに対して鋭い収束境界をもたらす。また,静的ゲームにおける動的後悔の保証に関する新たな洞察も提供する。
論文参考訳（メタデータ） (2023-01-26T17:25:45Z)
Generative Time Series Forecasting with Diffusion, Denoise, and Disentanglement [51.55157852647306]
時系列予測は多くのアプリケーションにおいて非常に重要な課題である。実世界の時系列データが短時間に記録されることが一般的であり、これはディープモデルと限られたノイズのある時系列との間に大きなギャップをもたらす。本稿では,生成モデルを用いた時系列予測問題に対処し,拡散,雑音,ゆがみを備えた双方向変分自動エンコーダを提案する。
論文参考訳（メタデータ） (2023-01-08T12:20:46Z)
Deep Switching State Space Model (DS$^3$M) for Nonlinear Time Series Forecasting with Regime Switching [3.3970049571884204]
本稿では,非線形時系列の効率的な推測と予測を行うための切替状態空間モデル(DS$3$M)を提案する。レギュラー間のスイッチングは、離散変数と連続変数の両方によって、繰り返しニューラルネットワークによって捉えられる。
論文参考訳（メタデータ） (2021-06-04T08:25:47Z)
On Centralized and Distributed Mirror Descent: Exponential Convergence Analysis Using Quadratic Constraints [8.336315962271396]
ミラー降下(MD)は、勾配降下(GD)を含むいくつかのアルゴリズムを仮定する強力な一階最適化手法である。本研究では,強い凸と滑らかな問題に対して,集中型および分散型のMDの正確な収束率について検討した。
論文参考訳（メタデータ） (2021-05-29T23:05:56Z)
Online mirror descent and dual averaging: keeping pace in the dynamic case [11.572321455920164]
オンラインミラー降下(OMD)と二重平均化(DA)は、オンライン凸最適化の基本的なアルゴリズムである。我々はOMDアルゴリズムを安定化と呼ぶ単純な手法で修正する。安定化とDAを持つOMDが、動的学習率の下でも、多くのアプリケーションで同じパフォーマンス保証を享受していることを示します。
論文参考訳（メタデータ） (2020-06-03T23:41:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。