論文の概要: An Equivalence Between Static and Dynamic Regret Minimization
- arxiv url: http://arxiv.org/abs/2406.01577v1
- Date: Mon, 3 Jun 2024 17:54:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-05 21:41:25.452485
- Title: An Equivalence Between Static and Dynamic Regret Minimization
- Title(参考訳): 静的レジスト最小化と動的レジスト最小化の等価性
- Authors: Andrew Jacobsen, Francesco Orabona,
- Abstract要約: 本研究では, 動的後悔最小化は, 拡張決定空間における静的後悔最小化と等価であることを示す。
R_T(u_1,dots,u_T)le tilde Oという形の動的後悔を保証するアルゴリズムを提供する。
- 参考スコア(独自算出の注目度): 10.812831455376218
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the problem of dynamic regret minimization in online convex optimization, in which the objective is to minimize the difference between the cumulative loss of an algorithm and that of an arbitrary sequence of comparators. While the literature on this topic is very rich, a unifying framework for the analysis and design of these algorithms is still missing. In this paper, \emph{we show that dynamic regret minimization is equivalent to static regret minimization in an extended decision space}. Using this simple observation, we show that there is a frontier of lower bounds trading off penalties due to the variance of the losses and penalties due to variability of the comparator sequence, and provide a framework for achieving any of the guarantees along this frontier. As a result, we prove for the first time that adapting to the squared path-length of an arbitrary sequence of comparators to achieve regret $R_{T}(u_{1},\dots,u_{T})\le O(\sqrt{T\sum_{t} \|u_{t}-u_{t+1}\|^{2}})$ is impossible. However, we prove that it is possible to adapt to a new notion of variability based on the locally-smoothed squared path-length of the comparator sequence, and provide an algorithm guaranteeing dynamic regret of the form $R_{T}(u_{1},\dots,u_{T})\le \tilde O(\sqrt{T\sum_{i}\|\bar u_{i}-\bar u_{i+1}\|^{2}})$. Up to polylogarithmic terms, the new notion of variability is never worse than the classic one involving the path-length.
- Abstract(参考訳): オンライン凸最適化における動的後悔の最小化の問題は,アルゴリズムの累積損失と任意のコンパレータ列との差を最小化することを目的としている。
本稿では, 動的後悔最小化は拡張決定空間における静的後悔最小化と同値であることを示す。
その結果、任意のコンパレータ列の正方形パス長に適応して、後悔する$R_{T}(u_{1},\dots,u_{T})\le O(\sqrt{T\sum_{t} \|u_{t}-u_{t+1}\|^{2}})$が成立することを初めて証明した。
しかし、コンパレータ列の局所滑らかな2乗経路長に基づく新しい変数の概念に適応できることを証明し、$R_{T}(u_{1},\dots,u_{T})\le \tilde O(\sqrt{T\sum_{i}\|\bar u_{i}-\bar u_{i+1}\|^{2}})$という形の動的後悔を保証するアルゴリズムを提供する。
- Nearly Minimax Optimal Regret for Learning Linear Mixture Stochastic
Shortest Path [80.60592344361073]
論文 参考訳(メタデータ) (2024-02-14T07:52:00Z) - Efficient Frameworks for Generalized Low-Rank Matrix Bandit Problems [61.85150061213987]
一般化線形モデル (GLM) フレームワークを用いて, citelu2021low で提案した一般化低ランク行列帯域問題について検討する。
G-ESTT は $tildeO(sqrt(d_1+d_2)3/2Mr3/2T)$ bound of regret を達成でき、G-ESTS は $tildeO を達成できることを示す。
論文 参考訳(メタデータ) (2024-01-14T14:14:19Z) - Non-stationary Online Convex Optimization with Arbitrary Delays [50.46856739179311]
まず, 遅延勾配の勾配降下ステップを, 到着順に応じて行う単純なアルゴリズム, DOGDを提案する。
論文 参考訳(メタデータ) (2023-05-20T07:54:07Z) - Unconstrained Dynamic Regret via Sparse Coding [46.85145189210752]
本稿では, スパースコーディングフレームワークを用いて, 適応的再帰境界を新たに実現した。
論文 参考訳(メタデータ) (2023-01-31T00:52:14Z) - Adaptivity and Non-stationarity: Problem-dependent Dynamic Regret for Online Convex Optimization [70.4342220499858]
この結果が本質的な難易度に適応しているのは, 既往の結果よりも厳密であり, 最悪の場合, 同一レートの保護が可能であるからである。
論文 参考訳(メタデータ) (2021-12-29T02:42:59Z) - Optimal and Efficient Dynamic Regret Algorithms for Non-Stationary
Dueling Bandits [27.279654173896372]
我々は,非定常的あるいは時間的に異なる選好の下で,$K$のDueling Banditsにおける空力的後悔の最小化問題について検討した。
論文 参考訳(メタデータ) (2021-11-06T16:46:55Z) - Regret and Cumulative Constraint Violation Analysis for Online Convex
Optimization with Long Term Constraints [24.97580261894342]
論文 参考訳(メタデータ) (2021-06-09T15:18:06Z) - Dynamic Regret of Convex and Smooth Functions [93.71361250701075]
本研究では, 滑らかさを活かして, 動的後悔をさらに高めることが可能であることを示す。
論文 参考訳(メタデータ) (2020-07-07T14:10:57Z)