論文の概要: On Underdamped Nesterov's Acceleration
- arxiv url: http://arxiv.org/abs/2304.14642v1
- Date: Fri, 28 Apr 2023 06:08:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-01 15:05:38.350655
- Title: On Underdamped Nesterov's Acceleration
- Title(参考訳): ネステロフの加速に就て
- Authors: Shuo Chen, Bin Shi, Ya-xiang Yuan
- Abstract要約: ネステロフ加速勾配降下法のための高分解能微分方程式フレームワーク
- 参考スコア(独自算出の注目度): 6.53306151979817
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The high-resolution differential equation framework has been proven to be
tailor-made for Nesterov's accelerated gradient descent method~(\texttt{NAG})
and its proximal correspondence -- the class of faster iterative shrinkage
thresholding algorithms (FISTA). However, the systems of theories is not still
complete, since the underdamped case ($r < 2$) has not been included. In this
paper, based on the high-resolution differential equation framework, we
construct the new Lyapunov functions for the underdamped case, which is
motivated by the power of the time $t^{\gamma}$ or the iteration $k^{\gamma}$
in the mixed term. When the momentum parameter $r$ is $2$, the new Lyapunov
functions are identical to the previous ones. These new proofs do not only
include the convergence rate of the objective value previously obtained
according to the low-resolution differential equation framework but also
characterize the convergence rate of the minimal gradient norm square. All the
convergence rates obtained for the underdamped case are continuously dependent
on the parameter $r$. In addition, it is observed that the high-resolution
differential equation approximately simulates the convergence behavior
of~\texttt{NAG} for the critical case $r=-1$, while the low-resolution
differential equation degenerates to the conservative Newton's equation. The
high-resolution differential equation framework also theoretically
characterizes the convergence rates, which are consistent with that obtained
for the underdamped case with $r=-1$.
- Abstract(参考訳): 高分解能微分方程式フレームワークは、Nesterovの加速勾配降下法~(\texttt{NAG})とその近位対応 -- より高速な反復収縮しきい値アルゴリズム(FISTA)のクラスのために調整されたことが証明されている。
しかし、未成年の場合(r < 2$)は含まれていないため、理論体系はまだ完成していない。
本稿では,高分解能微分方程式の枠組みに基づいて,混合項における時間 $t^{\gamma}$ または反復 $k^{\gamma}$ のパワーを動機とする,弱減衰の場合の新しいリアプノフ関数を構築する。
運動量パラメータ $r$ が 2$ であるとき、新しいリャプノフ函数は以前のものと同じである。
劣化したケースで得られるすべての収束率は、パラメータ $r$ に継続的に依存する。
さらに、高分解能微分方程式は臨界の場合 $r=-1$ に対して~\texttt{NAG} の収束挙動を概ねシミュレートし、低分解能微分方程式は保守ニュートン方程式に退化する。
