論文の概要: A Proximal Modified Quasi-Newton Method for Nonsmooth Regularized Optimization
- arxiv url: http://arxiv.org/abs/2409.19428v1
- Date: Sat, 28 Sep 2024 18:16:32 GMT
- Title: A Proximal Modified Quasi-Newton Method for Nonsmooth Regularized Optimization
- Title(参考訳): 非平滑正規化最適化のための近修正準ニュートン法
- Authors: Youssef Diouane, Mohamed Laghdaf Habiboullah, Dominique Orban,
- Abstract要約: Lipschitz-of-$nabla f$
$nabla f$.
- 参考スコア(独自算出の注目度): 0.7373617024876725
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We develop R2N, a modified quasi-Newton method for minimizing the sum of a $\mathcal{C}^1$ function $f$ and a lower semi-continuous prox-bounded $h$. Both $f$ and $h$ may be nonconvex. At each iteration, our method computes a step by minimizing the sum of a quadratic model of $f$, a model of $h$, and an adaptive quadratic regularization term. A step may be computed by a variant of the proximal-gradient method. An advantage of R2N over trust-region (TR) methods is that proximal operators do not involve an extra TR indicator. We also develop the variant R2DH, in which the model Hessian is diagonal, which allows us to compute a step without relying on a subproblem solver when $h$ is separable. R2DH can be used as standalone solver, but also as subproblem solver inside R2N. We describe non-monotone variants of both R2N and R2DH. Global convergence of a first-order stationarity measure to zero holds without relying on local Lipschitz continuity of $\nabla f$, while allowing model Hessians to grow unbounded, an assumption particularly relevant to quasi-Newton models. Under Lipschitz-continuity of $\nabla f$, we establish a tight worst-case complexity bound of $O(1 / \epsilon^{2/(1 - p)})$ to bring said measure below $\epsilon > 0$, where $0 \leq p < 1$ controls the growth of model Hessians. The latter must not diverge faster than $|\mathcal{S}_k|^p$, where $\mathcal{S}_k$ is the set of successful iterations up to iteration $k$. When $p = 1$, we establish the tight exponential complexity bound $O(\exp(c \epsilon^{-2}))$ where $c > 0$ is a constant. We describe our Julia implementation and report numerical experience on a basis-pursuit problem, image denoising, minimum-rank matrix completion, and a nonlinear support vector machine. In particular, the minimum-rank problem cannot be solved directly at this time by a TR approach as corresponding proximal operators are not known analytically.
- Abstract(参考訳): 我々は、$\mathcal{C}^1$ function $f$と下半連続なprox-bounded $h$の和を最小化する修正準ニュートン法であるR2Nを開発する。
f$ と $h$ はともに非凸である。
また、モデル Hessian が対角線となる変種 R2DH も開発しており、h$ が分離可能なとき、サブプロブレムソルバに頼ることなくステップを計算することができる。
一階定常度測度の零点への大域収束は、局所的なリプシッツ連続性$\nabla f$に依存しないが、モデルヘッセンが非有界に成長することを可能にし、これは準ニュートンモデルに特に関係している仮定である。
例えば、$\nabla f$ のリプシッツ連続性の下では、$O(1 / \epsilon^{2/(1 - p)})$ という厳密な最悪ケースの複雑さを確立して、その測度を $\epsilon > 0$ 以下にする。
後者は $|\mathcal{S}_k|^p$ よりも早く分岐してはいけない。
p = 1$ のとき、厳密な指数複雑性を$O(\exp(c \epsilon^{-2}))$ とすると、$c > 0$ は定数である。
提案するJuliaの実装について述べるとともに, 基本探索問題, 画像復調, 最小ランク行列補完, 非線形支持ベクトルマシンに関する数値経験を報告する。
