論文の概要: A fast and simple modification of Newton's method helping to avoid
saddle points
- arxiv url: http://arxiv.org/abs/2006.01512v4
- Date: Thu, 9 Sep 2021 14:26:11 GMT
- Title: A fast and simple modification of Newton's method helping to avoid
saddle points
- Title(参考訳): サドル点の回避を支援するニュートン法の高速かつ簡便な修正
- Authors: Tuyen Trung Truong, Tat Dat To, Tuan Hang Nguyen, Thu Hang Nguyen,
Hoang Phuong Nguyen, Maged Helmy
- Abstract要約: この論文は、$f$が$C3$でシーケンス$x_n$であれば、極限点は臨界点であり、サドル点ではなく、収束速度はニュートンの方法と同じである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose in this paper New Q-Newton's method. The update rule is very
simple conceptually, for example $x_{n+1}=x_n-w_n$ where
$w_n=pr_{A_n,+}(v_n)-pr_{A_n,-}(v_n)$, with $A_n=\nabla ^2f(x_n)+\delta
_n||\nabla f(x_n)||^2.Id$ and $v_n=A_n^{-1}.\nabla f(x_n)$. Here $\delta _n$ is
an appropriate real number so that $A_n$ is invertible, and $pr_{A_n,\pm}$ are
projections to the vector subspaces generated by eigenvectors of positive
(correspondingly negative) eigenvalues of $A_n$.
The main result of this paper roughly says that if $f$ is $C^3$ (can be
unbounded from below) and a sequence $\{x_n\}$, constructed by the New
Q-Newton's method from a random initial point $x_0$, {\bf converges}, then the
limit point is a critical point and is not a saddle point, and the convergence
rate is the same as that of Newton's method. The first author has recently been
successful incorporating Backtracking line search to New Q-Newton's method,
thus resolving the convergence guarantee issue observed for some (non-smooth)
cost functions. An application to quickly finding zeros of a univariate
meromorphic function will be discussed. Various experiments are performed,
against well known algorithms such as BFGS and Adaptive Cubic Regularization
are presented.
- Abstract(参考訳): 本稿では,新しいQ-Newton法を提案する。
例えば、$w_n=pr_{a_n,+}(v_n)-pr_{a_n,-}(v_n)$、$a_n=\nabla ^2f(x_n)+\delta _n||\nabla f(x_n)||^2.id$、$v_n=a_n^{-1}である。
f(x_n)$ である。
ここで、$\delta _n$ は、$a_n$ が可逆であるような適切な実数であり、$pr_{a_n,\pm}$ は、正(対応する負)固有値 $a_n$ の固有ベクトル部分空間の射影である。
この論文の主な結果は、もし$f$ が$c^3$(下からアンバウンドできる)で、ランダムな初期点 $x_0$, {\bf converges} から新しい q-ニュートン法によって構築されたシーケンス $\{x_n\}$ であるなら、極限点は臨界点であり、鞍点ではなく、収束率はニュートン法と同じである。
最初の著者は、最近 New Q-Newton の手法に Backtracking line search を組み込むことで、いくつかの(滑らかでない)コスト関数で観測される収束保証問題の解決に成功した。
BFGSやAdaptive Cubic Regularizationといったよく知られたアルゴリズムに対して、様々な実験が行われている。
