論文の概要: Improved Global Guarantees for the Nonconvex Burer--Monteiro
Factorization via Rank Overparameterization
- arxiv url: http://arxiv.org/abs/2207.01789v1
- Date: Tue, 5 Jul 2022 03:18:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-06 14:27:46.778627
- Title: Improved Global Guarantees for the Nonconvex Burer--Monteiro
Factorization via Rank Overparameterization
- Title(参考訳): ランクオーバーパラメータ化による非凸バーラー・モンティロ因子分解のグローバル保証の改善
- Authors: Richard Y. Zhang
- Abstract要約: 二つの微分可能な$L$-smooth,$$$-strongly convex objective $phistarntimes n$ n$Mcceqsueq を考える。
- 参考スコア(独自算出の注目度): 12.589519278962378
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider minimizing a twice-differentiable, $L$-smooth, and $\mu$-strongly
convex objective $\phi$ over an $n\times n$ positive semidefinite matrix
$M\succeq0$, under the assumption that the minimizer $M^{\star}$ has low rank
$r^{\star}\ll n$. Following the Burer--Monteiro approach, we instead minimize
the nonconvex objective $f(X)=\phi(XX^{T})$ over a factor matrix $X$ of size
$n\times r$. This substantially reduces the number of variables from $O(n^{2})$
to as few as $O(n)$ and also enforces positive semidefiniteness for free, but
at the cost of giving up the convexity of the original problem. In this paper,
we prove that if the search rank $r\ge r^{\star}$ is overparameterized by a
constant factor with respect to the true rank $r^{\star}$, namely as in
$r>\frac{1}{4}(L/\mu-1)^{2}r^{\star}$, then despite nonconvexity, local
optimization is guaranteed to globally converge from any initial point to the
global optimum. This significantly improves upon a previous rank
overparameterization threshold of $r\ge n$, which is known to be sharp if
$\phi$ is allowed to be nonsmooth and/or non-strongly convex, but would
increase the number of variables back up to $O(n^{2})$. Conversely, without
rank overparameterization, we prove that such a global guarantee is possible if
and only if $\phi$ is almost perfectly conditioned, with a condition number of
$L/\mu<3$. Therefore, we conclude that a small amount of overparameterization
can lead to large improvements in theoretical guarantees for the nonconvex
Burer--Monteiro factorization.
- Abstract(参考訳): 我々は、最小値 $m^{\star}$ が低ランク $r^{\star}\ll n$ を持つという仮定の下で、2つの微分可能で、l$-smooth と $\mu$-strongly convex objective $\phi$ over an $n\times n$ positive semidefinite matrix $m\succeq0$ を最小化することを検討している。
burer-monteiro のアプローチに従い、代わりに、係数行列 $x$ of size $n\times r$ 上の非凸目的 $f(x)=\phi(xx^{t})$ を最小化する。
本稿では、サーチランク $r\ge r^{\star}$ が真のランク $r^{\star}$ に関する定数因子によって過度にパラメータ化されていること、すなわち $r>\frac{1}{4}(L/\mu-1)^{2}r^{\star}$ とすると、非凸性にもかかわらず、局所最適化は、任意の初期点から大域最適点へのグローバル収束を保証する。
これは以前のランクオーバーパラメータのしきい値である $r\ge n$ を大幅に改善するが、$\phi$ が非スムースかつ/または非強凸であることが許されている場合、変数の数は$o(n^{2})$ まで増加する。
逆に、ランク超パラメータ化がなければ、そのような大域的保証が可能であることは、$\phi$ がほぼ完全に条件付きで、条件番号が $l/\mu<3$ である場合に限る。
- Efficient Continual Finite-Sum Minimization [52.5238287567572]
連続有限サム最小化(continuous finite-sum minimization)と呼ばれる有限サム最小化の鍵となるツイストを提案する。
我々のアプローチは$mathcalO(n/epsilon)$ FOs that $mathrmStochasticGradientDescent$で大幅に改善されます。
また、$mathcalOleft(n/epsilonalpharight)$ complexity gradient for $alpha 1/4$という自然な一階法は存在しないことを証明し、この方法の第一階法がほぼ密であることを示す。
論文 参考訳(メタデータ) (2024-06-07T08:26:31Z) - Convergence of Gradient Descent with Small Initialization for
Unregularized Matrix Completion [21.846732043706318]
論文 参考訳(メタデータ) (2024-02-09T19:39:23Z) - On the $O(\frac{\sqrt{d}}{T^{1/4}})$ Convergence Rate of RMSProp and Its Momentum Extension Measured by $\ell_1$ Norm [59.65871549878937]
論文 参考訳(メタデータ) (2024-02-01T07:21:32Z) - A note on $L^1$-Convergence of the Empiric Minimizer for unbounded
functions with fast growth [0.0]
V : mathbbRd to mathbbR$ coercive に対して、経験的最小値の$L1$-distance の収束率について検討する。
一般に、高速な成長を持つ非有界函数に対しては、収束率は上述の$a_n n-1/q$で制限され、$q$は潜在確率変数の次元である。
論文 参考訳(メタデータ) (2023-03-08T08:46:13Z) - On the Complexity of Decentralized Smooth Nonconvex Finite-Sum Optimization [21.334985032433778]
分散最適化問題 $min_bf xinmathbb Rd f(bf x)triq frac1msum_i=1m f_i(bf x)triq frac1nsum_j=1n。
論文 参考訳(メタデータ) (2022-10-25T11:37:11Z) - Preconditioned Gradient Descent for Overparameterized Nonconvex
Burer--Monteiro Factorization with Global Optimality Certification [14.674494335647841]
非函数 $f(X)=phi(XXT)$ を$ntimes r$ factor matrix $X$ で最小化するために勾配降下を考える。
論文 参考訳(メタデータ) (2022-06-07T14:26:49Z) - Low-Rank Approximation with $1/\epsilon^{1/3}$ Matrix-Vector Products [58.05771390012827]
我々の主な成果は、$tildeO(k/sqrtepsilon)$ matrix-vector productのみを使用するアルゴリズムである。
論文 参考訳(メタデータ) (2022-02-10T16:10:41Z) - Active Sampling for Linear Regression Beyond the $\ell_2$ Norm [70.49273459706546]
また、損失関数に対して最初の全感度上界$O(dmax1,p/2log2 n)$を提供し、最大で$p$成長する。
論文 参考訳(メタデータ) (2021-11-09T00:20:01Z) - Convergence Rate of the (1+1)-Evolution Strategy with Success-Based
Step-Size Adaptation on Convex Quadratic Functions [20.666734673282498]
1+1)-ES の収束速度は、一般凸二次函数上で明示的に厳密に導かれる。
論文 参考訳(メタデータ) (2021-03-02T09:03:44Z) - Private Stochastic Convex Optimization: Optimal Rates in $\ell_1$
Geometry [69.24618367447101]
対数要因まで $(varepsilon,delta)$-differently private の最適過剰人口損失は $sqrtlog(d)/n + sqrtd/varepsilon n.$ です。
損失関数がさらなる滑らかさの仮定を満たすとき、余剰損失は$sqrtlog(d)/n + (log(d)/varepsilon n)2/3で上界(対数因子まで)であることが示される。
論文 参考訳(メタデータ) (2021-03-02T06:53:44Z) - Curse of Dimensionality on Randomized Smoothing for Certifiable
Robustness [151.67113334248464]
論文 参考訳(メタデータ) (2020-02-08T22:02:14Z)