論文の概要: Variance Reduction via Primal-Dual Accelerated Dual Averaging for
Nonsmooth Convex Finite-Sums
- arxiv url: http://arxiv.org/abs/2102.13643v1
- Date: Fri, 26 Feb 2021 18:40:58 GMT
- Title: Variance Reduction via Primal-Dual Accelerated Dual Averaging for
Nonsmooth Convex Finite-Sums
- Title(参考訳): 非平滑凸有限要素の一次二重加速二重平均化による分散低減
- Authors: Chaobing Song, Stephen J. Wright and Jelena Diakonikolas
- Abstract要約: 機械学習アプリケーションに広く現れる構造化非平滑凸有限和最適化について検討する。
本稿では,emphVariance Reducing by Primal-Dual Accelerated Dual Averaging (vrpda)を提案する。
- Abstract: We study structured nonsmooth convex finite-sum optimization that appears
widely in machine learning applications, including support vector machines and
least absolute deviation. For the primal-dual formulation of this problem, we
propose a novel algorithm called \emph{Variance Reduction via Primal-Dual
Accelerated Dual Averaging (\vrpda)}. In the nonsmooth and general convex
setting, \vrpda~has the overall complexity $O(nd\log\min \{1/\epsilon, n\} +
d/\epsilon )$ in terms of the primal-dual gap, where $n$ denotes the number of
samples, $d$ the dimension of the primal variables, and $\epsilon$ the desired
accuracy. In the nonsmooth and strongly convex setting, the overall complexity
of \vrpda~becomes $O(nd\log\min\{1/\epsilon, n\} + d/\sqrt{\epsilon})$ in terms
of both the primal-dual gap and the distance between iterate and optimal
solution. Both these results for \vrpda~improve significantly on
state-of-the-art complexity estimates, which are $O(nd\log \min\{1/\epsilon,
n\} + \sqrt{n}d/\epsilon)$ for the nonsmooth and general convex setting and
$O(nd\log \min\{1/\epsilon, n\} + \sqrt{n}d/\sqrt{\epsilon})$ for the nonsmooth
and strongly convex setting, in a much more simple and straightforward way.
Moreover, both complexities are better than \emph{lower} bounds for general
convex finite sums that lack the particular (common) structure that we
consider. Our theoretical results are supported by numerical experiments, which
confirm the competitive performance of \vrpda~compared to state-of-the-art.
- Abstract(参考訳): 我々は、サポートベクターマシンと最小絶対偏差を含む、機械学習アプリケーションで広く現れる構造化された非平滑凸有限和最適化を研究します。
この問題の原始的双対定式化のために、プリマル双対加速双対平均化 (\vrpda)} による \emph{Variance Reduction と呼ばれる新しいアルゴリズムを提案する。
nonsmooth と general convex の設定では、\vrpda~ は全複雑性 $o(nd\log\min \{1/\epsilon, n\} + d/\epsilon )$ を持ち、ここでは$n$ はサンプル数、$d$ は原始変数の次元、$\epsilon$ は所望の精度を表す。
非滑らかかつ強凸設定において、 \vrpda~ の全体的な複雑性は、主双対ギャップと反復と最適解の間の距離の両方の観点から $O(nd\log\min\{1/\epsilon, n\} + d/\sqrt{\epsilon})$ となる。
これらの結果はいずれも、非スムースおよび一般凸集合に対して$o(nd\log \min\{1/\epsilon, n\} + \sqrt{n}d/\epsilon)$、より単純かつ強い凸設定に対して$o(nd\log \min\{1/\epsilon, n\} + \sqrt{n}d/\sqrt{\epsilon})$である。
さらに、両方の複素性は、我々が考える特定の(共通な)構造を持たない一般凸有限和に対する \emph{lower} 境界よりも優れている。
我々の理論結果は数値実験によって支持され、最新技術と比較された \vrpda の競合性能を確認した。
