#### 論文の概要: Memory-Constrained Algorithms for Convex Optimization via Recursive Cutting-Planes

Date: Fri, 16 Jun 2023 17:00:51 GMT
• Title: Memory-Constrained Algorithms for Convex Optimization via Recursive Cutting-Planes
• Title（参考訳）: Recursive Cutting-Planesによる凸最適化のためのメモリ制約アルゴリズム
• Authors: Mo\"ise Blanchard, Junhui Zhang, Patrick Jaillet
• Abstract要約: 勾配降下法と切断平面法の間に正のトレードオフを与えるアルゴリズムの第一級は、$epsilonleq 1/sqrt d$である。 規則$epsilon leq d-Omega(d)$では、$p=d$のアルゴリズムが情報理論の最適メモリ利用を実現し、勾配降下のオラクル-複雑度を改善する。
• Abstract: We propose a family of recursive cutting-plane algorithms to solve feasibility problems with constrained memory, which can also be used for first-order convex optimization. Precisely, in order to find a point within a ball of radius $\epsilon$ with a separation oracle in dimension $d$ -- or to minimize $1$-Lipschitz convex functions to accuracy $\epsilon$ over the unit ball -- our algorithms use $\mathcal O(\frac{d^2}{p}\ln \frac{1}{\epsilon})$ bits of memory, and make $\mathcal O((C\frac{d}{p}\ln \frac{1}{\epsilon})^p)$ oracle calls, for some universal constant $C \geq 1$. The family is parametrized by $p\in[d]$ and provides an oracle-complexity/memory trade-off in the sub-polynomial regime $\ln\frac{1}{\epsilon}\gg\ln d$. While several works gave lower-bound trade-offs (impossibility results) -- we explicit here their dependence with $\ln\frac{1}{\epsilon}$, showing that these also hold in any sub-polynomial regime -- to the best of our knowledge this is the first class of algorithms that provides a positive trade-off between gradient descent and cutting-plane methods in any regime with $\epsilon\leq 1/\sqrt d$. The algorithms divide the $d$ variables into $p$ blocks and optimize over blocks sequentially, with approximate separation vectors constructed using a variant of Vaidya's method. In the regime $\epsilon \leq d^{-\Omega(d)}$, our algorithm with $p=d$ achieves the information-theoretic optimal memory usage and improves the oracle-complexity of gradient descent.
• Abstract（参考訳）: 本論文では,一階の凸最適化にも使用可能な制約付きメモリを用いた再帰的切削平面アルゴリズムのファミリーを提案する。 正確には、半径 $\epsilon$ のボール内の点を見つけるために、次元 $d$ の分離オラクルを持つか、単位球上の 1$-Lipschitz 凸関数を最小化するために$\epsilon$-- アルゴリズムは、$\mathcal O(\frac{d^2}{p}\ln \frac{1}{\epsilon})$ビットメモリを使用し、$\mathcal O((C\frac{d}{p}\ln \frac{1}{\epsilon})^p)$oracle コール、ある普遍定数$C \geq 1$に対して$ oracle コールする。 このファミリーは$p\in[d]$でパラメータ化され、サブポリノマルレジーム$\ln\frac{1}{\epsilon}\gg\ln d$でoracle-complexity/memoryのトレードオフを提供する。 いくつかの研究が低いバウンドのトレードオフ(具体的結果)を与えたが、ここでは $\ln\frac{1}{\epsilon}$ への依存を明示し、これらがどんなサブポリノミカルな体制でも成り立つことを示しており、私たちの知る限り、これは $\epsilon\leq 1/\sqrt d$ を持つ任意のレシエーションにおける勾配降下法と切断平面法の間の正のトレードオフを提供するアルゴリズムの第一級である。 アルゴリズムは$d$変数を$p$ブロックに分割し、Vaidyaの方法の変種を用いて近似分離ベクトルを構築し、ブロックを順次最適化する。 規則 $\epsilon \leq d^{-\Omega(d)}$ では、$p=d$ のアルゴリズムは情報理論の最適メモリ利用を実現し、勾配降下のオラクル-複雑度を改善する。

