論文の概要: The Space Complexity of Approximating Logistic Loss
- arxiv url: http://arxiv.org/abs/2412.02639v1
- Date: Tue, 03 Dec 2024 18:11:37 GMT
- Title: The Space Complexity of Approximating Logistic Loss
- Title(参考訳): ロジスティック損失の近似の空間複雑性
- Authors: Gregory Dexter, Petros Drineas, Rajiv Khanna,
- Abstract要約: a general $tildeOmega(dcdot mu_mathbfy(mathbfX))$ space lower bound if $epsilon$ is constant。
- Abstract: We provide space complexity lower bounds for data structures that approximate logistic loss up to $\epsilon$-relative error on a logistic regression problem with data $\mathbf{X} \in \mathbb{R}^{n \times d}$ and labels $\mathbf{y} \in \{-1,1\}^d$. The space complexity of existing coreset constructions depend on a natural complexity measure $\mu_\mathbf{y}(\mathbf{X})$, first defined in (Munteanu, 2018). We give an $\tilde{\Omega}(\frac{d}{\epsilon^2})$ space complexity lower bound in the regime $\mu_\mathbf{y}(\mathbf{X}) = O(1)$ that shows existing coresets are optimal in this regime up to lower order factors. We also prove a general $\tilde{\Omega}(d\cdot \mu_\mathbf{y}(\mathbf{X}))$ space lower bound when $\epsilon$ is constant, showing that the dependency on $\mu_\mathbf{y}(\mathbf{X})$ is not an artifact of mergeable coresets. Finally, we refute a prior conjecture that $\mu_\mathbf{y}(\mathbf{X})$ is hard to compute by providing an efficient linear programming formulation, and we empirically compare our algorithm to prior approximate methods.
- Abstract(参考訳): データ $\mathbf{X} \in \mathbb{R}^{n \times d}$ とラベル $\mathbf{y} \in \{-1,1\}^d$ のロジスティック回帰問題に対して、ロジスティック損失を$\epsilon$-relative error に近似するデータ構造に対して、空間複雑性の低い境界を提供する。
既存のコアセット構成の空間複雑性は、 (Munteanu, 2018) で最初に定義された自然な複雑性測度 $\mu_\mathbf{y}(\mathbf{X})$ に依存する。
この条件下では、$\tilde{\Omega}(\frac{d}{\epsilon^2})$空間複雑性の下界を$\mu_\mathbf{y}(\mathbf{X}) = O(1)$を与える。
一般の$\tilde{\Omega}(d\cdot \mu_\mathbf{y}(\mathbf{X}))$ space lower bound if $\epsilon$ is constant, showed that the dependency on $\mu_\mathbf{y}(\mathbf{X})$ is a artifact of mergeable coresets。
最後に、$\mu_\mathbf{y}(\mathbf{X})$ が効率的な線形計画法を提供することで計算が困難であるという事前予想を反論し、我々のアルゴリズムを先行近似法と比較する。
