論文の概要: Locally Private $k$-Means Clustering with Constant Multiplicative
Approximation and Near-Optimal Additive Error
- arxiv url: http://arxiv.org/abs/2105.15007v1
- Date: Mon, 31 May 2021 14:41:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-01 22:26:36.734277
- Title: Locally Private $k$-Means Clustering with Constant Multiplicative
Approximation and Near-Optimal Additive Error
- Title(参考訳): 定乗法近似と準最適加算誤差を用いた局所プライベート$k$-Meansクラスタリング
- Authors: Anamay Chaturvedi, Matthew Jones, Huy L. Nguyen
- Abstract要約: 2つの新しいアルゴリズムで加算誤差の上と下の境界における$n$の指数のギャップを埋める。
- 参考スコア(独自算出の注目度): 10.632986841188
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given a data set of size $n$ in $d'$-dimensional Euclidean space, the
$k$-means problem asks for a set of $k$ points (called centers) so that the sum
of the $\ell_2^2$-distances between points of a given data set of size $n$ and
the set of $k$ centers is minimized. Recent work on this problem in the locally
private setting achieves constant multiplicative approximation with additive
error $\tilde{O} (n^{1/2 + a} \cdot k \cdot \max \{\sqrt{d}, \sqrt{k} \})$ and
proves a lower bound of $\Omega(\sqrt{n})$ on the additive error for any
solution with a constant number of rounds. In this work we bridge the gap
between the exponents of $n$ in the upper and lower bounds on the additive
error with two new algorithms. Given any $\alpha>0$, our first algorithm
achieves a multiplicative approximation guarantee which is at most a
$(1+\alpha)$ factor greater than that of any non-private $k$-means clustering
algorithm with $k^{\tilde{O}(1/\alpha^2)} \sqrt{d' n} \mbox{poly}\log n$
additive error. Given any $c>\sqrt{2}$, our second algorithm achieves $O(k^{1 +
\tilde{O}(1/(2c^2-1))} \sqrt{d' n} \mbox{poly} \log n)$ additive error with
constant multiplicative approximation. Both algorithms go beyond the
$\Omega(n^{1/2 + a})$ factor that occurs in the additive error for arbitrarily
small parameters $a$ in previous work, and the second algorithm in particular
shows for the first time that it is possible to solve the locally private
$k$-means problem in a constant number of rounds with constant factor
multiplicative approximation and polynomial dependence on $k$ in the additive
error arbitrarily close to linear.
- Abstract(参考訳): 大きさ$n$ in $d'$-次元ユークリッド空間のデータセットが与えられたとき、$k$-平均問題は、与えられた大きさのデータセットの点間の$\ell_2^2$-距離の和が$n$と$k$中心の集合が最小となるように、$k$点(センターと呼ばれる)の集合を求める。
局所的プライベートな設定におけるこの問題に関する最近の研究は、加法誤差$\tilde{O} (n^{1/2 + a} \cdot k \cdot \max \{\sqrt{d}, \sqrt{k} \})$で定数乗法近似を達成し、一定の数のラウンドを持つ任意の解に対する$\Omega(\sqrt{n})$の低い境界を証明している。
任意の$\alpha>0$が与えられた場合、我々の最初のアルゴリズムは、少なくとも$(1+\alpha)$ファクタが$k^{\tilde{O}(1/\alpha^2)} \sqrt{d' n} \mbox{poly}\log n$加法誤差を持つ任意の非プライベートな$k$-meansクラスタリングアルゴリズムよりも大きい乗法近似を保証する。
任意の$c>\sqrt{2}$が与えられると、第2のアルゴリズムは、定数乗算近似を伴う加法誤差$o(k^{1 + \tilde{o}(1/(2c^2-1))} \sqrt{d' n} \mbox{poly} \log n)$ を達成する。
どちらのアルゴリズムも、前回の作業で任意に小さいパラメータの加法誤差で発生する$\omega(n^{1/2 + a})$ factorを超越しており、特に第2のアルゴリズムは、任意に線形に近い加法誤差の$k$に対する定数因子乗法近似と多項式依存性を持つ一定数のラウンドにおいて、局所的にプライベートな$k$-means問題を解くことができることを初めて示している。
