論文の概要: Fast, Sample-Efficient, Affine-Invariant Private Mean and Covariance
Estimation for Subgaussian Distributions
- arxiv url: http://arxiv.org/abs/2301.12250v2
- Date: Tue, 25 Apr 2023 19:40:02 GMT
- Title: Fast, Sample-Efficient, Affine-Invariant Private Mean and Covariance
Estimation for Subgaussian Distributions
- Title(参考訳): サブガウス分布の高速, サンプル効率, アフィン不変プライベート平均と共分散推定
- Authors: Gavin Brown, Samuel B. Hopkins and Adam Smith
- Abstract要約: 我々は,高次元共分散認識平均推定のための高速,微分プライベートなアルゴリズムを提案する。
我々のアルゴリズムは$tildemu$を生成し、$|mu|_Sigma leq alpha$が$n gtrsim tfrac d alpha2 + tfracd sqrtlog 1/deltaalpha varepsilon+fracdlog 1/deltavarepsilon$である。
- 参考スコア(独自算出の注目度): 8.40077201352607
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a fast, differentially private algorithm for high-dimensional
covariance-aware mean estimation with nearly optimal sample complexity. Only
exponential-time estimators were previously known to achieve this guarantee.
Given $n$ samples from a (sub-)Gaussian distribution with unknown mean $\mu$
and covariance $\Sigma$, our $(\varepsilon,\delta)$-differentially private
estimator produces $\tilde{\mu}$ such that $\|\mu - \tilde{\mu}\|_{\Sigma} \leq
\alpha$ as long as $n \gtrsim \tfrac d {\alpha^2} + \tfrac{d \sqrt{\log
1/\delta}}{\alpha \varepsilon}+\frac{d\log 1/\delta}{\varepsilon}$. The
Mahalanobis error metric $\|\mu - \hat{\mu}\|_{\Sigma}$ measures the distance
between $\hat \mu$ and $\mu$ relative to $\Sigma$; it characterizes the error
of the sample mean. Our algorithm runs in time $\tilde{O}(nd^{\omega - 1} +
nd/\varepsilon)$, where $\omega < 2.38$ is the matrix multiplication exponent.
We adapt an exponential-time approach of Brown, Gaboardi, Smith, Ullman, and
Zakynthinou (2021), giving efficient variants of stable mean and covariance
estimation subroutines that also improve the sample complexity to the nearly
optimal bound above.
Our stable covariance estimator can be turned to private covariance
estimation for unrestricted subgaussian distributions. With $n\gtrsim d^{3/2}$
samples, our estimate is accurate in spectral norm. This is the first such
algorithm using $n= o(d^2)$ samples, answering an open question posed by Alabi
et al. (2022). With $n\gtrsim d^2$ samples, our estimate is accurate in
Frobenius norm. This leads to a fast, nearly optimal algorithm for private
learning of unrestricted Gaussian distributions in TV distance.
Duchi, Haque, and Kuditipudi (2023) obtained similar results independently
and concurrently.
- Abstract(参考訳): ほぼ最適なサンプル複雑性を持つ高次元共分散平均推定のための高速かつ微分プライベートなアルゴリズムを提案する。
未知の平均$\mu$ と共分散 $\sigma$ から$n$のサンプルが与えられると、我々の$(\varepsilon,\delta)$ は$\tilde{\mu}$を生成し、$n \gtrsim \tfrac d {\alpha^2} + \tfrac{d \sqrt{\log 1/\delta}}{\alpha \varepsilon}+\frac{d\log 1/\delta}{\varepsilon}$となる。
mahalanobis error metric $\|\mu - \hat{\mu}\|_{\sigma}$は、$\hat \mu$ と$\mu$ の間の距離を測定し、サンプル平均の誤差を特徴付ける。
我々のアルゴリズムは時間$\tilde{O}(nd^{\omega - 1} + nd/\varepsilon)$で動き、$\omega < 2.38$は行列乗算指数である。
brown, gaboardi, smith, ullman, zakynthinou (2021) の指数時間アプローチを適用し,安定平均と共分散推定サブルーチンの効率的な変種を与え,サンプルの複雑さを上述の最適境界まで向上させた。
n\gtrsim d^{3/2}$サンプルでは、スペクトルノルムで推定が正確である。
これは$n= o(d^2)$ サンプルを用いた最初のそのようなアルゴリズムであり、alabiら (2022) が提起した解答である。
n\gtrsim d^2$サンプルでは、この推定はフロベニウスノルムで正確である。
duchi, haque, kuditipudi (2023)も同様の結果が独立して得られた。
