論文の概要: Lower Bounds for Differential Privacy Under Continual Observation and Online Threshold Queries
- Date: Wed, 17 Apr 2024 23:59:19 GMT
- Title: Lower Bounds for Differential Privacy Under Continual Observation and Online Threshold Queries
- Title(参考訳): 連続観察およびオンライン閾値クエリにおける差分プライバシーのための下位境界
- Authors: Edith Cohen, Xin Lyu, Jelani Nelson, Tamás Sarlós, Uri Stemmer,
- Abstract要約: 我々は、$Omegaleft(minn,log Tright)$の新しい下限を示す。
- Abstract: One of the most basic problems for studying the "price of privacy over time" is the so called private counter problem, introduced by Dwork et al. (2010) and Chan et al. (2010). In this problem, we aim to track the number of events that occur over time, while hiding the existence of every single event. More specifically, in every time step $t\in[T]$ we learn (in an online fashion) that $\Delta_t\geq 0$ new events have occurred, and must respond with an estimate $n_t\approx\sum_{j=1}^t \Delta_j$. The privacy requirement is that all of the outputs together, across all time steps, satisfy event level differential privacy. The main question here is how our error needs to depend on the total number of time steps $T$ and the total number of events $n$. Dwork et al. (2015) showed an upper bound of $O\left(\log(T)+\log^2(n)\right)$, and Henzinger et al. (2023) showed a lower bound of $\Omega\left(\min\{\log n, \log T\}\right)$. We show a new lower bound of $\Omega\left(\min\{n,\log T\}\right)$, which is tight w.r.t. the dependence on $T$, and is tight in the sparse case where $\log^2 n=O(\log T)$. Our lower bound has the following implications: $\bullet$ We show that our lower bound extends to the "online thresholds problem", where the goal is to privately answer many "quantile queries" when these queries are presented one-by-one. This resolves an open question of Bun et al. (2017). $\bullet$ Our lower bound implies, for the first time, a separation between the number of mistakes obtainable by a private online learner and a non-private online learner. This partially resolves a COLT'22 open question published by Sanyal and Ramponi. $\bullet$ Our lower bound also yields the first separation between the standard model of private online learning and a recently proposed relaxed variant of it, called private online prediction.
- Abstract(参考訳): 時とともにプライバシーの価格」を研究するための最も基本的な問題の1つは、Dwork et al (2010) と Chan et al (2010) によって導入されたいわゆるプライベートカウンター問題である。
より具体的に言えば、ステップ $t\in[T]$ では、(オンラインの方法で) $\Delta_t\geq 0$ 新たなイベントが発生し、見積もり $n_t\approx\sum_{j=1}^t \Delta_j$ で応答しなければなりません。
Dwork et al (2015) は$O\left(\log(T)+\log^2(n)\right)$ の上限を示し、Hnzinger et al (2023) は$Omega\left(\min\{\log n, \log T\right)$ の上限を示した。
我々は、$\Omega\left(\min\{n,\log T\right)$という新しい下界を示し、これは$T$への依存が強く、$\log^2 n=O(\log T)$のスパースケースでは厳密である。
$\bullet$ 私たちは、下位境界が"オンラインしきい値問題"にまで拡張していることを示します。
これは Bun et al (2017) の公開問題を解決する。
$\bullet$ 我々の下限は、初めて、プライベートオンライン学習者と非プライベートオンライン学習者によって得られる誤りの数とを分離することを意味します。
これは、Sanyal と Ramponi が公表した COLT'22 のオープンな質問を部分的に解決する。
$\bullet$ 我々の下限は、プライベートオンライン学習の標準モデルと、最近提案された「プライベートオンライン予測」と呼ばれる緩和版との、最初の分離をもたらす。
