論文の概要: Online Distribution Learning with Local Private Constraints
- arxiv url: http://arxiv.org/abs/2402.00315v1
- Date: Thu, 1 Feb 2024 03:56:48 GMT
- Title: Online Distribution Learning with Local Private Constraints
- Title(参考訳): ローカルプライベート制約によるオンライン配信学習
- Authors: Jin Sima and Changlong Wu and Olgica Milenkovic and Wojciech
- Abstract要約: 本研究では,ローカルな差分プライバシー下でのインハンウンドラベルを用いたオンライン条件分布推定の問題点について検討する。
民営化ラベルのローカルな差分プライバシーを$(epsilon,0)$とすると、KL-risk は $tildeTheta(frac1epsilonsqrtKT)$ up to poly-logarithmic factors として成長する。
- Abstract: We study the problem of online conditional distribution estimation with
\emph{unbounded} label sets under local differential privacy. Let $\mathcal{F}$
be a distribution-valued function class with unbounded label set. We aim at
estimating an \emph{unknown} function $f\in \mathcal{F}$ in an online fashion
so that at time $t$ when the context $\boldsymbol{x}_t$ is provided we can
generate an estimate of $f(\boldsymbol{x}_t)$ under KL-divergence knowing only
a privatized version of the true labels sampling from $f(\boldsymbol{x}_t)$.
The ultimate objective is to minimize the cumulative KL-risk of a finite
horizon $T$. We show that under $(\epsilon,0)$-local differential privacy of
the privatized labels, the KL-risk grows as
$\tilde{\Theta}(\frac{1}{\epsilon}\sqrt{KT})$ upto poly-logarithmic factors
where $K=|\mathcal{F}|$. This is in stark contrast to the
$\tilde{\Theta}(\sqrt{T\log K})$ bound demonstrated by Wu et al. (2023a) for
bounded label sets. As a byproduct, our results recover a nearly tight upper
bound for the hypothesis selection problem of gopi et al. (2020) established
only for the batch setting.
- Abstract(参考訳): 本稿では,ローカルな差分プライバシーの下で,emph{unbounded}ラベルセットを用いたオンライン条件分布推定の問題について検討する。
$\mathcal{F}$ を非有界ラベル集合を持つ分布値関数クラスとする。
オンライン形式で \emph{unknown} 関数 $f\in \mathcal{f}$ を推定することで、コンテキスト $\boldsymbol{x}_t$ が与えられたとき、$f(\boldsymbol{x}_t)$ からサンプリングされた真のラベルの民営化バージョンのみを知っている kl-divergence の下で$f(\boldsymbol{x}_t)$ の見積もりを生成することができる。
KL-risk は $(\epsilon,0)$-local differential privacy of the privatized labels の下で $\tilde{\Theta}(\frac{1}{\epsilon}\sqrt{KT})$ up to poly-logarithmic factors where $K=|\mathcal{F}|$ として成長することを示す。
これは、wu et al. (2023a) が有界ラベル集合に対して示した $\tilde{\theta}(\sqrt{t\log k})$ bound とは対照的である。
副産物として, バッチ設定のみに確立されたgopi et al. (2020) の仮説選択問題に対して, ほぼ厳密な上限を回復した。
