論文の概要: Bayesian Frequency Estimation Under Local Differential Privacy With an Adaptive Randomized Response Mechanism
- arxiv url: http://arxiv.org/abs/2405.07020v2
- Date: Sat, 30 Nov 2024 14:42:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-03 16:56:47.198119
- Title: Bayesian Frequency Estimation Under Local Differential Privacy With an Adaptive Randomized Response Mechanism
- Title(参考訳): 適応的ランダム化応答機構を用いた局所微分プライバシーに基づくベイズ周波数推定
- Authors: Soner Aydin, Sinan Yildirim,
- Abstract要約: 本稿では,局所的な差分プライバシーの下でのカテゴリー分布の適応的オンラインベイズ推定アルゴリズムAdOBEst-LDPを提案する。
ベイズ推定によって過去の民営化データにサブセット選択プロセスを適用することにより、アルゴリズムは将来の民営化データの有用性を向上させる。
- 参考スコア(独自算出の注目度): 0.4604003661048266
- License:
- Abstract: Frequency estimation plays a critical role in many applications involving personal and private categorical data. Such data are often collected sequentially over time, making it valuable to estimate their distribution online while preserving privacy. We propose AdOBEst-LDP, a new algorithm for adaptive, online Bayesian estimation of categorical distributions under local differential privacy (LDP). The key idea behind AdOBEst-LDP is to enhance the utility of future privatized categorical data by leveraging inference from previously collected privatized data. To achieve this, AdOBEst-LDP uses a new adaptive LDP mechanism to collect privatized data. This LDP mechanism constrains its output to a \emph{subset} of categories that `predicts' the next user's data. By adapting the subset selection process to the past privatized data via Bayesian estimation, the algorithm improves the utility of future privatized data. To quantify utility, we explore various well-known information metrics, including (but not limited to) the Fisher information matrix, total variation distance, and information entropy. For Bayesian estimation, we utilize \emph{posterior sampling} through stochastic gradient Langevin dynamics, a computationally efficient approximate Markov chain Monte Carlo (MCMC) method. We provide a theoretical analysis showing that (i) the posterior distribution of the category probabilities targeted with Bayesian estimation converges to the true probabilities even for approximate posterior sampling, and (ii) AdOBEst-LDP eventually selects the optimal subset for its LDP mechanism with high probability if posterior sampling is performed exactly. We also present numerical results to validate the estimation accuracy of AdOBEst-LDP. Our comparisons show its superior performance against non-adaptive and semi-adaptive competitors across different privacy levels and distributional parameters.
- Abstract(参考訳): 周波数推定は、個人および個人の分類データを含む多くのアプリケーションにおいて重要な役割を果たす。
このようなデータは、時間とともに順次収集されることが多く、プライバシを保ちながら、彼らの配布をオンラインで見積もることの価値がある。
本稿では,局所微分プライバシー(LDP)の下でのカテゴリー分布の適応的オンラインベイズ推定アルゴリズムAdOBEst-LDPを提案する。
AdOBEst-LDPの背景にある重要な考え方は、以前に収集された民営化データからの推論を活用することで、将来の民営化カテゴリデータの実用性を高めることである。
これを実現するため、AdOBEst-LDPは新しい適応LDPメカニズムを使用して、民生データの収集を行う。
このLDPメカニズムは、その出力を次のユーザのデータを‘予測’するカテゴリの \emph{subset} に制限する。
ベイズ推定によって過去の民営化データにサブセット選択プロセスを適用することにより、アルゴリズムは将来の民営化データの有用性を向上させる。
有効性を定量化するために,フィッシャー情報行列,全変動距離,情報エントロピーなど,よく知られた情報メトリクスについて検討する。
ベイズ推定では,マルコフ連鎖モンテカルロ法 (MCMC) の確率勾配ランゲヴィン力学を用いて,<emph{posterior sample} を用いる。
我々はそれを理論的に分析する。
一 ベイズ推定を対象とするカテゴリー確率の後方分布は、近似された後方サンプリングであっても真の確率に収束し、
(II)AdOBEst-LDPは最終的に後方サンプリングを正確に行うと高い確率でLDP機構の最適部分集合を選択する。
また,AdOBEst-LDPの推定精度を評価するために数値計算を行った。
我々の比較では、プライバシレベルや分散パラメータの異なる非適応的および半適応的競合に対して、優れたパフォーマンスを示している。
関連論文リスト
- Scalable DP-SGD: Shuffling vs. Poisson Subsampling [61.19794019914523]
バッチサンプリングをシャッフルしたマルチエポック適応線形クエリ(ABLQ)機構のプライバシ保証に対する新たな下位境界を提供する。
ポアソンのサブサンプリングと比較すると大きな差がみられ, 以前の分析は1つのエポックに限られていた。
本稿では,大規模な並列計算を用いて,Poissonサブサンプリングを大規模に実装する実践的手法を提案する。
論文 参考訳(メタデータ) (2024-11-06T19:06:16Z) - Bayesian Estimation and Tuning-Free Rank Detection for Probability Mass Function Tensors [17.640500920466984]
本稿では,関節のPMFを推定し,そのランクを観測データから自動的に推定する新しい枠組みを提案する。
我々は、様々なモデルパラメータの後方分布を近似するために、変分推論(VI)に基づく決定論的解を導出し、さらに、変分推論(SVI)を利用して、VVIベースのアプローチのスケーラブルバージョンを開発する。
合成データと実映画レコメンデーションデータの両方を含む実験は、推定精度、自動ランク検出、計算効率の点で、VVIおよびSVIベースの手法の利点を示している。
論文 参考訳(メタデータ) (2024-10-08T20:07:49Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - Noise Variance Optimization in Differential Privacy: A Game-Theoretic Approach Through Per-Instance Differential Privacy [7.264378254137811]
差分プライバシー(DP)は、個人をターゲットデータセットに含めることによる分布の変化を観察することにより、プライバシー損失を測定することができる。
DPは、AppleやGoogleのような業界巨人の機械学習におけるデータセットの保護において際立っている。
本稿では,PDPを制約として提案し,各データインスタンスのプライバシ損失を測定し,個々のインスタンスに適したノイズを最適化する。
論文 参考訳(メタデータ) (2024-04-24T06:51:16Z) - Optimal Locally Private Nonparametric Classification with Public Data [2.631955426232593]
本研究では,非パラメトリック分類に着目して,公共データを利用した非対話型局所微分プライベート(LDP)学習の問題点について検討する。
後方ドリフト仮定の下では, LDP制約による最小収束率を導出する。
そこで本研究では,極小最大収束率を達成できる新しい手法である局所微分プライベート分類木を提案する。
論文 参考訳(メタデータ) (2023-11-19T16:35:01Z) - Personalized Federated Learning under Mixture of Distributions [98.25444470990107]
本稿では,ガウス混合モデル(GMM)を用いたPFL(Personalized Federated Learning)を提案する。
FedGMMはオーバーヘッドを最小限に抑え、新しいクライアントに適応する付加的なアドバンテージを持ち、不確実な定量化を可能にします。
PFL分類と新しいサンプル検出の両方において, 合成データセットとベンチマークデータセットの実証評価により, 提案手法の優れた性能を示した。
論文 参考訳(メタデータ) (2023-05-01T20:04:46Z) - Prediction-Oriented Bayesian Active Learning [51.426960808684655]
予測情報ゲイン(EPIG)は、パラメータではなく予測空間における情報ゲインを測定する。
EPIGは、さまざまなデータセットやモデルにわたるBALDと比較して、予測パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-04-17T10:59:57Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。