論文の概要: Enhancing Trade-offs in Privacy, Utility, and Computational Efficiency
through MUltistage Sampling Technique (MUST)
- arxiv url: http://arxiv.org/abs/2312.13389v1
- Date: Wed, 20 Dec 2023 19:38:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-22 16:50:03.788106
- Title: Enhancing Trade-offs in Privacy, Utility, and Computational Efficiency
through MUltistage Sampling Technique (MUST)
- Title(参考訳): MUST(Multistage Smpling Technique)によるプライバシ、ユーティリティ、計算効率のトレードオフの強化
- Authors: Xingyuan Zhao, Fang Liu
- Abstract要約: プライバシ・アンプリフィケーション(PA)のためのMUST(MUST)と呼ばれるサブサンプリング手法のクラスを提案する。
本稿では,2段階のMUST手順,すなわちMUST.WO,MUST.OW,MUST.WWに対して,PA効果と実用性を包括的に分析する。
以上の結果から,MUST.OWとMUST.WWは1段サンプリング法よりも,エプシロン$が強いことが示唆された。
- 参考スコア(独自算出の注目度): 4.107946593741216
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Applying a randomized algorithm to a subset of a dataset rather than the
entire dataset is a common approach to amplify its privacy guarantees in the
released information. We propose a class of subsampling methods named
MUltistage Sampling Technique (MUST) for privacy amplification (PA) in the
context of differential privacy (DP). We conduct comprehensive analyses of the
PA effects and utility for several 2-stage MUST procedures, namely, MUST.WO,
MUST.OW, and MUST.WW that respectively represent sampling with (W), without
(O), with (W) replacement from the original dataset in stage I and then
sampling without (O), with (W), with (W) replacement in stage II from the
subset drawn in stage I. We also provide the privacy composition analysis over
repeated applications of MUST via the Fourier accountant algorithm. Our
theoretical and empirical results suggest that MUST.OW and MUST.WW have
stronger PA in $\epsilon$ than the common one-stage sampling procedures
including Poisson sampling, sampling without replacement, and sampling with
replacement, while the results on $\delta$ vary case by case. We also prove
that MUST.WO is equivalent to sampling with replacement in PA. Furthermore, the
final subset generated by a MUST procedure is a multiset that may contain
multiple copies of the same data points due to sampling with replacement
involved, which enhances the computational efficiency of algorithms that
require complex function calculations on distinct data points (e.g., gradient
descent). Our utility experiments show that MUST delivers similar or improved
utility and stability in the privacy-preserving outputs compared to one-stage
subsampling methods at similar privacy loss. MUST can be seamlessly integrated
into stochastic optimization algorithms or procedures that involve parallel or
simultaneous subsampling (e.g., bagging and subsampling bootstrap) when DP
guarantees are necessary.
- Abstract(参考訳): データセット全体ではなくデータセットのサブセットにランダム化アルゴリズムを適用することは、リリース情報におけるプライバシの保証を強化する一般的なアプローチである。
差分プライバシー(DP)の文脈において,プライバシ増幅(PA)のためのMUST(MUltistage Smpling Technique)というサブサンプリング手法のクラスを提案する。
2段階の必須手続きである must.wo, must.ow, must.ww を,それぞれ (w), without (o), with (w) でサンプリングし, (o), without (w) でサンプリングし, stage i で描画された部分集合から stage ii で (w) を置換して,pa 効果と有用性を包括的に解析する。
また、フーリエ会計アルゴリズムを用いてMUSTの繰り返し適用に関するプライバシー構成分析を行う。
理論的および実証的な結果から,MUST.OWとMUST.WWのPA値が,ポアソンサンプリング,交換なしサンプリング,置換によるサンプリングを含む一般的な1段階サンプリング法よりも強いことが示唆された。
また、MUST.WOはPAで置換したサンプリングと等価であることを示す。
さらに、MUSTプロシージャによって生成される最後のサブセットはマルチセットであり、同一のデータポイントの複数のコピーを含むことができるため、異なるデータポイント(例えば勾配降下)で複雑な関数計算を必要とするアルゴリズムの計算効率が向上する。
我々のユーティリティ実験は、MUSTが同様の、または改善されたユーティリティと安定性をプライバシー保護出力で提供することを示す。
MUSTは、DP保証が必要な場合、並列または同時サブサンプリング(例えば、バッグとサブサンプリングブートストラップ)を含む確率最適化アルゴリズムや手順にシームレスに統合することができる。
関連論文リスト
- Noise Variance Optimization in Differential Privacy: A Game-Theoretic Approach Through Per-Instance Differential Privacy [7.264378254137811]
差分プライバシー(DP)は、個人をターゲットデータセットに含めることによる分布の変化を観察することにより、プライバシー損失を測定することができる。
DPは、AppleやGoogleのような業界巨人の機械学習におけるデータセットの保護において際立っている。
本稿では,PDPを制約として提案し,各データインスタンスのプライバシ損失を測定し,個々のインスタンスに適したノイズを最適化する。
論文 参考訳(メタデータ) (2024-04-24T06:51:16Z) - Provable Privacy with Non-Private Pre-Processing [56.770023668379615]
非プライベートなデータ依存前処理アルゴリズムによって生じる追加のプライバシーコストを評価するための一般的なフレームワークを提案する。
当社のフレームワークは,2つの新しい技術的概念を活用することにより,全体的なプライバシー保証の上限を確立する。
論文 参考訳(メタデータ) (2024-03-19T17:54:49Z) - TernaryVote: Differentially Private, Communication Efficient, and
Byzantine Resilient Distributed Optimization on Heterogeneous Data [50.797729676285876]
本稿では, 3次圧縮機と多数決機構を組み合わせて, 差分プライバシー, 勾配圧縮, ビザンチンレジリエンスを同時に実現するternaryVoteを提案する。
提案アルゴリズムのF差分プライバシー(DP)とビザンチンレジリエンスのレンズによるプライバシー保証を理論的に定量化する。
論文 参考訳(メタデータ) (2024-02-16T16:41:14Z) - SHAP@k:Efficient and Probably Approximately Correct (PAC) Identification
of Top-k Features [16.99004256148679]
本稿では,トップk識別問題(TkIP)を紹介し,最も高いSHAP値を持つk特徴を特定することを目的とする。
我々の研究の目的は、TkIP解決の文脈において、既存の手法のサンプル効率を改善することである。
論文 参考訳(メタデータ) (2023-07-10T18:42:45Z) - Practical Privacy-Preserving Gaussian Process Regression via Secret
Sharing [23.80837224347696]
本稿では秘密共有(SS)に基づくプライバシー保護型GPR手法を提案する。
コンフュージョン補正(confusion-correction)というアイデアを通じて,新たなSSベースの指数演算を導出し,Cholesky分解に基づくSSベースの行列逆変換アルゴリズムを構築する。
実験結果から,データプライバシ保護の前提として,提案手法が妥当な精度と効率を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-06-26T08:17:51Z) - Theoretically Principled Federated Learning for Balancing Privacy and
Utility [61.03993520243198]
モデルパラメータを歪ませることでプライバシを保護する保護機構の一般学習フレームワークを提案する。
フェデレートされた学習における各コミュニケーションラウンドにおいて、各クライアント上の各モデルパラメータに対して、パーソナライズされたユーティリティプライバシトレードオフを実現することができる。
論文 参考訳(メタデータ) (2023-05-24T13:44:02Z) - Private Alternating Least Squares: Practical Private Matrix Completion
with Tighter Rates [34.023599653814415]
ユーザレベルのプライバシの下で、差分的プライベート(DP)行列補完の問題について検討する。
本稿では,Alternating-Least-Squares (ALS) 方式の差分型を設計する。
論文 参考訳(メタデータ) (2021-07-20T23:19:11Z) - Improved, Deterministic Smoothing for L1 Certified Robustness [119.86676998327864]
分割雑音を伴う非加法的決定論的平滑化法(dssn)を提案する。
一様加法平滑化とは対照的に、ssn認証は無作為なノイズコンポーネントを独立に必要としない。
これは、規範ベースの敵対的脅威モデルに対して決定論的「ランダム化平滑化」を提供する最初の仕事である。
論文 参考訳(メタデータ) (2021-03-17T21:49:53Z) - Hiding Among the Clones: A Simple and Nearly Optimal Analysis of Privacy
Amplification by Shuffling [49.43288037509783]
ランダムシャッフルは、局所的ランダム化データの差分プライバシー保証を増幅する。
私たちの結果は、以前の作業よりも単純で、ほぼ同じ保証で差分プライバシーに拡張された新しいアプローチに基づいています。
論文 参考訳(メタデータ) (2020-12-23T17:07:26Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。