論文の概要: Differentially Private Weighted Sampling
- arxiv url: http://arxiv.org/abs/2010.13048v3
- Date: Wed, 31 Mar 2021 16:55:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 04:31:11.179144
- Title: Differentially Private Weighted Sampling
- Title(参考訳): 差動的にプライベートな重み付けサンプリング
- Authors: Edith Cohen, Ofir Geri, Tamas Sarlos, Uri Stemmer
- Abstract要約: 周波数の関数による重み付けされたキーのサンプルは、代表キーのスパースセットを提供する汎用的な要約である。
本稿では,各非プライベートな重み付きサンプルの有効性を維持しつつ,要素レベルの差分プライバシを確保する手法として,PWSを提案する。
- 参考スコア(独自算出の注目度): 26.288012254399565
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Common datasets have the form of elements with keys (e.g., transactions and
products) and the goal is to perform analytics on the aggregated form of key
and frequency pairs. A weighted sample of keys by (a function of) frequency is
a highly versatile summary that provides a sparse set of representative keys
and supports approximate evaluations of query statistics. We propose private
weighted sampling (PWS): A method that ensures element-level differential
privacy while retaining, to the extent possible, the utility of a respective
non-private weighted sample. PWS maximizes the reporting probabilities of keys
and estimation quality of a broad family of statistics. PWS improves over the
state of the art also for the well-studied special case of private histograms,
when no sampling is performed. We empirically demonstrate significant
performance gains compared with prior baselines: 20%-300% increase in key
reporting for common Zipfian frequency distributions and accuracy for $\times
2$-$ 8$ lower frequencies in estimation tasks. Moreover, PWS is applied as a
simple post-processing of a non-private sample, without requiring the original
data. This allows for seamless integration with existing implementations of
non-private schemes and retaining the efficiency of schemes designed for
resource-constrained settings such as massive distributed or streamed data. We
believe that due to practicality and performance, PWS may become a method of
choice in applications where privacy is desired.
- Abstract(参考訳): 共通データセットは、キー(トランザクションや製品など)を持つ要素の形式を持ち、キーと周波数ペアの集約された形式の分析を行うことが目標である。
周波数の関数による重み付けされたキーのサンプルは、非常に汎用的な要約であり、スパースな代表キーセットを提供し、クエリ統計の近似評価をサポートする。
個別重み付きサンプリング (private weighted sampling, pws) とは,各非プライベート重み付きサンプルの有用性を可能な限り保ちながら,要素レベルの差分プライバシを保証する手法である。
PWSは、キーの報告確率を最大化し、幅広い統計群の推定品質を最大化する。
pwsは、サンプリングを行わない場合のプライベートヒストグラムの特例についても、芸術の状態を改善している。
一般的なジップフィアン周波数分布に対するキーレポーティングの20%-300%の増加と、推定タスクにおける2〜8ドルの低い周波数の精度である。
さらに、PWSは、元のデータを必要としない、非プライベートなサンプルの単純な後処理として適用されます。
これにより、非プライベートなスキームの既存の実装とシームレスに統合でき、巨大な分散データやストリームデータのようなリソース制限された設定のために設計されたスキームの効率を維持することができる。
我々は、実用性と性能のため、プライバシが望まれるアプリケーションにおいて、PWSが選択の方法になると考えている。
関連論文リスト
- Scalable DP-SGD: Shuffling vs. Poisson Subsampling [61.19794019914523]
バッチサンプリングをシャッフルしたマルチエポック適応線形クエリ(ABLQ)機構のプライバシ保証に対する新たな下位境界を提供する。
ポアソンのサブサンプリングと比較すると大きな差がみられ, 以前の分析は1つのエポックに限られていた。
本稿では,大規模な並列計算を用いて,Poissonサブサンプリングを大規模に実装する実践的手法を提案する。
論文 参考訳(メタデータ) (2024-11-06T19:06:16Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Noise Variance Optimization in Differential Privacy: A Game-Theoretic Approach Through Per-Instance Differential Privacy [7.264378254137811]
差分プライバシー(DP)は、個人をターゲットデータセットに含めることによる分布の変化を観察することにより、プライバシー損失を測定することができる。
DPは、AppleやGoogleのような業界巨人の機械学習におけるデータセットの保護において際立っている。
本稿では,PDPを制約として提案し,各データインスタンスのプライバシ損失を測定し,個々のインスタンスに適したノイズを最適化する。
論文 参考訳(メタデータ) (2024-04-24T06:51:16Z) - Enhancing Trade-offs in Privacy, Utility, and Computational Efficiency through MUltistage Sampling Technique (MUST) [3.0939420223851446]
プライバシ・アンプリフィケーション(PA)のためのサブサンプリング手法のクラスを提案する。
本研究は2段階MUST法におけるPA効果と実用性について包括的に解析する。
MUSTの繰り返し適用に関するプライバシー損失構成分析を行う。
論文 参考訳(メタデータ) (2023-12-20T19:38:29Z) - Evaluating the Impact of Local Differential Privacy on Utility Loss via
Influence Functions [11.504012974208466]
我々は、特定のプライバシパラメータ値がモデルのテスト損失にどのように影響するかについて、インフルエンス関数が洞察を与える能力を示す。
提案手法により,データキュレーターは,プライバシ・ユーティリティのトレードオフに最も適したプライバシパラメータを選択できる。
論文 参考訳(メタデータ) (2023-09-15T18:08:24Z) - SEAM: Searching Transferable Mixed-Precision Quantization Policy through
Large Margin Regularization [50.04951511146338]
混合精度量子化(MPQ)は各層に対して最適なビット幅割り当てを求めるのに時間を要する。
本稿では,小規模なプロキシデータセットを用いて効率的なMPQポリシーを効率的に検索する手法を提案する。
論文 参考訳(メタデータ) (2023-02-14T05:47:45Z) - Noise-Resistant Deep Metric Learning with Probabilistic Instance
Filtering [59.286567680389766]
ノイズラベルは現実世界のデータによく見られ、ディープニューラルネットワークの性能劣化を引き起こす。
DMLのための確率的ランク付けに基づくメモリを用いたインスタンス選択(PRISM)手法を提案する。
PRISMはラベルがクリーンである確率を計算し、潜在的にノイズの多いサンプルをフィルタリングする。
論文 参考訳(メタデータ) (2021-08-03T12:15:25Z) - Oblivious Sampling Algorithms for Private Data Analysis [10.990447273771592]
データセットのサンプル上で実行されるクエリに基づいて,セキュアでプライバシ保護されたデータ解析について検討する。
信頼された実行環境(TEE)は、クエリ計算中にデータの内容を保護するために使用できる。
TEEsにおける差分プライベート(DP)クエリのサポートは、クエリ出力が明らかにされたときの記録プライバシを提供する。
論文 参考訳(メタデータ) (2020-09-28T23:45:30Z) - Privacy Amplification via Random Check-Ins [38.72327434015975]
Differentially Private Gradient Descent (DP-SGD) は、多くのアプリケーションにおいて、機密データを学習するための基本的な構成要素となっている。
本稿では,DP-SGD のような反復的手法を,多くのデバイス(クライアント)に分散したフェデレーションラーニング(FL)の設定において実施することに焦点を当てる。
当社の主なコントリビューションは,各クライアントがローカルかつ独立に行うランダムな参加決定にのみ依存する,Emphrandom Check-in分散プロトコルです。
論文 参考訳(メタデータ) (2020-07-13T18:14:09Z) - RDP-GAN: A R\'enyi-Differential Privacy based Generative Adversarial
Network [75.81653258081435]
GAN(Generative Adversarial Network)は,プライバシ保護の高い現実的なサンプルを生成する能力によって,近年注目を集めている。
しかし、医療記録や財務記録などの機密・私的な訓練例にGANを適用すると、個人の機密・私的な情報を漏らしかねない。
本稿では、学習中の損失関数の値にランダムノイズを慎重に付加することにより、GAN内の差分プライバシー(DP)を実現するR'enyi-differentially private-GAN(RDP-GAN)を提案する。
論文 参考訳(メタデータ) (2020-07-04T09:51:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。