論文の概要: Differentially Private Maximal Information Coefficients
- arxiv url: http://arxiv.org/abs/2206.10685v1
- Date: Tue, 21 Jun 2022 19:05:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-23 16:33:17.428640
- Title: Differentially Private Maximal Information Coefficients
- Title(参考訳): 個人別最大情報係数
- Authors: John Lazarsfeld, Aaron Johnson, and Emmanuel Adeniran
- Abstract要約: 古典的なラプラス機構の自然な応用は、不十分な精度をもたらすことを示す。
差分プライバシーに適合する新しいMIIC近似であるMICr統計を導入する。
その結果、プライベートMICr統計はLaplaceメカニズムの直接適用よりも著しく優れていた。
- 参考スコア(独自算出の注目度): 3.1542695050861544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Maximal Information Coefficient (MIC) is a powerful statistic to identify
dependencies between variables. However, it may be applied to sensitive data,
and publishing it could leak private information. As a solution, we present
algorithms to approximate MIC in a way that provides differential privacy. We
show that the natural application of the classic Laplace mechanism yields
insufficient accuracy. We therefore introduce the MICr statistic, which is a
new MIC approximation that is more compatible with differential privacy. We
prove MICr is a consistent estimator for MIC, and we provide two differentially
private versions of it. We perform experiments on a variety of real and
synthetic datasets. The results show that the private MICr statistics
significantly outperform direct application of the Laplace mechanism. Moreover,
experiments on real-world datasets show accuracy that is usable when the sample
size is at least moderately large.
- Abstract(参考訳): 最大情報係数(MIC)は変数間の依存関係を特定する強力な統計量である。
しかし、機密データに適用され、公開することで個人情報が漏洩する可能性がある。
解決策として、異なるプライバシーを提供する方法でMICを近似するアルゴリズムを提案する。
古典ラプラス機構の自然な適用は精度が不十分であることを示す。
そこで我々は、微分プライバシーとより互換性のある新しいMIC近似であるMICr統計を導入した。
我々はMICrがMIICの一貫した推定器であることを証明し、2つの微分プライベートバージョンを提供する。
我々は様々な実データと合成データセットで実験を行う。
その結果、プライベートMICr統計はLaplaceメカニズムの直接適用よりも著しく優れていた。
さらに、実世界のデータセットの実験では、サンプルサイズが少なくとも適度に大きい場合、使用可能な精度を示す。
関連論文リスト
- On the Performance of Empirical Risk Minimization with Smoothed Data [59.3428024282545]
経験的リスク最小化(Empirical Risk Minimization、ERM)は、クラスがiidデータで学習可能であれば、サブ線形誤差を達成できる。
We show that ERM can able to achieve sublinear error when a class are learnable with iid data。
論文 参考訳(メタデータ) (2024-02-22T21:55:41Z) - Mean Estimation with User-level Privacy under Data Heterogeneity [54.07947274508013]
異なるユーザーは、非常に多くの異なるデータポイントを持っているかもしれない。
すべてのユーザが同じディストリビューションからサンプルを採取していると仮定することはできない。
本研究では,データの分布と量の両方でユーザデータが異なる異質なユーザデータの単純なモデルを提案する。
論文 参考訳(メタデータ) (2023-07-28T23:02:39Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - Privacy Induces Robustness: Information-Computation Gaps and Sparse Mean
Estimation [8.9598796481325]
本稿では, アルゴリズムと計算複雑性の両面において, 異なる統計問題に対する観測結果について検討する。
プライベートスパース平均推定のための情報計算ギャップを確立する。
また、プライバシーによって引き起こされる情報計算のギャップを、いくつかの統計や学習問題に対して証明する。
論文 参考訳(メタデータ) (2022-11-01T20:03:41Z) - Differentially private multivariate medians [4.588028371034407]
差分的にプライベートな深度に基づく中央値に対する新しい有限サンプル性能保証法を開発した。
Cauchyの限界の下では、重み付けされた位置推定のコストがプライバシーのコストよりも高いことを示している。
論文 参考訳(メタデータ) (2022-10-12T17:56:04Z) - On the Statistical Complexity of Estimation and Testing under Privacy Constraints [17.04261371990489]
差分プライバシー下での統計的テストのパワーをプラグアンドプレイ方式で特徴付ける方法を示す。
プライバシ保護のレベルが非常に高い場合にのみ、プライバシの維持が顕著なパフォーマンス低下をもたらすことを示す。
最後に,プライベート凸解法であるDP-SGLDアルゴリズムを高信頼度で最大推定できることを示した。
論文 参考訳(メタデータ) (2022-10-05T12:55:53Z) - DP2-Pub: Differentially Private High-Dimensional Data Publication with
Invariant Post Randomization [58.155151571362914]
本稿では,2つのフェーズで動作する差分プライベートな高次元データパブリッシング機構(DP2-Pub)を提案する。
属性をクラスタ内凝集度の高い低次元クラスタに分割し、クラスタ間の結合度を低くすることで、適切なプライバシ予算を得ることができる。
また、DP2-Pubメカニズムを、ローカルの差分プライバシーを満たす半正直なサーバでシナリオに拡張します。
論文 参考訳(メタデータ) (2022-08-24T17:52:43Z) - Private measures, random walks, and synthetic data [7.5764890276775665]
微分プライバシーは、情報理論のセキュリティ保証を提供する数学的概念である。
我々は、プライベートな合成データを効率的に構築できるデータセットからプライベートな尺度を開発する。
我々の構築における重要な要素は、独立確率変数と同様の連立分布を持つ新しい超規則ランダムウォークである。
論文 参考訳(メタデータ) (2022-04-20T00:06:52Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Ranking the information content of distance measures [61.754016309475745]
2つの異なる距離測度を用いて保持する相対的情報を評価する統計的テストを導入する。
これにより、候補者のプールから最も情報に富んだ距離を測定することができる。
論文 参考訳(メタデータ) (2021-04-30T15:57:57Z) - Differentially Private M-band Wavelet-Based Mechanisms in Machine
Learning Environments [4.629162607975834]
データにノイズを埋め込む離散Mバンドウェーブレット変換を用いた3つのプライバシ保護機構を開発する。
本機構は,機械学習環境における統計的解析により,差分プライバシーと学習可能性の両方を維持可能であることを示す。
論文 参考訳(メタデータ) (2019-12-30T18:07:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。