論文の概要: Data Analytics with Differential Privacy
- arxiv url: http://arxiv.org/abs/2311.16104v1
- Date: Thu, 20 Jul 2023 17:43:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 15:21:55.562505
- Title: Data Analytics with Differential Privacy
- Title(参考訳): 差分プライバシーを用いたデータ分析
- Authors: Vassilis Digalakis Jr
- Abstract要約: 我々は分散データとストリーミングデータを解析するための差分プライベートアルゴリズムを開発した。
分散モデルでは、学習の特定の問題 -- 分散形式で -- がデータのグローバルモデルであると考えている。
私たちは、ストリーミングモデル、ユーザーレベルのパンプライバシに対して、最も強力なプライバシー保証の1つを提供しています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Differential privacy is the state-of-the-art definition for privacy,
guaranteeing that any analysis performed on a sensitive dataset leaks no
information about the individuals whose data are contained therein. In this
thesis, we develop differentially private algorithms to analyze distributed and
streaming data. In the distributed model, we consider the particular problem of
learning -- in a distributed fashion -- a global model of the data, that can
subsequently be used for arbitrary analyses. We build upon PrivBayes, a
differentially private method that approximates the high-dimensional
distribution of a centralized dataset as a product of low-order distributions,
utilizing a Bayesian Network model. We examine three novel approaches to
learning a global Bayesian Network from distributed data, while offering the
differential privacy guarantee to all local datasets. Our work includes a
detailed theoretical analysis of the distributed, differentially private
entropy estimator which we use in one of our algorithms, as well as a detailed
experimental evaluation, using both synthetic and real-world data. In the
streaming model, we focus on the problem of estimating the density of a stream
of users, which expresses the fraction of all users that actually appear in the
stream. We offer one of the strongest privacy guarantees for the streaming
model, user-level pan-privacy, which ensures that the privacy of any user is
protected, even against an adversary that observes the internal state of the
algorithm. We provide a detailed analysis of an existing, sampling-based
algorithm for the problem and propose two novel modifications that
significantly improve it, both theoretically and experimentally, by optimally
using all the allocated "privacy budget."
- Abstract(参考訳): ディファレンシャルプライバシは、プライバシに関する最先端の定義であり、機密データセット上で実行される分析が、そのデータを含む個人に関する情報をリークしないことを保証する。
本論文では,分散およびストリーミングデータを解析するための微分プライベートアルゴリズムを開発した。
分散モデルでは、学習の特定の問題 -- 分散形式で -- はデータのグローバルモデルであり、その後任意の分析に使用できると考える。
ベイズネットワークモデルを用いて,低次分布の積としての集中型データセットの高次元分布を近似する微分プライベート手法であるprivbayesを基礎とする。
分散データからグローバルベイズネットワークを学習するための3つの新しいアプローチについて検討し、すべてのローカルデータセットに差分プライバシー保証を提供する。
我々の研究は、我々のアルゴリズムの1つで使われている分散プライベートエントロピー推定器の詳細な理論的解析と、合成データと実世界のデータの両方を用いて詳細な実験的評価を含む。
ストリーミングモデルでは,ストリームに実際に現れる全ユーザの比率を表す,ストリームの密度を推定する問題に注目する。
我々は,ストリーミングモデルであるユーザレベルのパンプライバシに対して,最も強力なプライバシ保証を提供する。これは,アルゴリズムの内部状態を監視している敵に対して,ユーザのプライバシが保護されていることを保証します。
そこで本研究では,既存のサンプリングベースアルゴリズムの詳細な解析を行い,全ての「プライバシー予算」を最適に活用し,理論的および実験的に改善する2つの新しい修正を提案する。
関連論文リスト
- Differentially Private Random Feature Model [52.468511541184895]
プライバシを保存するカーネルマシンに対して,差分的にプライベートな特徴モデルを作成する。
本手法は,プライバシを保護し,一般化誤差を導出する。
論文 参考訳(メタデータ) (2024-12-06T05:31:08Z) - Differentially Private Synthetic Data with Private Density Estimation [2.209921757303168]
我々は、差分プライバシーの枠組みを採用し、データセット全体を生成するメカニズムを探究する。
我々はBoedihardjoらの研究に基づいて、プライベートな合成データを生成するための新しい最適化ベースのアルゴリズムの基礎を築いた。
論文 参考訳(メタデータ) (2024-05-06T14:06:12Z) - Initialization Matters: Privacy-Utility Analysis of Overparameterized
Neural Networks [72.51255282371805]
我々は、最悪の近傍データセット上でのモデル分布間のKLばらつきのプライバシー境界を証明した。
このKLプライバシー境界は、トレーニング中にモデルパラメータに対して期待される2乗勾配ノルムによって決定される。
論文 参考訳(メタデータ) (2023-10-31T16:13:22Z) - Conditional Density Estimations from Privacy-Protected Data [0.0]
プライバシ保護されたデータセットからのシミュレーションに基づく推論手法を提案する。
本稿では,感染性疾患モデルと通常の線形回帰モデルに基づく個別時系列データについて述べる。
論文 参考訳(メタデータ) (2023-10-19T14:34:17Z) - Private Set Generation with Discriminative Information [63.851085173614]
異なるプライベートなデータ生成は、データプライバシの課題に対する有望な解決策である。
既存のプライベートな生成モデルは、合成サンプルの有用性に苦慮している。
我々は,最先端アプローチのサンプルユーティリティを大幅に改善する,シンプルで効果的な手法を提案する。
論文 参考訳(メタデータ) (2022-11-07T10:02:55Z) - Differentially private partitioned variational inference [28.96767727430277]
複数のデバイスに分散している機密データから、プライバシ保護モデルを学ぶことは、ますます重要な問題である。
ベイズ分布に対する変分近似を学習するための最初の一般フレームワークである差分分割変分推論について述べる。
論文 参考訳(メタデータ) (2022-09-23T13:58:40Z) - Private Domain Adaptation from a Public Source [48.83724068578305]
我々は、公開ラベル付きデータを持つソースドメインから、未ラベル付きプライベートデータを持つターゲットドメインへの適応のための差分プライベート離散性に基づくアルゴリズムを設計する。
我々の解は、Frank-WolfeとMirror-Descentアルゴリズムのプライベートな変種に基づいている。
論文 参考訳(メタデータ) (2022-08-12T06:52:55Z) - Smooth Anonymity for Sparse Graphs [69.1048938123063]
しかし、スパースデータセットを共有するという点では、差分プライバシーがプライバシのゴールドスタンダードとして浮上している。
本研究では、スムーズな$k$匿名性(スムーズな$k$匿名性)と、スムーズな$k$匿名性(スムーズな$k$匿名性)を提供する単純な大規模アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-07-13T17:09:25Z) - Personalization Improves Privacy-Accuracy Tradeoffs in Federated
Optimization [57.98426940386627]
局所的な学習とプライベートな集中学習の協調は、総合的に有用であり、精度とプライバシのトレードオフを改善していることを示す。
合成および実世界のデータセットに関する実験により理論的結果について述べる。
論文 参考訳(メタデータ) (2022-02-10T20:44:44Z) - Differentially Private Normalizing Flows for Privacy-Preserving Density
Estimation [10.561489862855334]
明示的な差分プライバシー保証を提供する正規化フローモデルの使用を提案します。
このアルゴリズムを差分プライベート異常検出のタスクにどのように適用できるかを示す。
論文 参考訳(メタデータ) (2021-03-25T18:39:51Z) - Secure and Differentially Private Bayesian Learning on Distributed Data [17.098036331529784]
本稿では,事前条件付きランゲヴィンダイナミクスとRMSpropを併用した分散ベイズ学習手法を提案する。
提案手法を分散データのロジスティック回帰と生存分析に応用し, 集中型手法と比較して, 予測精度と時間複雑性の観点からその可能性を示した。
論文 参考訳(メタデータ) (2020-05-22T05:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。