論文の概要: Differential privacy with dependent data
- arxiv url: http://arxiv.org/abs/2511.18583v2
- Date: Tue, 25 Nov 2025 03:41:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 15:01:35.382533
- Title: Differential privacy with dependent data
- Title(参考訳): 依存データによる差分プライバシー
- Authors: Valentin Roth, Marco Avella-Medina,
- Abstract要約: We show that Winsorized mean estimator can be used under dependent for bounded data。
我々は,対数ソボレフ不等式による関節非有界観測への依存性を定式化する。
我々の研究は、依存データに対する差分プライバシー(DP)の体系的研究に向けた第一歩となる。
- 参考スコア(独自算出の注目度): 1.8835490533310795
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Dependent data underlies many statistical studies in the social and health sciences, which often involve sensitive or private information. Differential privacy (DP) and in particular \textit{user-level} DP provide a natural formalization of privacy requirements for processing dependent data where each individual provides multiple observations to the dataset. However, dependence introduced, e.g., through repeated measurements challenges the existing statistical theory under DP-constraints. In \iid{} settings, noisy Winsorized mean estimators have been shown to be minimax optimal for standard (\textit{item-level}) and \textit{user-level} DP estimation of a mean $μ\in \R^d$. Yet, their behavior on potentially dependent observations has not previously been studied. We fill this gap and show that Winsorized mean estimators can also be used under dependence for bounded and unbounded data, and can lead to asymptotic and finite sample guarantees that resemble their \iid{} counterparts under a weak notion of dependence. For this, we formalize dependence via log-Sobolev inequalities on the joint distribution of observations. This enables us to adapt the stable histogram by Karwa and Vadhan (2018) to a non-\iid{} setting, which we then use to estimate the private projection intervals of the Winsorized estimator. The resulting guarantees for our item-level mean estimator extend to \textit{user-level} mean estimation and transfer to the local model via a randomized response histogram. Using the mean estimators as building blocks, we provide extensions to random effects models, longitudinal linear regression and nonparametric regression. Therefore, our work constitutes a first step towards a systematic study of DP for dependent data.
- Abstract(参考訳): 依存したデータは、しばしば機密情報や個人情報を含む社会・健康科学における多くの統計研究の基盤となっている。
差分プライバシー(DP)、特にtextit{user-level} DPは、各個人がデータセットに複数の観察を提供する依存データを処理するためのプライバシー要件の自然な形式化を提供する。
しかし、繰り返し測定によって導入された依存は、DP制約の下での既存の統計理論に挑戦する。
iid{} 設定では、ノイズ化平均推定器は標準 (\textit{item-level}) と \textit{user-level} DP の平均$μ\in \R^d$ に対して極小値であることが示されている。
しかし、潜在的に依存する観測に対するそれらの行動は、これまで研究されていない。
このギャップを埋めて、Winsorized mean estimator が有界および非有界なデータに対する依存の下でも使用できることを示すとともに、依存の弱い概念の下でそれらの \iid{} に類似した漸近的かつ有限なサンプル保証を導出することができる。
このため,観測の連成分布に対する対数ソボレフの不等式による依存の形式化を行う。
これにより、Karwa と Vadhan (2018) による安定ヒストグラムを非\iid{} 設定に適応させることで、ウィンゾライズド推定器のプライベート射影間隔を推定することができる。
その結果、アイテムレベルの平均推定器は、ランダムな応答ヒストグラムを用いて、ローカルモデルへの推定と転送に拡張される。
平均推定器をビルディングブロックとし、ランダム効果モデルの拡張、縦線形回帰、非パラメトリック回帰を提供する。
そこで本研究は,従属データに対するDPの体系的な研究に向けた第一歩となる。
関連論文リスト
- Private Statistical Estimation via Truncation [5.642973820558159]
データトランケーションによる個人統計推定のための新しいフレームワークを導入し、データサポートが非有界である場合のDP推定における重要な課題に対処する。
計算効率の良いDP推定器を開発した。
論文 参考訳(メタデータ) (2025-05-18T20:38:38Z) - Assumption-Lean Post-Integrated Inference with Surrogate Control Outcomes [6.448728765953916]
制御結果を用いて遅延不均一性を調整する頑健なポストインテグレート推論(PII)手法を提案する。
我々は、予測された直接効果推定に関する半パラメトリック推論を開発し、隠された仲介者、共同設立者、モデレーターを考慮に入れた。
提案された二重頑健な推定器は、最小の仮定と潜在的な不特定性の下で一貫性があり、効率的である。
論文 参考訳(メタデータ) (2024-10-07T12:52:38Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Statistical Estimation from Dependent Data [37.73584699735133]
本稿では,異なる観測領域にまたがるバイナリラベルが特徴ベクトル上で独立に条件付けられていないような一般的な統計的推定問題について考察する。
我々はこれらの依存関係をMarkov Random Fieldsの言語でモデル化する。
このモデルに対してアルゴリズムと統計的に効率的な推定率を提供する。
論文 参考訳(メタデータ) (2021-07-20T21:18:06Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Evaluating Model Robustness and Stability to Dataset Shift [7.369475193451259]
機械学習モデルの安定性を解析するためのフレームワークを提案する。
本手法では,アルゴリズムが性能の悪い分布を決定するために,元の評価データを用いる。
我々は,アルゴリズムの性能を"Worst-case"分布で推定する。
論文 参考訳(メタデータ) (2020-10-28T17:35:39Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z) - TraDE: Transformers for Density Estimation [101.20137732920718]
TraDEは自己回帰密度推定のための自己アテンションに基づくアーキテクチャである。
本稿では, 生成したサンプルを用いた回帰, 分布外検出, トレーニングデータにおける雑音に対する頑健性などのタスクについて述べる。
論文 参考訳(メタデータ) (2020-04-06T07:32:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。