論文の概要: PRISM: Differentially Private Synthetic Data with Structure-Aware Budget Allocation for Prediction
- arxiv url: http://arxiv.org/abs/2602.10228v1
- Date: Tue, 10 Feb 2026 19:17:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.24599
- Title: PRISM: Differentially Private Synthetic Data with Structure-Aware Budget Allocation for Prediction
- Title(参考訳): PRISM: 予測のための構造を考慮した予算割当付き微分プライベート合成データ
- Authors: Amir Asiaee, Chao Yan, Zachary B. Abrams, Bradley A. Malin,
- Abstract要約: 差分プライバシー(DP)は、相手が解放されたデータからどんな個人について学べるかを制限する数学的保証を提供する。
既存のDP合成データ手法は、データが特定の予測タスクに役立つ場合でも、全ての特徴を対称に扱い、ノイズを均一に拡散する。
我々は、利用可能な構造知識に依存して、3つの体制で機能する予測中心のアプローチを開発する。
- 参考スコア(独自算出の注目度): 9.016539021471845
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Differential privacy (DP) provides a mathematical guarantee limiting what an adversary can learn about any individual from released data. However, achieving this protection typically requires adding noise, and noise can accumulate when many statistics are measured. Existing DP synthetic data methods treat all features symmetrically, spreading noise uniformly even when the data will serve a specific prediction task. We develop a prediction-centric approach operating in three regimes depending on available structural knowledge. In the causal regime, when the causal parents of $Y$ are known and distribution shift is expected, we target the parents for robustness. In the graphical regime, when a Bayesian network structure is available and the distribution is stable, the Markov blanket of $Y$ provides a sufficient feature set for optimal prediction. In the predictive regime, when no structural knowledge exists, we select features via differentially private methods without claiming to recover causal or graphical structure. We formalize this as PRISM, a mechanism that (i) identifies a predictive feature subset according to the appropriate regime, (ii) constructs targeted summary statistics, (iii) allocates budget to minimize an upper bound on prediction error, and (iv) synthesizes data via graphical-model inference. We prove end-to-end privacy guarantees and risk bounds. Empirically, task-aware allocation improves prediction accuracy compared to generic synthesizers. Under distribution shift, targeting causal parents achieves AUC $\approx 0.73$ while correlation-based selection collapses to chance ($\approx 0.49$).
- Abstract(参考訳): 差分プライバシー(DP)は、相手が解放されたデータからどんな個人について学べるかを制限する数学的保証を提供する。
しかし、この保護を達成するには、通常、ノイズを追加する必要があり、多くの統計が測定されたときにノイズが蓄積される。
既存のDP合成データ手法は、データが特定の予測タスクに役立つ場合でも、全ての特徴を対称に扱い、ノイズを均一に拡散する。
我々は、利用可能な構造知識に依存して、3つの体制で機能する予測中心のアプローチを開発する。
因果関係では、Y$の因果関係の親が知られ、分布の変化が期待される場合、親に堅牢性を求める。
グラフィカルなシステムでは、ベイズ的ネットワーク構造が利用可能であり、分布が安定であるとき、$Y$のマルコフ毛布は最適な予測のための十分な特徴セットを提供する。
予測システムでは、構造的知識が存在しない場合には、因果的構造や図形的構造を復元する権利を主張せずに、差分的にプライベートな手法で特徴を選択する。
私たちはこれをPRISM、つまりメカニズムとして定式化します。
i) 適切な状況に応じて予測特徴サブセットを識別する。
(ii)対象の要約統計,
三 予測誤差の上限を最小にするために予算を割り当て、
(iv)グラフィカルモデル推論によってデータを合成する。
エンドツーエンドのプライバシー保証とリスクバウンドを証明します。
経験的に、タスク対応アロケーションは、ジェネリックシンセサイザーと比較して予測精度を向上させる。
AUC $\approx 0.73$、相関に基づく選択は偶然に崩壊する(\approx 0.49$)。
関連論文リスト
- Distribution-informed Online Conformal Prediction [53.674678995825666]
更新ルールに基礎となるデータパターンを組み込んだオンラインコンフォメーション予測アルゴリズムである Conformal Optimistic Prediction (COP) を提案する。
COPは予測可能なパターンが存在する場合により厳密な予測セットを生成し、見積もりが不正確な場合でも有効なカバレッジ保証を保持する。
我々は,COPが有効なカバレッジを実現し,他のベースラインよりも短い予測間隔を構築できることを証明した。
論文 参考訳(メタデータ) (2025-12-08T17:51:49Z) - Robust Conformal Prediction Using Privileged Information [17.886554223172517]
本研究では,トレーニングデータの破損に対して堅牢な,保証されたカバレッジ率で予測セットを生成する手法を開発した。
我々のアプローチは、i.d仮定の下で有効となる予測セットを構築するための強力なフレームワークである共形予測に基づいている。
論文 参考訳(メタデータ) (2024-06-08T08:56:47Z) - Privacy Amplification for the Gaussian Mechanism via Bounded Support [64.86780616066575]
インスタンスごとの差分プライバシー(pDP)やフィッシャー情報損失(FIL)といったデータ依存のプライバシ会計フレームワークは、固定されたトレーニングデータセット内の個人に対してきめ細かいプライバシー保証を提供する。
本稿では,データ依存会計下でのプライバシ保証を向上することを示すとともに,バウンドサポートによるガウス機構の簡単な修正を提案する。
論文 参考訳(メタデータ) (2024-03-07T21:22:07Z) - Differentially Private Statistical Inference through $\beta$-Divergence
One Posterior Sampling [2.8544822698499255]
本稿では,モデルとデータ生成プロセス間の$beta$-divergenceの最小化を目標とした,一般化後部からの後部サンプリング手法を提案する。
これにより、基礎となるモデルの変更を必要とせずに、一般的に適用可能なプライベートな推定が可能になる。
我々は、$beta$D-Bayesが同一のプライバシー保証に対してより正確な推測を行うことを示す。
論文 参考訳(メタデータ) (2023-07-11T12:00:15Z) - General Gaussian Noise Mechanisms and Their Optimality for Unbiased Mean
Estimation [58.03500081540042]
プライベート平均推定に対する古典的なアプローチは、真の平均を計算し、バイアスのないがおそらく相関のあるガウスノイズを加えることである。
すべての入力データセットに対して、集中的な差分プライバシーを満たす非バイアス平均推定器が、少なくとも多くのエラーをもたらすことを示す。
論文 参考訳(メタデータ) (2023-01-31T18:47:42Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Private Prediction Sets [72.75711776601973]
機械学習システムは、個人のプライバシーの確実な定量化と保護を必要とする。
これら2つのデシラタを共同で扱う枠組みを提案する。
本手法を大規模コンピュータビジョンデータセット上で評価する。
論文 参考訳(メタデータ) (2021-02-11T18:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。