論文の概要: A Differentially Private Kaplan-Meier Estimator for Privacy-Preserving Survival Analysis
- arxiv url: http://arxiv.org/abs/2412.05164v1
- Date: Fri, 06 Dec 2024 16:29:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-09 15:56:38.450245
- Title: A Differentially Private Kaplan-Meier Estimator for Privacy-Preserving Survival Analysis
- Title(参考訳): プライバシー保護型生存分析のための個人用カプラン量推定器
- Authors: Narasimha Raghavan Veeraragavan, Sai Praneeth Karimireddy, Jan Franz Nygård,
- Abstract要約: 本稿では,遅延ノイズ,動的クリッピング,スムース化を施した新しいアルゴリズムを導入し,プライバシ保護型生存曲線を生成する。
NCCTG肺がんデータセットを用いて評価した結果,提案手法はルート平均二乗誤差(RMSE)を効果的に低減し,プライバシ予算全体にわたって精度を向上することが示された。
- 参考スコア(独自算出の注目度): 12.067958128148112
- License:
- Abstract: This paper presents a differentially private approach to Kaplan-Meier estimation that achieves accurate survival probability estimates while safeguarding individual privacy. The Kaplan-Meier estimator is widely used in survival analysis to estimate survival functions over time, yet applying it to sensitive datasets, such as clinical records, risks revealing private information. To address this, we introduce a novel algorithm that applies time-indexed Laplace noise, dynamic clipping, and smoothing to produce a privacy-preserving survival curve while maintaining the cumulative structure of the Kaplan-Meier estimator. By scaling noise over time, the algorithm accounts for decreasing sensitivity as fewer individuals remain at risk, while dynamic clipping and smoothing prevent extreme values and reduce fluctuations, preserving the natural shape of the survival curve. Our results, evaluated on the NCCTG lung cancer dataset, show that the proposed method effectively lowers root mean squared error (RMSE) and enhances accuracy across privacy budgets ($\epsilon$). At $\epsilon = 10$, the algorithm achieves an RMSE as low as 0.04, closely approximating non-private estimates. Additionally, membership inference attacks reveal that higher $\epsilon$ values (e.g., $\epsilon \geq 6$) significantly reduce influential points, particularly at higher thresholds, lowering susceptibility to inference attacks. These findings confirm that our approach balances privacy and utility, advancing privacy-preserving survival analysis.
- Abstract(参考訳): 本稿では,個々のプライバシを保護しながら,精度の高い生存確率推定を実現する,Kaplan-Meier推定に対する個人的アプローチを提案する。
カプラン・マイアー推定器は生存関数を時間とともに推定するために広く用いられているが、臨床記録、個人情報の漏洩リスクなどの機密データに適用されている。
そこで本稿では,Kaplan-Meier推定器の累積構造を維持しつつ,時間インデクシングされたLaplaceノイズ,動的クリッピング,スムーズなスムーズなサバイバル曲線を生成するアルゴリズムを提案する。
ノイズを時間の経過とともにスケーリングすることで、個人が危険に晒されることが少なくなるため感度が低下する一方、動的クリッピングとスムーズ化によって極端な値が防止され、変動が減少し、生存曲線の自然な形が保たれる。
NCCTG肺がんデータセットを用いて評価した結果,提案手法はルート平均二乗誤差(RMSE)を効果的に低減し,プライバシ予算(\epsilon$)の精度を高めることが示唆された。
このアルゴリズムは、$\epsilon = 10$でRMSEを0.04まで低く達成し、非私的推定を密接に近似する。
さらに、メンバシップ推論攻撃は、高い$\epsilon$値(例えば、$\epsilon \geq 6$)が、特に高いしきい値において影響ポイントを著しく減少させ、推論攻撃に対する感受性を低下させることを明らかにした。
これらの結果から,本手法はプライバシとユーティリティのバランスを保ち,プライバシ保存サバイバル分析を推し進めていることが明らかとなった。
関連論文リスト
- Differentially Private Sliced Inverse Regression: Minimax Optimality and
Algorithm [16.14032140601778]
十分な次元削減の文脈において、プライバシー問題に対処するために設計された最適微分プライベートアルゴリズムを提案する。
我々は、対数係数まで最小限の下位境界を達成できる微分プライベートアルゴリズムを開発した。
自然な拡張として、微分プライベートスパース主成分分析に類似した下界と上界を容易に提供できる。
論文 参考訳(メタデータ) (2024-01-16T06:47:43Z) - Private and Collaborative Kaplan-Meier Estimators [44.61287171386347]
データの様々な機能に差分プライバシーを適用する際の柔軟性を提供する2つの新しい差分プライベート手法を導入する。
厳密なプライバシー保証を伴うKaplan-Meier曲線の同時推定を可能にする様々な経路を提案する。
論文 参考訳(メタデータ) (2023-05-24T17:11:48Z) - Score Attack: A Lower Bound Technique for Optimal Differentially Private
Learning [8.760651633031342]
本稿では,パラメータ推定の差分プライバシに制約されたミニマックスリスクを低く抑える,スコアアタックと呼ばれる新しい手法を提案する。
様々な統計問題に対する差分プライバシーを確保しながら、未知のモデルパラメータを推定する最小限のリスクを対数係数まで最適に下げることができる。
論文 参考訳(メタデータ) (2023-03-13T14:26:27Z) - Differentially Private Stochastic Gradient Descent with Low-Noise [49.981789906200035]
現代の機械学習アルゴリズムは、データからきめ細かい情報を抽出して正確な予測を提供することを目的としており、プライバシー保護の目標と矛盾することが多い。
本稿では、プライバシを保ちながら優れたパフォーマンスを確保するために、プライバシを保存する機械学習アルゴリズムを開発することの実践的および理論的重要性について論じる。
論文 参考訳(メタデータ) (2022-09-09T08:54:13Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z) - Do Not Let Privacy Overbill Utility: Gradient Embedding Perturbation for
Private Learning [74.73901662374921]
差分プライベートモデルは、モデルが多数のトレーニング可能なパラメータを含む場合、ユーティリティを劇的に劣化させる。
偏微分プライベート深層モデルの精度向上のためのアルゴリズムemphGradient Embedding Perturbation (GEP)を提案する。
論文 参考訳(メタデータ) (2021-02-25T04:29:58Z) - Learning with User-Level Privacy [61.62978104304273]
ユーザレベルの差分プライバシー制約下での学習課題を,アルゴリズムを用いて解析する。
個々のサンプルのプライバシーのみを保証するのではなく、ユーザレベルのdpはユーザの貢献全体を保護します。
プライバシコストが$tau$に比例した$K$適応的に選択されたクエリのシーケンスにプライベートに答えるアルゴリズムを導き出し、私たちが検討する学習タスクを解決するためにそれを適用します。
論文 参考訳(メタデータ) (2021-02-23T18:25:13Z) - Output Perturbation for Differentially Private Convex Optimization with
Improved Population Loss Bounds, Runtimes and Applications to Private
Adversarial Training [12.386462516398469]
強力な過剰なリスク境界を提供する効率的で実装が容易な差分プライベート(DP)アルゴリズムを見つけることは、現代の機械学習において重要な問題である。
我々は、滑らかさと強い凸性の存在下で、最もよく知られた$(epsilon, 0)$-DP人口損失境界と最速ランタイムを提供する。
我々はこの理論を2つの学習フレームワーク、傾きERMと逆学習フレームワークに適用する。
論文 参考訳(メタデータ) (2021-02-09T08:47:06Z) - Hiding Among the Clones: A Simple and Nearly Optimal Analysis of Privacy
Amplification by Shuffling [49.43288037509783]
ランダムシャッフルは、局所的ランダム化データの差分プライバシー保証を増幅する。
私たちの結果は、以前の作業よりも単純で、ほぼ同じ保証で差分プライバシーに拡張された新しいアプローチに基づいています。
論文 参考訳(メタデータ) (2020-12-23T17:07:26Z) - Privacy Preserving Recalibration under Domain Shift [119.21243107946555]
本稿では,差分プライバシー制約下での校正問題の性質を抽象化する枠組みを提案する。
また、新しいリカレーションアルゴリズム、精度温度スケーリングを設計し、プライベートデータセットの事前処理より優れています。
論文 参考訳(メタデータ) (2020-08-21T18:43:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。