論文の概要: Privacy Auditing with Zero (0) Training Run
- arxiv url: http://arxiv.org/abs/2605.14591v1
- Date: Thu, 14 May 2026 09:00:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.740912
- Title: Privacy Auditing with Zero (0) Training Run
- Title(参考訳): Zero (0)トレーニング実行によるプライバシ監査
- Authors: Tudor Cebere, Mathieu Even, Linus Bleistein, Aurélien Bellet,
- Abstract要約: 2つの固定データセットを使用してモデルを監査するためのポストホックフレームワークであるZero-Runのプライバシ監査を紹介する。
最初のアプローチは、適応的な構成として分布シフトとアルゴリズムリークの併用効果をモデル化する。
第2のアプローチでは、観測されたデータに基づいて、ポイントワイドなメンバシップ推定を調整し、よりシャープなインスタンス依存境界を得る。
- 参考スコア(独自算出の注目度): 24.856718399464636
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Privacy auditing provides empirical lower bounds on the differential privacy parameters of learning algorithms. Existing methods, however, require interventional access to the training pipeline, either to retrain multiple times or to randomize data inclusion. This is often infeasible for large deployed systems such as foundation models. We introduce Zero-Run privacy auditing, a post-hoc framework for auditing models using two fixed datasets: examples known to be training-set members and examples known to be non-members. In this observational regime, membership is no longer randomized; instead, member and non-member data often differ in distribution, so membership inference scores may reflect a distribution shift rather than algorithmic leakage. Drawing on ideas from causal inference, we formalize this confounding effect and propose two complementary corrections that yield valid privacy audits. Our first approach models the combined effect of distribution shift and algorithmic leakage as an adaptive composition, producing conservative global corrections. Our second approach conditions on observed data and adjusts pointwise membership guesses, yielding sharper instance-dependent bounds. Experiments on synthetic data and large-scale models show that Zero-Run auditing enables practical privacy evaluation when retraining or controlled data insertion is infeasible.
- Abstract(参考訳): プライバシ監査は、学習アルゴリズムの差分プライバシーパラメータに経験的な低い境界を提供する。
しかし、既存の方法は、複数回再トレーニングするか、データのインクルージョンをランダムにするために、トレーニングパイプラインへの介入アクセスを必要とする。
これは、ファンデーションモデルのような大規模なデプロイシステムでは不可能であることが多い。
Zero-Runプライバシー監査は、2つの固定データセットを使用してモデルを監査するためのポストホックフレームワークである。
この観察体制では、メンバーシップはもはやランダム化されず、代わりに、メンバーデータと非メンバーデータはしばしば分布が異なるため、メンバーシップ推論スコアはアルゴリズム的なリークよりも分布シフトを反映する可能性がある。
因果推論からアイデアを抽出し、この相反効果を形式化し、有効なプライバシー監査をもたらす2つの補完的な修正を提案する。
最初のアプローチは、分散シフトとアルゴリズムリークの併用効果を適応的な構成としてモデル化し、保守的なグローバルな補正を生成する。
第2のアプローチでは、観測されたデータに基づいて、ポイントワイドなメンバシップ推定を調整し、よりシャープなインスタンス依存境界を得る。
合成データと大規模モデルの実験により、Zero-Run監査は、再トレーニングや制御されたデータの挿入が不可能な場合に、実用的なプライバシ評価を可能にすることが示された。
関連論文リスト
- Membership Inference Attacks from Causal Principles [24.370456956570873]
我々は、MIA評価を因果推論問題とし、記憶をトレーニングセットにデータポイントを含む因果効果として定義する。
非漸近的整合性保証付きマルチラン・ワンラン・ゼロラン体制の実用的推定器を提案する。
論文 参考訳(メタデータ) (2026-02-02T21:17:28Z) - Data Lineage Inference: Uncovering Privacy Vulnerabilities of Dataset Pruning [31.888075470799908]
余剰集合内のデータがモデルトレーニングの前にのみ使用される場合でも、攻撃によってプルーニングフェーズのメンバシップ状態が検出可能であることを示す。
我々は、Data-Centric Membership Inferenceと呼ばれる新しいタスクを導入し、Data Lineage Inferenceというデータ中心のプライバシ推論パラダイムを提案する。
異なるプライバシリークのレベルが異なり、同じプルーニング手法でも異なるプライバシリスクを異なるプルーニング率で提示できることがわかった。
論文 参考訳(メタデータ) (2024-11-24T11:46:59Z) - Pseudo-Probability Unlearning: Towards Efficient and Privacy-Preserving Machine Unlearning [59.29849532966454]
本稿では,PseudoProbability Unlearning (PPU)を提案する。
提案手法は,最先端の手法に比べて20%以上の誤りを忘れる改善を実現している。
論文 参考訳(メタデータ) (2024-11-04T21:27:06Z) - Fin-Fed-OD: Federated Outlier Detection on Financial Tabular Data [11.027356898413139]
実世界のシナリオにおける異常検出は、動的でしばしば未知の異常分布による課題を引き起こす。
本稿では、データの機密性を損なうことなく、個々の組織における異常検出を強化するという課題に対処する。
本稿では,表現学習とフェデレーション学習技術を利用して未知の異常の検出を改善する手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:22:04Z) - Correcting Underrepresentation and Intersectional Bias for Classification [49.1574468325115]
我々は、表現不足のバイアスによって破損したデータから学習する問題を考察する。
偏りのないデータの少ない場合、グループワイドのドロップアウト率を効率的に推定できることが示される。
本アルゴリズムは,有限VC次元のモデルクラスに対して,効率的な学習を可能にする。
論文 参考訳(メタデータ) (2023-06-19T18:25:44Z) - Client-specific Property Inference against Secure Aggregation in
Federated Learning [52.8564467292226]
フェデレートラーニングは、さまざまな参加者の間で共通のモデルを協調的に訓練するための、広く使われているパラダイムとなっている。
多くの攻撃は、メンバーシップ、資産、または参加者データの完全な再構築のような機密情報を推測することは依然として可能であることを示した。
単純な線形モデルでは、集約されたモデル更新からクライアント固有のプロパティを効果的にキャプチャできることが示される。
論文 参考訳(メタデータ) (2023-03-07T14:11:01Z) - Tight Auditing of Differentially Private Machine Learning [77.38590306275877]
プライベート機械学習では、既存の監査メカニズムは厳格である。
彼らは不確実な最悪の仮定の下でのみ厳密な見積もりを行う。
我々は、自然(逆向きではない)データセットの厳密なプライバシー推定を得られる改善された監査スキームを設計する。
論文 参考訳(メタデータ) (2023-02-15T21:40:33Z) - Differentially Private Federated Learning with Laplacian Smoothing [72.85272874099644]
フェデレートラーニングは、ユーザ間でプライベートデータを共有せずに、協調的にモデルを学習することで、データのプライバシを保護することを目的としている。
敵は、リリースしたモデルを攻撃することによって、プライベートトレーニングデータを推測することができる。
差別化プライバシは、トレーニングされたモデルの正確性や実用性を著しく低下させる価格で、このような攻撃に対する統計的保護を提供する。
論文 参考訳(メタデータ) (2020-05-01T04:28:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。