論文の概要: Revisiting Privacy Leakage in Machine Unlearning: Membership Inference Beyond the Forgotten Set
- arxiv url: http://arxiv.org/abs/2605.01129v1
- Date: Fri, 01 May 2026 21:57:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.59761
- Title: Revisiting Privacy Leakage in Machine Unlearning: Membership Inference Beyond the Forgotten Set
- Title(参考訳): 機械学習におけるプライバシ漏洩を再考する - 忘れられたセットを越えてのメンバシップ推論
- Authors: Jie Fu, Nima Naderloui, Da Zhong, Yuan Hong, Wendy Hui Wang,
- Abstract要約: 近年の研究では、データ削除は必然的に保持装置にプライバシー漏洩をもたらすことが示されている。
TC-UMIAは,最初の三級未学習会員推論攻撃である。
以上の結果から,プライバシー保護とモデル精度の基本的なトレードオフが明らかとなった。
- 参考スコア(独自算出の注目度): 16.330468699022237
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine unlearning (MU) has emerged as a key mechanism for ensuring data privacy and regulatory compliance by enabling models to forget specific training samples. However, recent studies have shown that the removal of data can inadvertently introduce privacy leakages to the retain set,i.e., data that remain in the model after unlearning. In this paper, we extend the scope of privacy analysis in unlearning to the often-overlooked retained data. We introduce TC-UMIA, the first tri-class unlearning membership inference attack. TC-UMIA is a population-level inference framework that leverages model predictions before and after unlearning to distinguish among the forget, retain, and unseen set. Extensive experiments on five state-of-the-art unlearning algorithms and six real-world datasets demonstrate that: (i) unlearning can introduce additional privacy risks to the retain set, making it more susceptible to membership inference attacks; (ii) TC-UMIA is effective across a wide range of model architectures, datasets, and MU approaches. Beyond launching the attack, we rigorously evaluate three defense mechanisms, namely label-only outputs, dropout, and differential privacy, to mitigate the privacy risks posed by TC- UMIA. Our results reveal a fundamental trade-off between privacy protection and model accuracy, with the dropout approach offering the most favorable balance.
- Abstract(参考訳): 機械学習(MU)は、特定のトレーニングサンプルを忘れることによって、データのプライバシと規制コンプライアンスを保証する重要なメカニズムとして登場した。
しかし、最近の研究では、データの削除は必然的に保持装置にプライバシー漏洩をもたらす可能性があることが示されている。
本稿では、未学習におけるプライバシー分析の範囲を、しばしば見過ごされる保持データにまで広げる。
TC-UMIAは,最初の三級未学習会員推論攻撃である。
TC-UMIAは集団レベルの推論フレームワークであり、学習前後のモデル予測を利用して、忘れ、保持、見えないセットを識別する。
5つの最先端の未学習アルゴリズムと6つの実世界のデータセットに関する大規模な実験は、次のように示している。
一 未学習は、留置所に追加のプライバシーリスクを生じさせ、会員推理攻撃を受けやすくすることができる。
(ii)TC-UMIAは、幅広いモデルアーキテクチャ、データセット、MUアプローチで有効である。
攻撃の開始以外にも、TCK-UMIAが引き起こすプライバシーリスクを軽減するために、ラベルのみのアウトプット、ドロップアウト、差分プライバシーという3つの防衛メカニズムを厳格に評価しています。
以上の結果から,プライバシー保護とモデル精度の基本的なトレードオフが明らかとなった。
関連論文リスト
- Towards Benchmarking Privacy Vulnerabilities in Selective Forgetting with Large Language Models [28.389198065125314]
選択的な忘れ(マシンアンラーニングとも呼ばれる)は、プライバシとデータ削除タスクの約束を示している。
その約束にもかかわらず、選択的な忘れ物はプライバシーの懸念を生じさせる。
プライバシの脆弱性を選択的に評価するための、最初の包括的なベンチマークを示す。
論文 参考訳(メタデータ) (2025-12-19T20:04:06Z) - Dual-View Inference Attack: Machine Unlearning Amplifies Privacy Exposure [45.982793975877264]
我々は、保持データのプライバシーリスクに注目し、二重ビュー設定下での機械学習による脆弱性を明らかにする。
両モデルにブラックボックスクエリを用いて,保持データに対するメンバシップ情報を抽出するDVIAを提案する。
論文 参考訳(メタデータ) (2025-12-18T03:24:50Z) - Pseudo-Probability Unlearning: Towards Efficient and Privacy-Preserving Machine Unlearning [59.29849532966454]
本稿では,PseudoProbability Unlearning (PPU)を提案する。
提案手法は,最先端の手法に比べて20%以上の誤りを忘れる改善を実現している。
論文 参考訳(メタデータ) (2024-11-04T21:27:06Z) - Privacy Backdoors: Enhancing Membership Inference through Poisoning Pre-trained Models [112.48136829374741]
本稿では、プライバシーバックドア攻撃という新たな脆弱性を明らかにします。
被害者がバックドアモデルに微調整を行った場合、トレーニングデータは通常のモデルに微調整された場合よりも大幅に高い速度でリークされる。
我々の発見は、機械学習コミュニティにおける重要なプライバシー上の懸念を浮き彫りにし、オープンソースの事前訓練モデルの使用における安全性プロトコルの再評価を求めている。
論文 参考訳(メタデータ) (2024-04-01T16:50:54Z) - FewFedPIT: Towards Privacy-preserving and Few-shot Federated Instruction Tuning [54.26614091429253]
フェデレーション・インストラクション・チューニング(FedIT)は、複数のデータ所有者間で協調的なトレーニングを統合することで、有望なソリューションである。
FedITは、インストラクショナルデータの不足や、トレーニングデータ抽出攻撃への露出リスクなどの制限に直面している。
本稿では,FewFedPITを提案する。このFewFedPITは,フェデレートされた数ショット学習のプライバシー保護とモデル性能を同時に向上する。
論文 参考訳(メタデータ) (2024-03-10T08:41:22Z) - On the Privacy Effect of Data Enhancement via the Lens of Memorization [20.63044895680223]
我々は,記憶化という新たな視点からプライバシを調査することを提案する。
記憶のレンズを通して、以前デプロイされたMIAは、より高いプライバシーリスクを持つサンプルを特定する可能性が低いため、誤解を招く結果をもたらすことがわかった。
一般化ギャップとプライバシリークは, これまでの結果に比べて相関が低いことを示す。
論文 参考訳(メタデータ) (2022-08-17T13:02:17Z) - "You Can't Fix What You Can't Measure": Privately Measuring Demographic
Performance Disparities in Federated Learning [78.70083858195906]
グループメンバーシップのプライバシを保護しつつ,グループ間でのパフォーマンスの差異を測定するための,差分プライベートなメカニズムを提案する。
我々の結果は、以前の研究の示唆に反して、プライバシ保護は必ずしもフェデレーションモデルの性能格差の特定と矛盾しているわけではないことを示している。
論文 参考訳(メタデータ) (2022-06-24T09:46:43Z) - Sampling Attacks: Amplification of Membership Inference Attacks by
Repeated Queries [74.59376038272661]
本手法は,他の標準メンバーシップ相手と異なり,被害者モデルのスコアにアクセスできないような厳格な制限の下で動作可能な,新しいメンバーシップ推論手法であるサンプリングアタックを導入する。
ラベルのみを公開している被害者モデルでは,攻撃のサンプリングが引き続き可能であり,攻撃者はその性能の最大100%を回復できることを示す。
防衛においては,被害者モデルのトレーニング中の勾配摂動と予測時の出力摂動の形式で差分プライバシーを選択する。
論文 参考訳(メタデータ) (2020-09-01T12:54:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。