論文の概要: Mitigating Privacy Risk via Forget Set-Free Unlearning
- arxiv url: http://arxiv.org/abs/2604.10636v1
- Date: Sun, 12 Apr 2026 13:24:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.142476
- Title: Mitigating Privacy Risk via Forget Set-Free Unlearning
- Title(参考訳): 設定不要のアンラーニングによるプライバシリスクの軽減
- Authors: Aviraj Newatia, Michael Cooper, Viet Nguyen, Rahul G. Krishnan,
- Abstract要約: 機械学習モデルのトレーニングには、機密データやプライベートデータを含む大規模なデータセットの保存が必要である。
本研究では,学習の補助的情報を活用する部分盲検アンラーニングを導入する。
リロードは効率よく解き、スクラッチから再トレーニングされたモデルを近似し、セット依存のアプローチよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 11.615403193858503
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training machine learning models requires the storage of large datasets, which often contain sensitive or private data. Storing data is associated with a number of potential risks which increase over time, such as database breaches and malicious adversaries. Machine unlearning is the study of methods to efficiently remove the influence of training data subsets from previously-trained models. Existing unlearning methods typically require direct access to the "forget set" -- the data to be forgotten-and organisations must retain this data for unlearning rather than deleting it immediately upon request, increasing risks associated with the forget set. We introduce partially-blind unlearning -- utilizing auxiliary information to unlearn without explicit access to the forget set. We also propose a practical framework Reload, a partially-blind method based on gradient optimization and structured weight sparsification to operationalize partially-blind unlearning. We show that Reload efficiently unlearns, approximating models retrained from scratch, and outperforms several forget set-dependent approaches. On language models, Reload unlearns entities using <0.025% of the retain set and <7% of model weights in <8 minutes on Llama2-7B. In the corrective case, Reload achieves unlearning even when only 10% of corrupted data is identified.
- Abstract(参考訳): 機械学習モデルのトレーニングには、機密データやプライベートデータを含む大規模なデータセットの保存が必要である。
データをストアすることは、データベースの侵入や悪意のある敵など、時間とともに増加する潜在的なリスクに関連付けられている。
機械学習は、以前に訓練されたモデルからトレーニングデータサブセットの影響を効率的に除去する手法の研究である。
既存の未学習のメソッドは、通常、"ターゲットセット"に直接アクセスする必要があります -- 忘れるべきデータと組織は、要求の直後に削除するのではなく、このデータをアンラーニング用に保持し、忘れセットに関連するリスクを増大させなければなりません。
一部盲検アンラーニング(英語版)を導入し、補助情報を利用して、忘れ物セットに明示的にアクセスすることなく、未学習に活用する。
また、勾配最適化と構造的重み空間化に基づく部分盲検学習を運用する部分盲検手法である実践的フレームワークReloadを提案する。
リロードは効率よく解き、スクラッチから再トレーニングされたモデルを近似し、セット依存のアプローチよりも優れていることを示す。
言語モデルでは、Reloadはretainセットの0.025%とモデルウェイトの7%を使って、Llama2-7Bで<8分で非学習エンティティをロードする。
修正の場合、Reloadは、破損したデータの10%しか特定されていない場合でも、未学習を実現する。
関連論文リスト
- Reveal and Release: Iterative LLM Unlearning with Self-generated Data [5.932877449308903]
本稿では,自己生成データで学習するReveal-and-Release'法を提案する。
モデルの重み空間をパラメータ効率のよいモジュールで漸進的に調整する。
論文 参考訳(メタデータ) (2025-09-18T05:07:27Z) - NOVO: Unlearning-Compliant Vision Transformers [17.810044173023474]
pnameは、要求されたセットを微調整することなく、将来の未学習リクエストに対してアンラーニングを実行することができる。
キーを取り除き、オンザフライで学習し、パフォーマンスの劣化を避けることで、フォーミングを実現する。
論文 参考訳(メタデータ) (2025-07-04T04:12:34Z) - TOFU: A Task of Fictitious Unlearning for LLMs [99.92305790945507]
Webからの大量のコーパスに基づいてトレーニングされた大規模な言語モデルは、法的および倫理的懸念を提起する機密データやプライベートデータを再現することができる。
トレーニングデータに存在する情報を忘れるためにモデルをチューニングするアンラーニングは、トレーニング後のプライベートデータを保護する手段を提供する。
未学習の理解を深めるためのベンチマークであるTOFUを紹介する。
論文 参考訳(メタデータ) (2024-01-11T18:57:12Z) - Fast Machine Unlearning Without Retraining Through Selective Synaptic
Dampening [51.34904967046097]
Selective Synaptic Dampening (SSD)は高速で、訓練データの長期保存を必要としない。
高速で性能が高く,トレーニングデータの長期保存を必要としない,新しい2段階のポストホック,リトレーニングフリーなマシンアンラーニング手法を提案する。
論文 参考訳(メタデータ) (2023-08-15T11:30:45Z) - Class-wise Federated Unlearning: Harnessing Active Forgetting with Teacher-Student Memory Generation [11.638683787598817]
能動的忘れ込みに基づく神経刺激型フェデレーション・アンラーニング・フレームワークを提案する。
我々のフレームワークは、新しい記憶を利用して古い記憶を上書きすることで、既存の方法と差別化している。
本手法は,バックドア攻撃に対する未学習の完全性を実現する。
論文 参考訳(メタデータ) (2023-07-07T03:07:26Z) - Learning to Unlearn: Instance-wise Unlearning for Pre-trained
Classifiers [71.70205894168039]
そこでは、事前訓練されたモデルからインスタンスのセットに関する情報を削除することを目標としています。
本稿では,1)表現レベルでの忘れを克服するために,敵の例を活用すること,2)不必要な情報を伝播するネットワークパラメータをピンポイントする重み付け指標を活用すること,の2つの方法を提案する。
論文 参考訳(メタデータ) (2023-01-27T07:53:50Z) - Machine Unlearning of Features and Labels [72.81914952849334]
機械学習モデルにおけるアンラーニングとラベルのファーストシナリオを提案する。
提案手法は,影響関数の概念に基づいて,モデルパラメータのクローズドフォーム更新によるアンラーニングを実現する。
論文 参考訳(メタデータ) (2021-08-26T04:42:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。