論文の概要: Auditing Machine Unlearning: A Systematic Research on Whether Models Truly Forget
- arxiv url: http://arxiv.org/abs/2606.16110v1
- Date: Mon, 15 Jun 2026 01:56:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 18:36:05.017959
- Title: Auditing Machine Unlearning: A Systematic Research on Whether Models Truly Forget
- Title(参考訳): 機械学習の学習 : モデルが真に忘れられるかどうかの体系的研究
- Authors: Dayong Ye, Tianqing Zhu, Ruiding Huang, Xinbo Fu, Jiayang Li, Bo Liu, Huan Huo, Wanlei Zhou,
- Abstract要約: 本稿では,機械学習のための実践的,汎用的な監査フレームワークを提案する。
本フレームワークは,スクラッチベースラインの再トレーニングの必要性を排除し,既存のメソッドの限界に対処する。
我々のフレームワークは、偽の未学習の試みに対して堅牢であることを示し、大きな言語モデルによく当てはまることを示す。
- 参考スコア(独自算出の注目度): 25.03537230361785
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Machine unlearning has been extensively studied in response to growing privacy concerns and regulatory requirements. However, auditing whether unlearning algorithms have truly erased the influence of specific data remains an open challenge. The lack of reliable and practical auditing mechanisms can lead to critical privacy risks, such as residual information leakage. This paper initiates a systematic investigation into whether existing unlearning algorithms can truly forget the designated data. We propose the first practical and general-purpose auditing framework for machine unlearning, inspired by the concept of proof of ignorance. Our framework addresses the key practicality limitations of existing methods by eliminating the need for retraining-from-scratch baselines, avoiding the training of large numbers of shadow models, and requiring no intrusive intervention in the original training process. To evaluate the effectiveness of our framework, we first conduct validation experiments to verify its soundness and completeness. We then perform comprehensive experiments across six datasets and ten representative unlearning methods. The results demonstrate that our framework reliably distinguishes between successful and failed unlearning. In particular, we observe that retraining-based and fine-tuning-based methods can achieve effective unlearning, even when the target data remain in the original dataset. In contrast, de-optimization-based methods fail to achieve true unlearning and instead degrade the model's performance. Fisher/Hessian-based methods also fail to unlearn requested data, even formal certification is provided. Moreover, we show that our framework is robust against fake unlearning attempts and generalizes well to large language models.
- Abstract(参考訳): マシン・アンラーニングは、プライバシーの懸念と規制要件の増大に対応するために広く研究されている。
しかし、未学習アルゴリズムが特定のデータの影響を本当に消したかどうかの監査は、依然としてオープンな課題である。
信頼性と実用的な監査機構の欠如は、情報漏洩などの重大なプライバシーリスクにつながる可能性がある。
本稿では、既存の未学習アルゴリズムが指定データを本当に忘れられるかどうかを体系的に調査する。
我々は,無知の証明の概念に触発された,機械学習のための実践的,汎用的な監査フレームワークを提案する。
本フレームワークは,スクラッチベースラインの再トレーニングの必要性を排除し,多数のシャドウモデルのトレーニングを回避し,本来のトレーニングプロセスに侵入的介入を必要とせず,既存の手法の重要な実用性制限に対処する。
本フレームワークの有効性を評価するため,まず,その健全性と完全性を検証するための検証実験を行った。
次に、6つのデータセットと10の代表的なアンラーニングメソッドにわたる総合的な実験を行います。
その結果、我々のフレームワークは、成功と失敗を確実に区別していることがわかった。
特に、ターゲットデータが元のデータセットに残されている場合でも、リトレーニングベースおよび微調整ベースの手法が効果的なアンラーニングを実現することを観察する。
対照的に、非最適化に基づく手法は真の未学習を達成できず、代わりにモデルの性能を低下させる。
Fisher/Hessian ベースの手法も要求されたデータを引き出すことができず、正式な認証も提供される。
さらに、我々のフレームワークは、偽の未学習の試みに対して堅牢であり、大規模言語モデルによく適応していることを示す。
関連論文リスト
- Towards Source-Free Machine Unlearning [21.529753312940276]
本稿では,学習を効率化するために重要な要素である未知のトレーニングデータのヘシアンを推定する手法を提案する。
提案手法は,ゼロショット・アンラーニングを効果的に行うとともに,アンラーニング性能に関する理論的確証を提供する。
論文 参考訳(メタデータ) (2025-08-20T23:29:51Z) - Rectifying Privacy and Efficacy Measurements in Machine Unlearning: A New Inference Attack Perspective [42.003102851493885]
本稿では,不正確な未学習手法の評価において重要なギャップに対処するため,RULI (Rectified Unlearning Evaluation Framework via Likelihood Inference)を提案する。
RULIは、未学習の有効性とプライバシリスクをサンプルごとの粒度で測定するために、二重目的攻撃を導入している。
既存の手法で過小評価されているプライバシーリスクを暴露し,最先端のアンラーニング手法の重大な脆弱性を明らかにした。
論文 参考訳(メタデータ) (2025-06-16T00:30:02Z) - Does Machine Unlearning Truly Remove Knowledge? [80.83986295685128]
本研究では,3つのベンチマークデータセット,6つのアンラーニングアルゴリズム,および5つのプロンプトベースの監査手法からなる,アンラーニング評価のための総合的な監査フレームワークを提案する。
異なるアンラーニング戦略の有効性とロバスト性を評価する。
論文 参考訳(メタデータ) (2025-05-29T09:19:07Z) - RESTOR: Knowledge Recovery in Machine Unlearning [71.75834077528305]
Webスケールコーパスでトレーニングされた大規模な言語モデルは、プライベートまたはセンシティブな情報を含むことができる。
このようなデータポイントの効果を排除するために、いくつかの機械学習アルゴリズムが提案されている。
機械学習評価のためのRESTORフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-31T20:54:35Z) - Learn while Unlearn: An Iterative Unlearning Framework for Generative Language Models [52.40798352740857]
3つのコアコンポーネントで構成されるICU(Iterative Contrastive Unlearning)フレームワークを紹介する。
知識未学習誘導モジュールは、未学習の損失を使用して、特定の知識を除去するためにターゲットとする。
Contrastive Learning Enhancementモジュールは、純粋な未学習の目標に対してモデルの表現力を保持する。
イテレーティブ・アンラーニング・リファインメントモジュールは、進行中の評価と更新を通じて、アンラーニングプロセスを動的に調整する。
論文 参考訳(メタデータ) (2024-07-25T07:09:35Z) - Silver Linings in the Shadows: Harnessing Membership Inference for Machine Unlearning [7.557226714828334]
ニューラルネットワークから特定のデータサンプルの影響を除去する新しい学習機構を提案する。
この目的を達成するために、我々は、ターゲットモデルの重みやアクティベーション値からプライバシーに敏感な情報を排除するための、新しい損失関数を構築した。
本研究の結果は,未学習の有効性とレイテンシ,および主課題の忠実度の観点から,我々のアプローチの優れた性能を示すものである。
論文 参考訳(メタデータ) (2024-07-01T00:20:26Z) - Towards Effective Evaluations and Comparisons for LLM Unlearning Methods [97.2995389188179]
本稿では,大規模言語モデルにおける機械学習評価の精度向上を図る。
評価指標の堅牢性と、競合する目標間のトレードオフという、2つの重要な課題に対処します。
論文 参考訳(メタデータ) (2024-06-13T14:41:00Z) - Learn What You Want to Unlearn: Unlearning Inversion Attacks against Machine Unlearning [16.809644622465086]
我々は、機械学習が未学習データの機密内容を漏洩させる範囲を理解するために、最初の調査を行う。
機械学習・アズ・ア・サービス・セッティングの下で、未学習サンプルの特徴とラベル情報を明らかにするアンラーニング・インバージョン・アタックを提案する。
実験結果から,提案攻撃は未学習データのセンシティブな情報を明らかにすることができることが示された。
論文 参考訳(メタデータ) (2024-04-04T06:37:46Z) - Towards Lifecycle Unlearning Commitment Management: Measuring Sample-level Approximate Unlearning Completeness [30.596695293390415]
本稿では, ライフサイクル・アンラーニング・コミットメント・マネジメント(LUCM)の課題について紹介する。
サンプルレベルの未学習完全性を評価するための効率的な指標を提案する。
このメトリクスは、未学習ライフサイクル全体を通して、未学習の異常を監視するツールとして機能することを示す。
論文 参考訳(メタデータ) (2024-03-19T15:37:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。