論文の概要: SoK: Unlearnability and Unlearning for Model Dememorization
- arxiv url: http://arxiv.org/abs/2605.11592v1
- Date: Tue, 12 May 2026 06:17:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.624614
- Title: SoK: Unlearnability and Unlearning for Model Dememorization
- Title(参考訳): SoK: モデル復号化のための未学習とアンラーニング
- Authors: Mengying Zhang, Derui Wang, Ruoxi Sun, Xiaoyu Xia, Shuang Hao, Minhui Xue,
- Abstract要約: 本稿では,非学習性と非学習性を利用したモデル復号化手法の初回統合分析について述べる。
筆者らの貢献は3つある: (i) 未学習でスケーラブルな未学習の手法を統一した分類学; (ii) 先進的な手法の堅牢性、インタープレイ、浅い復号化を明らかにする実証的評価; (iii) 認定未学習で処理されたモデルの復号化深度に関する最初の理論的保証。
- 参考スコア(独自算出の注目度): 19.145486704492324
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Advanced model dememorization methods, including availability poisoning (unlearnability) and machine unlearning, are emerging as key safeguards against data misuse in machine learning (ML). At the training stage, unlearnability embeds imperceptible perturbations into data before release to reduce learnability. At the post-training stage, unlearning removes previously acquired information from models to prevent unauthorized disclosure or use. While both defenses aim to preserve the right to withhold knowledge, their vulnerabilities and shared foundations remain unclear. Specifically, both unlearnability and unlearning suffer from issues such as shallow dememorization, leading to falsely claimed data learnability reduction or forgetting in the presence of weight perturbations. Moreover, input perturbations may affect the effectiveness of downstream unlearning, while unlearning may inadvertently recover domain knowledge hidden by unlearnability. This interplay calls for deeper investigation. Finally, there is a lack of formal guarantees to provide theoretical insights into current defenses against shallow dememorization. In this Systematization of Knowledge, we present the first integrated analysis of model dememorization approaches leveraging unlearnability and unlearning. Our contributions are threefold: (i) a unified taxonomy of unlearnability and scalable unlearning methods; (ii) an empirical evaluation revealing the robustness, interplay, and shallow dememorization of leading methods; and (iii) the first theoretical guarantee on dememorization depth for models processed through certified unlearning. These results lay the foundation for unifying dememorization mechanisms across the ML lifecycle to achieve a deeper immemor state for sensitive knowledge.
- Abstract(参考訳): 機械学習(ML)におけるデータ誤用に対するキーセーフガードとして、アベイラビリティ中毒(非学習性)やマシンアンラーニングなどの高度なモデル記憶法が登場している。
トレーニング段階では、非学習性はリリース前に知覚できない摂動をデータに埋め込んで学習性を減らす。
トレーニング後の段階では、アンラーニングは、未承認の開示や使用を防ぐために、以前取得した情報をモデルから削除する。
どちらの防衛も知識を守る権利を維持することを目的としているが、その脆弱性と共有基盤はいまだに不明である。
具体的には、未学習と未学習の両方が、浅い減記憶のような問題に悩まされ、データ学習可能性の低下や、重量摂動の存在を忘れてしまう。
さらに、入力摂動は下流のアンラーニングの有効性に影響しうるが、アンラーニングは必然的に未学習で隠されたドメイン知識を回復する可能性がある。
この対話はより深い調査を要求する。
最後に、浅い暗記に対する現在の防御に関する理論的な洞察を提供するための正式な保証が欠如している。
本稿では,非学習性と非学習性を利用したモデル復号化手法の初回統合分析について述べる。
私たちの貢献は3倍です。
一 学習不能でスケーラブルな学習方法の統一分類法
二 先行方法の堅牢性、相互行為及び浅度記憶を明らかにした経験的評価
(3)認定アンラーニングにより処理されたモデルの復号化深度に関する最初の理論的保証。
これらの結果から、MLライフサイクル全体にわたって記憶喪失のメカニズムを統一し、センシティブな知識に対して深い記憶状態を達成するための基礎を築いた。
関連論文リスト
- Robust Continual Unlearning against Knowledge Erosion and Forgetting Reversal [31.09301411794716]
機械学習は、人工知能において「忘れられる権利」を実現する上で重要な役割を果たす。
我々は、未学習を繰り返し実施するより現実的なシナリオにおいて、既存の未学習アルゴリズムを評価する。
我々は,データ保持のための表現安定性を維持しつつ,データ忘れのための負のロジットマージンを強制する,連続的アンラーニングフレームワークSAFERを提案する。
論文 参考訳(メタデータ) (2026-04-21T05:35:54Z) - ROKA: Robust Knowledge Unlearning against Adversaries [0.9236074230806578]
データ操作を必要とせず、知識汚染の結果を生かして、セキュリティクリティカルな予測に対するモデルの精度を乱す、新たな非学習誘発攻撃モデル、すなわち間接的非学習攻撃を導入する。
我々の研究は、未学習における知識保存の理論的保証を初めて提供するものである。ビジョントランスフォーマー、マルチモーダルモデル、および大規模言語モデルなど、様々な大規模モデルに対する評価は、Rokaが保持されたデータの正確性を維持しつつ、効果的に目標を解き放つことを示している。
論文 参考訳(メタデータ) (2026-02-28T03:30:39Z) - Auditing Language Model Unlearning via Information Decomposition [68.48660428111593]
部分的情報分解(PID)を用いたアンラーニング監査のための解釈可能な情報理論フレームワークを提案する。
非学習前後のモデル表現を比較することにより、相互情報と忘れられたデータとを別個の構成要素に分解し、未学習および残留知識の概念を定式化する。
我々の研究は、言語モデルのより安全なデプロイのための理論的洞察と実行可能なツールを提供する、アンラーニングのための原則付き表現レベル監査を導入している。
論文 参考訳(メタデータ) (2026-01-21T15:51:19Z) - Understanding the Dilemma of Unlearning for Large Language Models [50.54260066313032]
Unlearningは、大きな言語モデル(LLM)から特定の知識を取り除こうとしている。
提案するunPactは,帰納的帰属とコントリビューショントラッキングによるアンラーニングのための解釈可能なフレームワークである。
論文 参考訳(メタデータ) (2025-09-29T12:15:19Z) - Weight Factorization and Centralization for Continual Learning in Speech Recognition [55.63455095283984]
リハーサルのない多言語、言語に依存しない状態でモデルを継続的に訓練することは、破滅的な忘れを招きかねない。
人間の脳が覚醒サイクルを通じて知識を学習・統合する能力に着想を得て,継続的な学習手法を提案する。
論文 参考訳(メタデータ) (2025-06-19T19:59:24Z) - UniErase: Towards Balanced and Precise Unlearning in Language Models [69.04923022755547]
大規模言語モデル(LLM)は、古い情報問題に対処するために反復的な更新を必要とする。
UniEraseは、知識の未学習と能力保持の間の精度とバランスの取れたパフォーマンスを示す、新しいアンラーニングフレームワークである。
論文 参考訳(メタデータ) (2025-05-21T15:53:28Z) - Verifying Robust Unlearning: Probing Residual Knowledge in Unlearned Models [10.041289551532804]
本稿では,ロバスト・アンラーニングの概念を導入し,モデルの再学習と敵の回復に対する抵抗性を確実にする。
アンラーニング手法がこのセキュリティ基準を満たしているかどうかを実証的に評価するために,アンラーニングマッピング攻撃(UMA)を提案する。
UMAは、敵クエリを使って忘れられたトレースのモデルを積極的に探索する。
論文 参考訳(メタデータ) (2025-04-21T01:56:15Z) - Towards Robust Knowledge Unlearning: An Adversarial Framework for Assessing and Improving Unlearning Robustness in Large Language Models [19.015202590038996]
我々は、未学習モデルを攻撃する動的かつ自動化されたフレームワークであるDynamic Unlearning Attack (DUA)を設計する。
学習過程の堅牢性を効果的に向上する普遍的な枠組みであるLatent Adrial Unlearning (LAU)を提案する。
LAUは学習効率を53.5%以上改善し、近隣の知識の11.6%以下に減らし、モデルの一般的な能力にはほとんど影響を与えないことを示した。
論文 参考訳(メタデータ) (2024-08-20T09:36:04Z) - Learn while Unlearn: An Iterative Unlearning Framework for Generative Language Models [52.40798352740857]
3つのコアコンポーネントで構成されるICU(Iterative Contrastive Unlearning)フレームワークを紹介する。
知識未学習誘導モジュールは、未学習の損失を使用して、特定の知識を除去するためにターゲットとする。
Contrastive Learning Enhancementモジュールは、純粋な未学習の目標に対してモデルの表現力を保持する。
イテレーティブ・アンラーニング・リファインメントモジュールは、進行中の評価と更新を通じて、アンラーニングプロセスを動的に調整する。
論文 参考訳(メタデータ) (2024-07-25T07:09:35Z) - UnUnlearning: Unlearning is not sufficient for content regulation in advanced generative AI [50.61495097098296]
大規模言語モデル(LLM)におけるアンラーニングのパラダイムを再考する。
未学習の概念を導入し、未学習の知識を文脈内で再導入する。
我々は、不寛容な知識に対するコンテンツフィルタリングが不可欠であり、正確な未学習スキームでさえ、効果的なコンテンツ規制には不十分であると主張している。
論文 参考訳(メタデータ) (2024-06-27T10:24:35Z) - Learn What You Want to Unlearn: Unlearning Inversion Attacks against Machine Unlearning [16.809644622465086]
我々は、機械学習が未学習データの機密内容を漏洩させる範囲を理解するために、最初の調査を行う。
機械学習・アズ・ア・サービス・セッティングの下で、未学習サンプルの特徴とラベル情報を明らかにするアンラーニング・インバージョン・アタックを提案する。
実験結果から,提案攻撃は未学習データのセンシティブな情報を明らかにすることができることが示された。
論文 参考訳(メタデータ) (2024-04-04T06:37:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。