論文の概要: Is your algorithm unlearning or untraining?
- arxiv url: http://arxiv.org/abs/2604.07962v1
- Date: Thu, 09 Apr 2026 08:24:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.79915
- Title: Is your algorithm unlearning or untraining?
- Title(参考訳): あなたのアルゴリズムは学習していないのか、トレーニングしていないのか?
- Authors: Eleni Triantafillou, Ahmed Imtiaz Humayun, Monica Ribero, Alexander Matt Turner, Michael C. Mozer, Georgios Kaissis,
- Abstract要約: 我々は「アンラーニング」という用語は、2つの異なる問題定式化にまたがる異なる研究努力によって過負荷になっていると論じている。
図1に示すように、未学習と未学習の2つの概念を特定します。
本稿では,これらの問題の技術的定義と各文献で研究した問題設定について述べる。
- 参考スコア(独自算出の注目度): 57.25293122855155
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As models are getting larger and are trained on increasing amounts of data, there has been an explosion of interest into how we can ``delete'' specific data points or behaviours from a trained model, after the fact. This goal has been referred to as ``machine unlearning''. In this note, we argue that the term ``unlearning'' has been overloaded, with different research efforts spanning two distinct problem formulations, but without that distinction having been observed or acknowledged in the literature. This causes various issues, including ambiguity around when an algorithm is expected to work, use of inappropriate metrics and baselines when comparing different algorithms to one another, difficulty in interpreting results, as well as missed opportunities for pursuing critical research directions. In this note, we address this issue by establishing a fundamental distinction between two notions that we identify as \unlearning and \untraining, illustrated in Figure 1. In short, \untraining aims to reverse the effect of having trained on a given forget set, i.e. to remove the influence that that specific forget set examples had on the model during training. On the other hand, the goal of \unlearning is not just to remove the influence of those given examples, but to use those examples for the purpose of more broadly removing the entire underlying distribution from which those examples were sampled (e.g. the concept or behaviour that those examples represent). We discuss technical definitions of these problems and map problem settings studied in the literature to each. We hope to initiate discussions on disambiguating technical definitions and identify a set of overlooked research questions, as we believe that this a key missing step for accelerating progress in the field of ``unlearning''.
- Abstract(参考訳): モデルが大きくなり、データ量の増加にトレーニングされているため、後にトレーニングされたモデルから‘削除’した特定のデータポイントや振る舞いを、どのようにして‘削除’できるかという関心が爆発的に高まっている。
この目標を「機械の未学習」と呼ぶ。
本稿では,「アンラーニング」という用語は,2つの異なる問題の定式化にまたがる異なる研究努力を伴って過負荷となったが,その区別は文献で観察・認識されていないことを論じる。
これは、アルゴリズムがいつ機能すると予想されるかの曖昧さ、異なるアルゴリズムを互いに比較する際に不適切なメトリクスとベースラインの使用、結果の解釈が困難であること、重要な研究方向を追求する機会の欠如など、様々な問題を引き起こす。
本稿では、図1に示す「学習」と「訓練」という2つの概念の根本的な区別を確立することにより、この問題に対処する。
言い換えれば、'untraining' は与えられた忘れ物集合に対する訓練の効果、すなわち特定の忘れ物集合の例が訓練中にモデルに与えた影響を逆にすることを目的としている。
一方、‘未学習’の目的は、与えられた例の影響を除去するだけでなく、それらの例が示している概念や行動など、サンプルがサンプリングされた基礎的な分布全体をより広範囲に除去する目的のために、これらの例を使用することである。
本稿では,これらの問題の技術的定義と各文献で研究した問題設定について述べる。
我々は、技術的定義の曖昧化に関する議論を開始し、見落とされがちな研究課題の集合を識別し、これが'アンラーニング'分野の進歩を加速するための重要な欠落したステップであると信じている。
関連論文リスト
- FaLW: A Forgetting-aware Loss Reweighting for Long-tailed Unlearning [24.734154431191538]
FaLWはプラグアンドプレイの動的損失再重み付け方式である。
各サンプルの未学習状態を、その予測確率と同一クラスからの未学習データの分布を比較して評価する。
実験により、FaLWは優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2026-01-26T16:21:01Z) - SoK: Machine Unlearning for Large Language Models [14.88062383081161]
大規模言語モデル(LLM)アンラーニングは機械学習において重要なトピックとなっている。
未学習の意図に基づく新しい分類法を提案する。
論文 参考訳(メタデータ) (2025-06-10T20:30:39Z) - Adversarial Machine Unlearning [26.809123658470693]
本稿では,機械学習モデルに対する特定のトレーニングデータの影響を取り除くことを目的とした,機械学習の課題に焦点を当てた。
伝統的に、未学習アルゴリズムの開発は、ある種のプライバシー脅威である会員推論攻撃(MIA)と並行して実行される。
未学習アルゴリズムの設計にMIAを統合するゲーム理論フレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-11T20:07:22Z) - What makes unlearning hard and what to do about it [3.2140380913122195]
未学習の難易度と未学習アルゴリズムの性能に影響を及ぼす2つの要因を同定する。
筆者らは,Refined-Unlearning Meta-algorithm (RUM) というフレームワークを開発した。そのフレームワークは, (i) 異なる特徴により, 忘れセットを均質化されたサブセットに精製し, (ii) 既存のアルゴリズムを用いて各サブセットを学習し,最後に、全体的な忘れセットを学習したモデルを提供するメタアルゴリズムである。
論文 参考訳(メタデータ) (2024-06-03T12:14:47Z) - Mitigating Reversal Curse in Large Language Models via Semantic-aware Permutation Training [57.771940716189114]
我々は、大きな言語モデル(LLM)が「逆の呪い」に苦しむことを示す。
逆の呪いの根本原因は、訓練と推論の段階で異なる単語順にある。
この問題に対処するために,SPT(Semantic-Aware Permutation Training)を提案する。
論文 参考訳(メタデータ) (2024-03-01T18:55:20Z) - Ticketed Learning-Unlearning Schemes [57.89421552780526]
そこで我々は,学習のためのチケット付きモデルを提案する。
広義のコンセプトクラスに対して,空間効率のよいチケット付き学習スキームを提供する。
論文 参考訳(メタデータ) (2023-06-27T18:54:40Z) - The Extraordinary Failure of Complement Coercion Crowdsourcing [50.599433903377374]
クラウドソーシングは近年,言語アノテーションの収集を緩和し,スケールアップしている。
本研究の目的は,この現象の注釈付きデータを2つの既知のタスク – 明示的補完と自然言語推論 – に還元することで収集することである。
どちらの場合も、クラウドソーシングは合意のスコアが低かった。
論文 参考訳(メタデータ) (2020-10-12T19:04:04Z) - Learning What Makes a Difference from Counterfactual Examples and
Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。
我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。
このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2020-04-20T02:47:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。