Fugu-MT 論文翻訳(概要): TOFU: A Task of Fictitious Unlearning for LLMs

論文の概要: TOFU: A Task of Fictitious Unlearning for LLMs

arxiv url: http://arxiv.org/abs/2401.06121v1
Date: Thu, 11 Jan 2024 18:57:12 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-12 13:11:13.603485
Title: TOFU: A Task of Fictitious Unlearning for LLMs
Title（参考訳）: TOFU:LLMの架空のアンラーニングの課題
Authors: Pratyush Maini, Zhili Feng, Avi Schwarzschild, Zachary C. Lipton, J. Zico Kolter
Abstract要約: Webからの大量のコーパスに基づいてトレーニングされた大規模な言語モデルは、法的および倫理的懸念を提起する機密データやプライベートデータを再現することができる。トレーニングデータに存在する情報を忘れるためにモデルをチューニングするアンラーニングは、トレーニング後のプライベートデータを保護する手段を提供する。未学習の理解を深めるためのベンチマークであるTOFUを紹介する。
参考スコア（独自算出の注目度）: 99.92305790945507
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large language models trained on massive corpora of data from the web can memorize and reproduce sensitive or private data raising both legal and ethical concerns. Unlearning, or tuning models to forget information present in their training data, provides us with a way to protect private data after training. Although several methods exist for such unlearning, it is unclear to what extent they result in models equivalent to those where the data to be forgotten was never learned in the first place. To address this challenge, we present TOFU, a Task of Fictitious Unlearning, as a benchmark aimed at helping deepen our understanding of unlearning. We offer a dataset of 200 diverse synthetic author profiles, each consisting of 20 question-answer pairs, and a subset of these profiles called the forget set that serves as the target for unlearning. We compile a suite of metrics that work together to provide a holistic picture of unlearning efficacy. Finally, we provide a set of baseline results from existing unlearning algorithms. Importantly, none of the baselines we consider show effective unlearning motivating continued efforts to develop approaches for unlearning that effectively tune models so that they truly behave as if they were never trained on the forget data at all.
Abstract（参考訳）: Webからの大量のデータコーパスに基づいてトレーニングされた大規模な言語モデルは、法的および倫理的懸念を提起する機密データやプライベートデータを記憶し、再現することができる。トレーニングデータに存在する情報を忘れるためにモデルをチューニングするアンラーニングは、トレーニング後のプライベートデータを保護する手段を提供する。このような未学習の手法はいくつか存在するが、そもそも忘れるべきデータが決して学習されなかったものと同等のモデルが得られるかは定かではない。この課題に対処するために、未学習の理解を深めるためのベンチマークとして、Factitious UnlearningのタスクであるTOFUを紹介します。我々は200種類の多彩な合成著者プロファイルのデータセットを提供し、それぞれが20の質問応答ペアで構成され、これらのプロファイルのサブセットは、未学習のターゲットとして機能します。非学習の有効性の全体像を提供するために、一緒に働くメトリクスの集合をコンパイルする。最後に、既存の未学習アルゴリズムのベースライン結果のセットを提供する。重要なのは、私たちが検討しているベースラインのどれも、モデルを効果的にチューニングするアンラーニングのアプローチを開発するための効果的なアンラーニングのモチベーションを示していないことです。

関連論文リスト

Not All Data Are Unlearned Equally [30.936702475759688]
未学習の成功は、モデルの事前学習データにおいて、学習したい知識の頻度に依存するかを検討する。確率と生成に基づくアンラーニング評価のミスアライメントを発見し、モデルが大きくなるにつれてこの問題が悪化することを示す。
論文参考訳（メタデータ） (2025-04-07T13:29:02Z)
RESTOR: Knowledge Recovery through Machine Unlearning [71.75834077528305]
Webスケールコーパスでトレーニングされた大規模な言語モデルは、望ましくないデータポイントを記憶することができる。訓練されたモデルからこれらのデータポイントを「消去」することを目的とした、多くの機械学習手法が提案されている。以下に示す次元に基づいて,機械学習のためのRESTORフレームワークを提案する。
論文参考訳（メタデータ） (2024-10-31T20:54:35Z)
CodeUnlearn: Amortized Zero-Shot Machine Unlearning in Language Models Using Discrete Concept [5.345828824625758]
コードブック機能とスパースオートエンコーダ(SAEs)を用いた新しいアンラーニング手法を提案する。ボトルネックを利用して、アクティベーション空間を分解し、情報の流れを規制することにより、モデルの性能を無関係なデータに保ちながら、ターゲットとなる情報を効率的に解き放つ。
論文参考訳（メタデータ） (2024-10-08T10:26:22Z)
Unlearning Personal Data from a Single Image [38.36863497458095]
機械学習は、トレーニング中にデータを見たことがなかったかのように、モデルからデータを消去することを目的としている。現在、そのようなシナリオにおけるアンラーニング手法の有効性を調査するための設定やベンチマークは存在しない。トレーニングデータが入手できない場合の未学習モデルを評価する1-SHUI(One-Shot Unlearning of Personal Identities)を提案する。
論文参考訳（メタデータ） (2024-07-16T10:00:54Z)
MUSE: Machine Unlearning Six-Way Evaluation for Language Models [109.76505405962783]
言語モデル(LM)は、プライベートおよび著作権のあるコンテンツを含む大量のテキストデータに基づいて訓練される。総合的な機械学習評価ベンチマークであるMUSEを提案する。人気のある8つのアンラーニングアルゴリズムがハリー・ポッターの本やニュース記事をいかに効果的に解き放つかをベンチマークする。
論文参考訳（メタデータ） (2024-07-08T23:47:29Z)
The Frontier of Data Erasure: Machine Unlearning for Large Language Models [56.26002631481726]
大規模言語モデル(LLM)はAIの進歩の基礎となっている。 LLMは機密情報、偏見情報、著作権情報を記憶し、広めることによってリスクを生じさせる。機械学習は、これらの懸念を軽減するための最先端のソリューションとして現れます。
論文参考訳（メタデータ） (2024-03-23T09:26:15Z)
Learn to Unlearn for Deep Neural Networks: Minimizing Unlearning Interference with Gradient Projection [56.292071534857946]
最近のデータプライバシ法は、機械学習への関心を喚起している。課題は、残りのデータセットに関する知識を変更することなく、忘れたデータに関する情報を捨てることである。我々は、プロジェクテッド・グラディエント・アンラーニング(PGU)という、プロジェクテッド・グラディエント・ベースの学習手法を採用する。トレーニングデータセットがもはやアクセスできない場合でも、スクラッチからスクラッチで再トレーニングされたモデルと同じような振る舞いをするモデルを、我々のアンラーニング手法が生成できることを実証するための実証的な証拠を提供する。
論文参考訳（メタデータ） (2023-12-07T07:17:24Z)
Unlearn What You Want to Forget: Efficient Unlearning for LLMs [92.51670143929056]
大規模言語モデル(LLM)は、幅広いテキストデータを事前学習し記憶することで大きな進歩を遂げた。このプロセスはプライバシー問題やデータ保護規則違反に悩まされる可能性がある。データ削除後のモデル全体を再トレーニングすることなく、LLMを効率的に更新できる効率的なアンラーニングフレームワークを提案する。
論文参考訳（メタデータ） (2023-10-31T03:35:59Z)
Class-wise Federated Unlearning: Harnessing Active Forgetting with Teacher-Student Memory Generation [11.638683787598817]
能動的忘れ込みに基づく神経刺激型フェデレーション・アンラーニング・フレームワークを提案する。我々のフレームワークは、新しい記憶を利用して古い記憶を上書きすることで、既存の方法と差別化している。本手法は,バックドア攻撃に対する未学習の完全性を実現する。
論文参考訳（メタデータ） (2023-07-07T03:07:26Z)
Federated Unlearning with Knowledge Distillation [9.666514931140707]
フェデレートラーニング(FL)は、トレーニングプロセス中に各クライアントのデータプライバシを保護するように設計されている。忘れられる権利に関する最近の法律では、FLモデルが各クライアントから学んだことを忘れる能力を持つことが不可欠である。モデルから蓄積した履歴更新を減じることで,クライアントの貢献を解消する,新たなフェデレーション付きアンラーニング手法を提案する。
論文参考訳（メタデータ） (2022-01-24T03:56:20Z)
Machine Unlearning of Features and Labels [72.81914952849334]
機械学習モデルにおけるアンラーニングとラベルのファーストシナリオを提案する。提案手法は,影響関数の概念に基づいて,モデルパラメータのクローズドフォーム更新によるアンラーニングを実現する。
論文参考訳（メタデータ） (2021-08-26T04:42:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。