Fugu-MT 論文翻訳(概要): Data Unlearning in Diffusion Models

論文の概要: Data Unlearning in Diffusion Models

arxiv url: http://arxiv.org/abs/2503.01034v1
Date: Sun, 02 Mar 2025 21:36:04 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-05 18:50:37.743347
Title: Data Unlearning in Diffusion Models
Title（参考訳）: 拡散モデルにおけるデータアンラーニング
Authors: Silas Alberti, Kenan Hasanaliyev, Manav Shah, Stefano Ermon,
Abstract要約: 汎用マシンアンラーニング技術は不安定であるか、あるいはデータを解き放たないかのどちらかであることが判明した。本稿では,重要サンプリングを利用して,理論的な保証をもってデータを学習する最初の方法であるSubtracted Importance Smpled Scores (SISS) と呼ばれる新たな損失関数群を提案する。
参考スコア（独自算出の注目度）: 44.99833362998488
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent work has shown that diffusion models memorize and reproduce training data examples. At the same time, large copyright lawsuits and legislation such as GDPR have highlighted the need for erasing datapoints from diffusion models. However, retraining from scratch is often too expensive. This motivates the setting of data unlearning, i.e., the study of efficient techniques for unlearning specific datapoints from the training set. Existing concept unlearning techniques require an anchor prompt/class/distribution to guide unlearning, which is not available in the data unlearning setting. General-purpose machine unlearning techniques were found to be either unstable or failed to unlearn data. We therefore propose a family of new loss functions called Subtracted Importance Sampled Scores (SISS) that utilize importance sampling and are the first method to unlearn data with theoretical guarantees. SISS is constructed as a weighted combination between simpler objectives that are responsible for preserving model quality and unlearning the targeted datapoints. When evaluated on CelebA-HQ and MNIST, SISS achieved Pareto optimality along the quality and unlearning strength dimensions. On Stable Diffusion, SISS successfully mitigated memorization on nearly 90% of the prompts we tested.
Abstract（参考訳）: 近年の研究では、拡散モデルがトレーニングデータの例を記憶し、再現していることが示されている。同時に、GDPRのような大規模な著作権訴訟や法律は、拡散モデルからデータポイントを消去する必要性を強調している。しかし、スクラッチからのトレーニングは高価すぎることが多い。これはデータアンラーニングの設定、すなわちトレーニングセットから特定のデータポイントをアンラーニングするための効率的な技術の研究を動機付けている。既存の概念的アンラーニング技術では、アンカープロンプト/クラス/ディストリビューションが必要で、アンラーニングはデータアンラーニング環境では利用できない。汎用マシンアンラーニング技術は不安定であるか、あるいはデータを解き放たないかのどちらかであることが判明した。そこで本稿では, 重要サンプリングを利用した新たな損失関数群であるSubtracted Importance Smpled Scores (SISS)を提案する。 SISSは、モデルの品質を維持するための単純な目的と、対象とするデータポイントを学習しないという、重み付けされた組み合わせとして構築されている。 CelebA-HQとMNISTで評価すると、SISSは品質と未学習の強度次元に沿ってパレート最適性を達成した。安定拡散では、SISSは我々がテストしたプロンプトの90%近くで記憶を緩和することに成功しました。

関連論文リスト

FaLW: A Forgetting-aware Loss Reweighting for Long-tailed Unlearning [24.734154431191538]
FaLWはプラグアンドプレイの動的損失再重み付け方式である。各サンプルの未学習状態を、その予測確率と同一クラスからの未学習データの分布を比較して評価する。実験により、FaLWは優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2026-01-26T16:21:01Z)
PRUNE: A Patching Based Repair Framework for Certifiable Unlearning of Neural Networks [3.2845881871629095]
トレーニングされたニューラルネットワークモデルからトレーニングデータの特定の部分(すなわち未学習)を取り除くことが望ましい。既存のアンラーニング手法では、残ったデータで代替モデルを訓練する。我々は、要求されたデータのターゲットの「偽造」を除去するために、元のニューラルネットワークに慎重に構築された「パッチ」を付与して、新しいアンラーニングアプローチを提案する。
論文参考訳（メタデータ） (2025-05-10T05:35:08Z)
FUNU: Boosting Machine Unlearning Efficiency by Filtering Unnecessary Unlearning [9.472692023087223]
本研究では不必要な未学習につながるデータポイントを同定するFUNUを提案する。 FUNUの理論的解析を行い,その有効性を検証するための広範囲な実験を行った。
論文参考訳（メタデータ） (2025-01-28T01:19:07Z)
Partially Blinded Unlearning: Class Unlearning for Deep Networks a Bayesian Perspective [4.31734012105466]
マシン・アンラーニング(英: Machine Unlearning)とは、特定のデータセットやクラスに指定された情報を事前訓練されたモデルから選択的に破棄するプロセスである。本研究では,事前学習した分類ネットワークから,特定の種類のデータに関連付けられた情報の目的的除去に適した手法を提案する。本手法は,従来の最先端の未学習手法を超越し,優れた有効性を示す。
論文参考訳（メタデータ） (2024-03-24T17:33:22Z)
An Information Theoretic Approach to Machine Unlearning [43.423418819707784]
AIやデータ規則に従うためには、トレーニングされた機械学習モデルからプライベートまたは著作権のある情報を忘れる必要性がますます高まっている。この研究では、ゼロショットのアンラーニングシナリオに対処し、未学習のアルゴリズムは、トレーニングされたモデルと忘れられるデータだけが与えられたデータを削除できなければならない。モデルの幾何に基づいて、単純だが原則化されたゼロショットアンラーニング法を導出する。
論文参考訳（メタデータ） (2024-02-02T13:33:30Z)
Learn to Unlearn for Deep Neural Networks: Minimizing Unlearning Interference with Gradient Projection [56.292071534857946]
最近のデータプライバシ法は、機械学習への関心を喚起している。課題は、残りのデータセットに関する知識を変更することなく、忘れたデータに関する情報を捨てることである。我々は、プロジェクテッド・グラディエント・アンラーニング(PGU)という、プロジェクテッド・グラディエント・ベースの学習手法を採用する。トレーニングデータセットがもはやアクセスできない場合でも、スクラッチからスクラッチで再トレーニングされたモデルと同じような振る舞いをするモデルを、我々のアンラーニング手法が生成できることを実証するための実証的な証拠を提供する。
論文参考訳（メタデータ） (2023-12-07T07:17:24Z)
Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文参考訳（メタデータ） (2023-11-29T05:33:28Z)
From Zero to Hero: Detecting Leaked Data through Synthetic Data Injection and Model Querying [10.919336198760808]
分類モデルの学習に使用される漏洩データを検出する新しい手法を提案する。 textscLDSSは、クラス分散の局所的なシフトによって特徴付けられる、少量の合成データを所有者のデータセットに注入する。これにより、モデルクエリ単独で、リークデータに基づいてトレーニングされたモデルの効果的な識別が可能になる。
論文参考訳（メタデータ） (2023-10-06T10:36:28Z)
Fast Machine Unlearning Without Retraining Through Selective Synaptic Dampening [51.34904967046097]
Selective Synaptic Dampening (SSD)は高速で、訓練データの長期保存を必要としない。高速で性能が高く,トレーニングデータの長期保存を必要としない,新しい2段階のポストホック,リトレーニングフリーなマシンアンラーニング手法を提案する。
論文参考訳（メタデータ） (2023-08-15T11:30:45Z)
CAFA: Class-Aware Feature Alignment for Test-Time Adaptation [50.26963784271912]
テスト時間適応(TTA)は、テスト時にラベルのないデータにモデルを適応させることによって、この問題に対処することを目的としている。本稿では,クラス認識特徴アライメント(CAFA, Class-Aware Feature Alignment)と呼ばれる単純な機能アライメント損失を提案する。
論文参考訳（メタデータ） (2022-06-01T03:02:07Z)
Zero-Shot Machine Unlearning [6.884272840652062]
現代のプライバシー規制は、市民に製品、サービス、企業によって忘れられる権利を与える。トレーニングプロセスやトレーニングサンプルに関連するデータは、未学習の目的のためにアクセスできない。本稿では, (a) 誤り最小化雑音と (b) ゲート付き知識伝達に基づくゼロショットマシンアンラーニングのための2つの新しい解を提案する。
論文参考訳（メタデータ） (2022-01-14T19:16:09Z)
Machine Unlearning of Features and Labels [72.81914952849334]
機械学習モデルにおけるアンラーニングとラベルのファーストシナリオを提案する。提案手法は,影響関数の概念に基づいて,モデルパラメータのクローズドフォーム更新によるアンラーニングを実現する。
論文参考訳（メタデータ） (2021-08-26T04:42:24Z)
Certifiable Machine Unlearning for Linear Models [1.484852576248587]
機械学習は、トレーニングされたトレーニングデータのサブセットが削除された後、機械学習(ML)モデルを更新するタスクである。本稿では,線形モデルに対する3つの非学習手法について実験的に検討する。
論文参考訳（メタデータ） (2021-06-29T05:05:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。