論文の概要: CoreUnlearn: Rethinking Concept Unlearning through Disentangled Component-Level Erasure in Text-guided Diffusion Models
- arxiv url: http://arxiv.org/abs/2606.01658v1
- Date: Mon, 01 Jun 2026 04:09:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.968354
- Title: CoreUnlearn: Rethinking Concept Unlearning through Disentangled Component-Level Erasure in Text-guided Diffusion Models
- Title(参考訳): CoreUnlearn: テキスト誘導拡散モデルにおけるアンラーニングの概念の再考
- Authors: Mengnan Zhao, Lihe Zhang, Baocai Yin,
- Abstract要約: CoreUnlearnは、望ましくないコンセプトの消去クリティカルなコンポーネントを混乱させ、取り除くことを目的としている。
モデル全体のパフォーマンスへの影響を最小限に抑えて、効果的な概念消去を実現する。
- 参考スコア(独自算出の注目度): 72.22994966489551
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text guided diffusion models have revolutionized image synthesis but also raise ethical concerns, such as privacy violation and harmful content generation. To mitigate these issues, prevailing methods typically leverage an alignment mechanism, with predefined erasure references, to fine-tune pretrained model weights. However, these techniques are intrinsically limited by the representational capacity of textual space and display high sensitivity to the choice of predefined erasure references, e.g., suboptimal references may significantly affect the model utility preservation during erasure. To overcome these limitations, we introduce CoreUnlearn, aiming to disentangle and remove the erasure-critical component of the undesirable concept. Specifically, CoreUnlearn comprises a Component Extraction Module (CEM) and a Swap Disentangling Strategy (SDS). Guided by SDS, CEM is pre-trained to decompose concept embeddings into distinct component types. Leveraging this decomposition, CoreUnlearn then removes the erasure-critical component while retaining non-critical ones by fine-tuning model weights. Extensive experiments demonstrate that CoreUnlearn achieves effective concept erasure with minimal impact on overall model performance.
- Abstract(参考訳): テキスト誘導拡散モデルは画像合成に革命をもたらしたが、プライバシー侵害や有害なコンテンツ生成といった倫理的懸念も提起している。
これらの問題を緩和するために、一般的な方法は、事前に定義された消去参照を持つアライメント機構を、微調整された事前訓練されたモデルウェイトに活用する。
しかし,これらの手法はテキスト空間の表現能力によって本質的に制限されており,事前定義された消去基準の選択に対して高い感度を示す。
これらの制限を克服するため、私たちはCoreUnlearnを導入し、望ましくない概念の消去クリティカルなコンポーネントを解き放つことを目標にしています。
具体的には、CoreUnlearnはコンポーネント抽出モジュール(CEM)とSwarp Disentangling Strategy(SDS)から構成される。
SDSによってガイドされたCEMは、概念の埋め込みを異なるコンポーネントタイプに分解するために事前訓練されている。
この分解を活用して、CoreUnlearnは、モデルウェイトを微調整することで、非クリティカルなコンポーネントを保持しながら、消去クリティカルなコンポーネントを削除します。
大規模な実験では、CoreUnlearnはモデル全体のパフォーマンスに最小限の影響を伴って、効果的な概念消去を実現している。
関連論文リスト
- Erase at the Core: Representation Unlearning for Machine Unlearning [11.77697706755224]
Erase at the Core (EC)は、ネットワーク階層全体の忘れを強制するように設計されたフレームワークである。
ECは、深い教師付き学習を通じて、リザーブセット上の対照的なアンラーニングを、保持セットの保存と統合する。
ECはモデルに依存しず、既存の未学習メソッドにプラグインモジュールとして組み込むことができる。
論文 参考訳(メタデータ) (2026-02-05T06:54:44Z) - DyME: Dynamic Multi-Concept Erasure in Diffusion Models with Bi-Level Orthogonal LoRA Adaptation [11.480659591569308]
テキストから画像への拡散モデルは、著作権のあるスタイルを不注意に再現し、視覚的概念を保護し、法的および倫理的懸念を提起する。
概念消去は、微調整によってそのような概念を選択的に抑制することを目的とした安全保護として登場した。
我々は、軽量でコンセプト固有のLoRAアダプタを訓練し、推論に必要なものだけを動的に構成するオンデマンド消去フレームワークDyMEを提案する。
論文 参考訳(メタデータ) (2025-09-25T15:16:17Z) - CURE: Concept Unlearning via Orthogonal Representation Editing in Diffusion Models [7.68494752148263]
CUREは、事前訓練された拡散モデルの重み空間で直接動作する、トレーニング不要の概念未学習フレームワークである。
スペクトル消去器は、安全な属性を保持しながら、望ましくない概念に特有の特徴を特定し、分離する。
CUREは、対象とする芸術スタイル、オブジェクト、アイデンティティ、明示的なコンテンツに対して、より効率的で徹底的な除去を実現する。
論文 参考訳(メタデータ) (2025-05-19T03:53:06Z) - UPCORE: Utility-Preserving Coreset Selection for Balanced Unlearning [57.081646768835704]
ユーザ仕様や法的フレームワークは、しばしば、大きな言語モデル(LLM)を含む、事前訓練されたモデルから削除される情報を必要とする。
これは、既に訓練済みのモデルからデータポイントのセットを削除または"偽造"する必要がある。
本研究では,非学習時の副次的損傷を軽減するための手法に依存しないデータ選択フレームワークUPCOREを提案する。
論文 参考訳(メタデータ) (2025-02-20T22:51:10Z) - DuMo: Dual Encoder Modulation Network for Precise Concept Erasure [75.05165577219425]
非ターゲット概念に対する最小限の障害を伴う不適切なターゲット概念の正確な消去を実現するDuMo(Dual Encoder Modulation Network)を提案する。
提案手法は, 明示的コンテンツ消去, カートゥーン概念除去, アーティスティックスタイル消去における最先端性能を実現し, 代替手法よりも明らかに優れている。
論文 参考訳(メタデータ) (2025-01-02T07:47:34Z) - Reliable and Efficient Concept Erasure of Text-to-Image Diffusion Models [76.39651111467832]
本稿では,Reliable and Efficient Concept Erasure (RECE)を提案する。
派生した埋め込みによって表現される不適切なコンテンツを緩和するために、RECEはそれらをクロスアテンション層における無害な概念と整合させる。
新たな表現埋め込みの導出と消去を反復的に行い、不適切な概念の徹底的な消去を実現する。
論文 参考訳(メタデータ) (2024-07-17T08:04:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。