論文の概要: Mass Concept Erasure in Diffusion Models with Concept Hierarchy
- arxiv url: http://arxiv.org/abs/2601.03305v1
- Date: Tue, 06 Jan 2026 08:41:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-08 18:12:46.042156
- Title: Mass Concept Erasure in Diffusion Models with Concept Hierarchy
- Title(参考訳): 概念階層を伴う拡散モデルにおける質量概念の消去
- Authors: Jiahang Tu, Ye Li, Yiming Wu, Hanbin Zhao, Chao Zhang, Hui Qian,
- Abstract要約: 消去された概念を親子構造に整理するスーパータイプサブタイプ概念階層を提案する。
概念を個別に消去するのではなく,効果的かつ効率的なグループワイド抑制手法を導入する。
さまざまな領域にまたがる概念の同時消去を必要とする、より困難なベンチマークを構築します。
- 参考スコア(独自算出の注目度): 19.349576384727737
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The success of diffusion models has raised concerns about the generation of unsafe or harmful content, prompting concept erasure approaches that fine-tune modules to suppress specific concepts while preserving general generative capabilities. However, as the number of erased concepts grows, these methods often become inefficient and ineffective, since each concept requires a separate set of fine-tuned parameters and may degrade the overall generation quality. In this work, we propose a supertype-subtype concept hierarchy that organizes erased concepts into a parent-child structure. Each erased concept is treated as a child node, and semantically related concepts (e.g., macaw, and bald eagle) are grouped under a shared parent node, referred to as a supertype concept (e.g., bird). Rather than erasing concepts individually, we introduce an effective and efficient group-wise suppression method, where semantically similar concepts are grouped and erased jointly by sharing a single set of learnable parameters. During the erasure phase, standard diffusion regularization is applied to preserve denoising process in unmasked regions. To mitigate the degradation of supertype generation caused by excessive erasure of semantically related subtypes, we propose a novel method called Supertype-Preserving Low-Rank Adaptation (SuPLoRA), which encodes the supertype concept information in the frozen down-projection matrix and updates only the up-projection matrix during erasure. Theoretical analysis demonstrates the effectiveness of SuPLoRA in mitigating generation performance degradation. We construct a more challenging benchmark that requires simultaneous erasure of concepts across diverse domains, including celebrities, objects, and pornographic content.
- Abstract(参考訳): 拡散モデルの成功は、安全でない、有害なコンテンツの生成に対する懸念を提起し、一般的な生成能力を保ちながら特定の概念を抑えるための概念消去アプローチを促した。
しかしながら、消去された概念の数が増加するにつれて、各概念は個別に調整されたパラメータを必要とし、全体の生成品質を低下させるため、これらの手法は効率が悪く非効率になることが多い。
本研究では,消去された概念を親子構造に整理するスーパータイプサブタイプ概念階層を提案する。
それぞれの消去された概念は子ノードとして扱われ、意味的に関連する概念(eg , macaw, ハゲワシ)は共有親ノードの下にグループ化され、スーパータイプの概念(eg , bird)と呼ばれる。
概念を個々に消去するのではなく,一組の学習可能なパラメータを共有することで,意味論的に類似した概念をグループ化し,共同で消去する,効果的かつ効率的なグループワイド抑制手法を導入する。
消去段階では, 標準的な拡散正則化を適用し, 脱臭過程の保存を行う。
意味的に関連したサブタイプの過剰消去によるスーパータイプ生成の劣化を軽減するために,凍結したダウンプロジェクションマトリックスのスーパータイプ概念情報をエンコードし,消去中のアッププロジェクションマトリックスのみを更新する,Supertype-Preserving Low-Rank Adaptation (SuPLoRA) と呼ばれる新しい手法を提案する。
理論解析は、SuPLoRAが生成性能劣化を緩和する効果を示す。
我々は、有名人、オブジェクト、ポルノコンテンツなど、さまざまな領域にまたがる概念の同時消去を必要とする、より困難なベンチマークを構築します。
関連論文リスト
- SAGE: Exploring the Boundaries of Unsafe Concept Domain with Semantic-Augment Erasing [65.82241040239452]
望ましくない概念に微妙な重みを消去する概念。
既存の方法は、安全でない概念を固定語として扱い、繰り返し消去する。
本稿では,概念語消去を概念ドメイン消去に変換する意味拡張消去について紹介する。
論文 参考訳(メタデータ) (2025-06-11T03:21:24Z) - Erased or Dormant? Rethinking Concept Erasure Through Reversibility [6.895055915600732]
我々は、統一概念編集と消去安定拡散という2つの代表的な概念消去手法を評価する。
消去された概念は、最小限の適応の後、しばしばかなりの視覚的忠実度で再帰することを示す。
本研究は,既存の概念消去アプローチにおける限界を明らかにするものである。
論文 参考訳(メタデータ) (2025-05-22T03:26:46Z) - Fine-Grained Erasure in Text-to-Image Diffusion-based Foundation Models [56.35484513848296]
FADE(Fine grained Attenuation for Diffusion Erasure)は、テキストから画像への生成モデルのための非学習アルゴリズムである。
関連する概念に最小限の影響で目標概念を排除し、最先端の手法よりも保持性能が12%向上した。
論文 参考訳(メタデータ) (2025-03-25T15:49:48Z) - Fantastic Targets for Concept Erasure in Diffusion Models and Where To Find Them [21.386640828092524]
概念消去は拡散モデルにおける有害なコンテンツ生成のリスクを軽減するための有望な手法として現れてきた。
本稿では,各望ましくない概念に合わせて最適な目標概念を動的に選択するAdaptive Guided Erasure (AGE)法を提案する。
その結果, AGEは, 有効消去性能を維持しつつ, 無関係な概念を保存し, 最先端の消去手法を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2025-01-31T08:17:23Z) - RealEra: Semantic-level Concept Erasure via Neighbor-Concept Mining [25.769144703607214]
概念消去は、モデルが保護され不適切な概念に関する知識を取り除くために提案されている。
この「概念残余」問題に対処するためにRealEraを提案する。
また,RealEraは,有効性,特異性,汎用性において,従来の消去方法よりも優れていたことを示す。
論文 参考訳(メタデータ) (2024-10-11T17:55:30Z) - Reliable and Efficient Concept Erasure of Text-to-Image Diffusion Models [76.39651111467832]
本稿では,Reliable and Efficient Concept Erasure (RECE)を提案する。
派生した埋め込みによって表現される不適切なコンテンツを緩和するために、RECEはそれらをクロスアテンション層における無害な概念と整合させる。
新たな表現埋め込みの導出と消去を反復的に行い、不適切な概念の徹底的な消去を実現する。
論文 参考訳(メタデータ) (2024-07-17T08:04:28Z) - Separable Multi-Concept Erasure from Diffusion Models [52.51972530398691]
大規模拡散モデルから安全でない概念を排除するために,分離可能なマルチコンセプト消去器(SepME)を提案する。
後者は最適化可能なモデルウェイトを分離し、各ウェイトインクリメントは特定の概念の消去に対応する。
広範囲にわたる実験は, 概念の排除, モデル性能の保存, 各種概念の消去・回復における柔軟性の確保に, アプローチの有効性を示すものである。
論文 参考訳(メタデータ) (2024-02-03T11:10:57Z) - Implicit Concept Removal of Diffusion Models [92.55152501707995]
テキスト・ツー・イメージ(T2I)拡散モデルはしばしば、透かしや安全でない画像のような望ましくない概念を不注意に生成する。
幾何学駆動制御に基づく新しい概念除去手法であるGeom-Erasingを提案する。
論文 参考訳(メタデータ) (2023-10-09T17:13:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。