論文の概要: Orthogonal Concept Erasure for Diffusion Models
- arxiv url: http://arxiv.org/abs/2605.28902v1
- Date: Wed, 27 May 2026 15:58:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:55.039224
- Title: Orthogonal Concept Erasure for Diffusion Models
- Title(参考訳): 拡散モデルにおける直交的概念消去
- Authors: Yuhao Sun, Lingyun Yu, Haoxiang Xu, Fengyuan Miao, Zhuoer Xu, Hongtao Xie,
- Abstract要約: 概念消去は、拡散モデルにおける望ましくない、あるいは安全でないコンテンツを緩和するための有望なアプローチとして現れている。
我々は,編集に基づく消去を乗算パラメータ更新として再構成する直交概念消去(OCE)を提案する。
OCEは、パラメータに閉形式解から導出される層準変換を適用し、正確な概念消去を可能にする。
- 参考スコア(独自算出の注目度): 46.450614977061484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Concept erasure has emerged as a promising approach to mitigate undesired or unsafe content in diffusion models, yet existing methods still face significant limitations. While training-based methods are effective, their high computational cost limits scalability. Editing-based methods are more efficient and deployment-friendly, yet they struggle to simultaneously achieve precise concept erasure and preserve overall generative capacity. We identify this core limitation of the editing-based methods as reliance on additive parameter updates. Our empirical analysis reveals that concept semantics primarily depend on neuron direction rather than neuron magnitude, while overall generative capacity relies on the angular geometry of neurons. As additive updates inherently entangle direction, magnitude, and angular geometry, they inevitably introduce unintended interference between concept erasure and overall generation performance. To address this, we propose Orthogonal Concept Erasure (OCE), which reformulates editing-based erasure as multiplicative parameter updates from a geometric perspective. Specifically, OCE applies layer-wise orthogonal transformations derived from a closed-form solution to the parameters, enabling precise concept erasure while preserving the neuron magnitude and angular geometry. Furthermore, to address conflicting constraints in multi-concept erasure, OCE introduces a subspace-level objective with structured subspace manipulation, yielding a more effective and scalable erasure. Extensive experiments on single- and multi-concept erasure demonstrate that OCE outperforms existing methods in concept erasure and non-target preservation, erasing up to 100 concepts in 4.3 s. Code: https://github.com/HansSunY/OCE.
- Abstract(参考訳): 概念消去は、拡散モデルにおける望ましくない、あるいは安全でないコンテンツを緩和するための有望なアプローチとして現れてきたが、既存の手法は依然として重大な制限に直面している。
トレーニングベースの手法は有効であるが、その高い計算コストはスケーラビリティを制限している。
編集ベースの手法はより効率的でデプロイしやすいが、正確な概念の消去を同時に達成し、全体の生成能力を維持するのに苦労している。
我々は、この編集ベースのメソッドのコア制限を、追加パラメータの更新に依存するものとして識別する。
我々の経験的分析によると、概念意味論は主にニューロンの大きさよりもニューロンの方向に依存しているのに対し、全体的な生成能力はニューロンの角形状に依存している。
加法的更新は本質的に方向、大きさ、角形状が絡み合うため、必然的に概念の消去と全体的な生成性能の間に意図しない干渉をもたらす。
そこで我々は,幾何的な視点から,編集に基づく消去を乗算的パラメータ更新として再構成する直交概念消去(OCE)を提案する。
具体的には、OCEは閉形式解から導かれる層状直交変換をパラメータに適用し、ニューロンの大きさと角形状を保ちながら正確な概念消去を可能にする。
さらに、マルチコンセプト消去における競合する制約に対処するため、OCEは構造化されたサブスペース操作によるサブスペースレベルの目的を導入し、より効率的でスケーラブルな消去を実現する。
シングルコンセプトとマルチコンセプトの消去に関する大規模な実験により、OCEは概念消去と非ターゲット保存において既存の手法よりも優れており、4.3秒で最大100のコンセプトが消去されることを示した。
コード:https://github.com/HansSunY/OCE
関連論文リスト
- Closed-Form Concept Erasure via Double Projections [8.357438653110973]
概念消去は、生成モデルから望ましくない概念を取り除くプロセスである。
本稿では, 学習を伴わずに, 概念消去を解析的に実現する線形変換フレームワークを提案する。
我々の設計は、安全、効率的、理論に基づく概念除去のための決定論的かつ幾何学的に解釈可能な手順をもたらす。
論文 参考訳(メタデータ) (2026-04-11T05:06:15Z) - Zero-Residual Concept Erasure via Progressive Alignment in Text-to-Image Model [15.636542463543066]
概念消去は、事前訓練されたテキスト・ツー・イメージモデルがセマンティック・ハーミフルな概念に関連するコンテンツを生成するのを防ぐことを目的としている。
既存の手法は「非ゼロアライメント残差」による不完全消去をもたらすことが多い
より完全な概念消去と全体的な生成品質の保存を目的とした,新しいクローズドフォーム手法であるEraseProを提案する。
論文 参考訳(メタデータ) (2025-08-06T14:19:32Z) - SPEED: Scalable, Precise, and Efficient Concept Erasure for Diffusion Models [56.83154571623655]
モデルパラメータを直接編集する効率的な概念消去手法であるSPEEDを導入する。
Speedyは、パラメータ更新がターゲット以外の概念に影響しないモデル編集スペースであるnullスペースを検索する。
たった5秒で100のコンセプトを消去しました。
論文 参考訳(メタデータ) (2025-03-10T14:40:01Z) - Fantastic Targets for Concept Erasure in Diffusion Models and Where To Find Them [21.386640828092524]
概念消去は拡散モデルにおける有害なコンテンツ生成のリスクを軽減するための有望な手法として現れてきた。
本稿では,各望ましくない概念に合わせて最適な目標概念を動的に選択するAdaptive Guided Erasure (AGE)法を提案する。
その結果, AGEは, 有効消去性能を維持しつつ, 無関係な概念を保存し, 最先端の消去手法を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2025-01-31T08:17:23Z) - Reliable and Efficient Concept Erasure of Text-to-Image Diffusion Models [76.39651111467832]
本稿では,Reliable and Efficient Concept Erasure (RECE)を提案する。
派生した埋め込みによって表現される不適切なコンテンツを緩和するために、RECEはそれらをクロスアテンション層における無害な概念と整合させる。
新たな表現埋め込みの導出と消去を反復的に行い、不適切な概念の徹底的な消去を実現する。
論文 参考訳(メタデータ) (2024-07-17T08:04:28Z) - Separable Multi-Concept Erasure from Diffusion Models [52.51972530398691]
大規模拡散モデルから安全でない概念を排除するために,分離可能なマルチコンセプト消去器(SepME)を提案する。
後者は最適化可能なモデルウェイトを分離し、各ウェイトインクリメントは特定の概念の消去に対応する。
広範囲にわたる実験は, 概念の排除, モデル性能の保存, 各種概念の消去・回復における柔軟性の確保に, アプローチの有効性を示すものである。
論文 参考訳(メタデータ) (2024-02-03T11:10:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。