論文の概要: EGLOCE: Training-Free Energy-Guided Latent Optimization for Concept Erasure
- arxiv url: http://arxiv.org/abs/2604.09405v1
- Date: Fri, 10 Apr 2026 15:19:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.922772
- Title: EGLOCE: Training-Free Energy-Guided Latent Optimization for Concept Erasure
- Title(参考訳): EGLOCE:概念消去のための訓練不要エネルギー誘導遅延最適化
- Authors: Junyeong Ahn, Seojin Yoon, Sungyong Baik,
- Abstract要約: 概念消去のためのエネルギー誘導遅延最適化(EGLOCE)について紹介する。
EGLOCEは、推論中にノイズの多い潜伏者をリダイレクトすることで不要な概念を除去する、トレーニング不要のアプローチである。
提案手法では, 相対的空間の勾配降下により, 対象概念から退避する反発エネルギーと, 元のプロンプトにセマンティックアライメントを保った保持エネルギーという, 二重目的の枠組みを用いる。
- 参考スコア(独自算出の注目度): 13.815063206114715
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As text-to-image diffusion models grow increasingly prevalent, the ability to remove specific concepts-mostly explicit content and many copyrighted characters or styles-has become essential for safety and compliance. Existing unlearning approaches often require costly re-training, modify parameters at the cost of degradation of unrelated concept fidelity, or depend on indirect inference-time adjustment that compromise the effectiveness of concept erasure. Inspired by the success of energy-guided sampling for preservation of the condition of diffusion models, we introduce Energy-Guided Latent Optimization for Concept Erasure (EGLOCE), a training-free approach that removes unwanted concepts by re-directing noisy latent during inference. Our method employs a dual-objective framework: a repulsion energy that steers generation away from target concepts via gradient descent in latent space, and a retention energy that preserves semantic alignment to the original prompt. Combined with previous approaches that either require erroneous modified model weights or provide weak inference-time guidance, EGLOCE operates entirely at inference and enhances erasure performance, enabling plug-and-play integration. Extensive experiments demonstrate that EGLOCE improves concept removal while maintaining image quality and prompt alignment across baselines, even with adversarial attacks. To the best of our knowledge, our work is the first to establish a new paradigm for safe and controllable image generation through dual energy-based guidance during sampling.
- Abstract(参考訳): テキストと画像の拡散モデルがますます普及するにつれて、特定の概念、主に明示的なコンテンツや多くの著作権のある文字やスタイルを除去する能力は、安全とコンプライアンスのために欠かせないものになっている。
既存の未学習のアプローチでは、コストのかかる再訓練や、関係のない概念の忠実度を低下させるコストでのパラメータの変更、あるいは概念消去の有効性を損なう間接的な推論時間調整に依存することが多い。
拡散モデル保存のためのエネルギー誘導サンプリングの成功にインスパイアされた,エネルギー誘導型概念消去のための遅延最適化(EGLOCE, Energy-Guided Latent Optimization for Concept Erasure)を導入する。
提案手法では, 相対的空間の勾配降下により, 対象概念から退避する反発エネルギーと, 元のプロンプトにセマンティックアライメントを保った保持エネルギーという, 二重目的の枠組みを用いる。
誤った修正モデルウェイトや弱い推論時間ガイダンスを提供する以前のアプローチと組み合わせて、EGLOCEは推論時に完全に動作し、消去性能を高め、プラグ・アンド・プレイの統合を可能にする。
大規模な実験では、EGLOCEは画像品質を維持しながら概念の除去を改善し、敵の攻撃であってもベースラインをまたいでアライメントを促進することが示されている。
我々の知識を最大限に活用するために、サンプリング中の二重エネルギーベースのガイダンスを通じて安全かつ制御可能な画像生成のための新しいパラダイムを最初に確立した。
関連論文リスト
- ActErase: A Training-Free Paradigm for Precise Concept Erasure via Activation Patching [16.08258534688825]
効率的な概念消去のための新しいトレーニングフリー手法(ActErase)を提案する。
本手法は,モデル全体の生成能力を効果的に保ちながら,最先端の消去性能を実現する。
論文 参考訳(メタデータ) (2026-01-01T09:11:09Z) - TRACE: Trajectory-Constrained Concept Erasure in Diffusion Models [0.0]
概念消去は、生成モデルにおいて特定の概念情報を削除または抑制することを目的としている。
Trajectory-Constrained Attentional Concept Erasure (TRACE) は拡散モデルから対象概念を消去する新しい手法である。
TRACEは最先端のパフォーマンスを実現し、ANT、EraseAnything、MACEといった最近の手法よりも、除去効率と出力品質の点で優れています。
論文 参考訳(メタデータ) (2025-05-29T10:15:22Z) - Continual Unlearning for Foundational Text-to-Image Models without Generalization Erosion [56.35484513848296]
本研究は,基本生成モデルから複数の特定の概念を対象とする除去を可能にする新しいパラダイムである連続的アンラーニングを導入する。
本稿では,望ましくない概念の生成を選択的に解き放つような一般化エロージョン(DUGE)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-03-17T23:17:16Z) - SPEED: Scalable, Precise, and Efficient Concept Erasure for Diffusion Models [56.83154571623655]
モデルパラメータを直接編集する効率的な概念消去手法であるSPEEDを導入する。
Speedyは、パラメータ更新がターゲット以外の概念に影響しないモデル編集スペースであるnullスペースを検索する。
たった5秒で100のコンセプトを消去しました。
論文 参考訳(メタデータ) (2025-03-10T14:40:01Z) - Reliable and Efficient Concept Erasure of Text-to-Image Diffusion Models [76.39651111467832]
本稿では,Reliable and Efficient Concept Erasure (RECE)を提案する。
派生した埋め込みによって表現される不適切なコンテンツを緩和するために、RECEはそれらをクロスアテンション層における無害な概念と整合させる。
新たな表現埋め込みの導出と消去を反復的に行い、不適切な概念の徹底的な消去を実現する。
論文 参考訳(メタデータ) (2024-07-17T08:04:28Z) - Unlearning Concepts in Diffusion Model via Concept Domain Correction and Concept Preserving Gradient [20.698305103879232]
我々はtextbfDoCo (textbfDomaintextbfCorrection) という新しい概念領域補正フレームワークを提案する。
本手法は, 対象概念の包括的未学習を保証し, 先進的学習を通して, センシティブな概念とアンカーの概念の出力領域を整合させることにより, 対象概念の包括的未学習を確実にする。
また、矛盾する勾配成分を緩和し、特定の概念を学習しながらモデルの実用性を維持するための概念保存的勾配手術手法も導入する。
論文 参考訳(メタデータ) (2024-05-24T07:47:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。