論文の概要: Z-Erase: Enabling Concept Erasure in Single-Stream Diffusion Transformers
- arxiv url: http://arxiv.org/abs/2603.25074v1
- Date: Thu, 26 Mar 2026 06:24:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.137133
- Title: Z-Erase: Enabling Concept Erasure in Single-Stream Diffusion Transformers
- Title(参考訳): Z-Erase:シングルストリーム拡散変換器における概念消去の実現
- Authors: Nanxiang Jiang, Zhaoxin Fan, Baisen Wang, Daiheng Gao, Junhang Cheng, Jifeng Guo, Yalan Qin, Yeying Jin, Hongwei Zheng, Faguo Wu, Wenjun Wu,
- Abstract要約: 概念消去は、テキスト・ツー・イメージ(T2I)モデルから不要な概念を取り除くための重要な安全メカニズムである。
Z-EraseはシングルストリームT2Iモデルに適した最初の概念消去手法である。
- 参考スコア(独自算出の注目度): 28.8135497087758
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Concept erasure serves as a vital safety mechanism for removing unwanted concepts from text-to-image (T2I) models. While extensively studied in U-Net and dual-stream architectures (e.g., Flux), this task remains under-explored in the recent emerging paradigm of single-stream diffusion transformers (e.g., Z-Image). In this new paradigm, text and image tokens are processed as a single unified sequence via shared parameters. Consequently, directly applying prior erasure methods typically leads to generation collapse. To bridge this gap, we introduce Z-Erase, the first concept erasure method tailored for single-stream T2I models. To guarantee stable image generation, Z-Erase first proposes a Stream Disentangled Concept Erasure Framework that decouples updates and enables existing methods on single-stream models. Subsequently, within this framework, we introduce Lagrangian-Guided Adaptive Erasure Modulation, a constrained algorithm that further balances the sensitive erasure-preservation trade-off. Moreover, we provide a rigorous convergence analysis proving that Z-Erase can converge to a Pareto stationary point. Experiments demonstrate that Z-Erase successfully overcomes the generation collapse issue, achieving state-of-the-art performance across a wide range of tasks.
- Abstract(参考訳): 概念消去は、テキスト・ツー・イメージ(T2I)モデルから不要な概念を取り除くための重要な安全メカニズムである。
U-Netやデュアルストリームアーキテクチャ(Fluxなど)で広く研究されているが、近年の単一ストリーム拡散トランスフォーマー(Z-Imageなど)のパラダイムでは未解明のままである。
この新しいパラダイムでは、テキストと画像トークンは共有パラメータを介して単一の統一シーケンスとして処理される。
したがって、直接消去法を適用すると、一般的には生成が崩壊する。
このギャップを埋めるために、単一ストリームT2Iモデルに適した最初の概念消去手法であるZ-Eraseを導入する。
安定した画像生成を保証するため、Z-Eraseはまず、更新を分離し、シングルストリームモデルの既存のメソッドを可能にするStream Disentangled Concept Erasure Frameworkを提案する。
次に, この枠組みでは, ラグランジアン誘導型適応消去変調を導入し, 感度の低い消去・保存トレードオフを更にバランスさせる制約付きアルゴリズムを提案する。
さらに、Z-Eraseがパレート定常点に収束できることを示す厳密な収束解析を提供する。
実験により、Z-Eraseは世代崩壊の問題を克服し、幅広いタスクで最先端のパフォーマンスを達成することができた。
関連論文リスト
- UniGRPO: Unified Policy Optimization for Reasoning-Driven Visual Generation [51.41441081823758]
インターリーブドジェネレーションが可能な統一モデルが有望なパラダイムとして登場している。
インターリーブ・ジェネレーションに適した統合強化学習フレームワークを提案する。
実験により,この統合学習レシピは推論による画像生成品質を著しく向上させることが示された。
論文 参考訳(メタデータ) (2026-03-24T17:59:17Z) - EraseAnything++: Enabling Concept Erasure in Rectified Flow Transformers Leveraging Multi-Object Optimization [18.80236205171204]
EraseAnything++は、画像拡散モデルとビデオ拡散モデルの両方において概念消去のための統一されたフレームワークである。
本手法は,鍵となる視覚的表現を消去し,空間的・時間的次元にわたって一貫した伝播を行う。
ビデオ設定では、アンカー・アンド・プロパゲート機構により、参照フレームの消去を初期化し、その後のトランスフォーマー層を通して強制する一貫性をさらに強化する。
論文 参考訳(メタデータ) (2026-03-01T08:13:05Z) - Differential Vector Erasure: Unified Training-Free Concept Erasure for Flow Matching Models [49.10620605347065]
本研究では,フローマッチングモデルに特化して設計されたトレーニング不要な概念消去手法である差分ベクトル消去(DVE)を提案する。
我々の重要な洞察は、意味論的概念は生成フローを管理する速度場の方向構造に暗黙的に符号化されていることである。
推論中、DVEは速度場を微分方向に投影することで概念固有の成分を選択的に除去し、無関係な意味論に影響を与えることなく正確な概念抑圧を可能にする。
論文 参考訳(メタデータ) (2026-02-01T08:05:45Z) - Unifying Heterogeneous Degradations: Uncertainty-Aware Diffusion Bridge Model for All-in-One Image Restoration [39.5698877093219]
画像復元のための不確実性認識拡散ブリッジモデル(UDBM)を提案する。
UDBMは、AiOIRを画素ワイド不確実性による輸送問題として再構成する。
単一の推論ステップで、さまざまな復元タスクにまたがる最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-01-29T12:02:42Z) - Score Distillation of Flow Matching Models [67.86066177182046]
我々は、Score Identity Distillation (SiD) を事前訓練されたテキスト対画像フローマッチングモデルに拡張する。
SiDは、データフリーとデータアシストの両方の設定で、これらのモデルですぐに使える。
これは、スコア蒸留がテキストと画像のフローマッチングモデルに広く適用されるという最初の体系的な証拠を提供する。
論文 参考訳(メタデータ) (2025-09-29T17:45:48Z) - TRACE: Trajectory-Constrained Concept Erasure in Diffusion Models [0.0]
概念消去は、生成モデルにおいて特定の概念情報を削除または抑制することを目的としている。
Trajectory-Constrained Attentional Concept Erasure (TRACE) は拡散モデルから対象概念を消去する新しい手法である。
TRACEは最先端のパフォーマンスを実現し、ANT、EraseAnything、MACEといった最近の手法よりも、除去効率と出力品質の点で優れています。
論文 参考訳(メタデータ) (2025-05-29T10:15:22Z) - Few-Step Diffusion via Score identity Distillation [67.07985339442703]
拡散蒸留は, テキスト・ツー・イメージ(T2I)拡散モデルを促進するための有望な戦略として浮上している。
既存の方法は、高分解能T2I拡散モデルを蒸留する際に、実像や教師合成画像に頼っている。
教師のCFGを無効にし、偽スコアネットワークでテキストコンディショニングを除去するZero-CFGと、偽スコアネットワークで否定的なCFGを適用するAnti-CFGの2つの新しいガイダンス戦略を提案する。
論文 参考訳(メタデータ) (2025-05-19T03:45:16Z) - EraseAnything: Enabling Concept Erasure in Rectified Flow Transformers [33.195628798316754]
EraseAnythingは、最新のフローベースのT2Iフレームワークにおける概念消去に対処するために特別に開発された最初の方法である。
概念消去を二段階最適化問題として定式化し,LoRAに基づくパラメータチューニングとアテンションマップ正規化器を用いた。
本研究では,意図しない概念の除去が意図せず,無関係な概念のパフォーマンスを損なうことのない自己矛盾型学習戦略を提案する。
論文 参考訳(メタデータ) (2024-12-29T09:42:53Z) - Reliable and Efficient Concept Erasure of Text-to-Image Diffusion Models [76.39651111467832]
本稿では,Reliable and Efficient Concept Erasure (RECE)を提案する。
派生した埋め込みによって表現される不適切なコンテンツを緩和するために、RECEはそれらをクロスアテンション層における無害な概念と整合させる。
新たな表現埋め込みの導出と消去を反復的に行い、不適切な概念の徹底的な消去を実現する。
論文 参考訳(メタデータ) (2024-07-17T08:04:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。