論文の概要: Dynamic Eraser for Guided Concept Erasure in Diffusion Models
- arxiv url: http://arxiv.org/abs/2604.16483v1
- Date: Mon, 13 Apr 2026 02:25:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.017746
- Title: Dynamic Eraser for Guided Concept Erasure in Diffusion Models
- Title(参考訳): 拡散モデルにおけるガイド付き概念消去のための動的消去器
- Authors: Qinghui Gong,
- Abstract要約: 本稿では,動的セマンティックステアリング(DSS)について述べる。
DSSは平均消去率91.0%を達成し、SOTA法(18.6%から85.9%)を著しく上回り、出力忠実度にはほとんど影響を与えない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Concept erasure in Text-To-Image (T2I) diffusion models is vital for safe content generation, but existing inference-time methods face significant limitations. Feature-correction approaches often cause uncontrolled over-correction, while token-level interventions struggle with semantic granularity and context. Moreover, both types of methods are prone to severe semantic drift or even complete representation collapse. To address these challenges, we present Dynamic Semantic Steering (DSS), a lightweight, training-free framework for interpretable and controllable concept erasure. DSS introduces: 1) Sensitive Semantic Boundary Modeling (SSBM) to automate the discovery of safe semantic anchors, and 2) Sensitive Semantic Guidance (SSG), which leverages cross-attention features for precise detection and performs correction via a closed-form solution derived from a well-posed objective. This ensures optimal suppression of sensitive content while preserving benign semantics. DSS achieves an average erasure rate of 91.0\%, significantly outperforming SOTA methods (from 18.6\% to 85.9\%) with minimal impact on output fidelity.
- Abstract(参考訳): テキスト・ツー・イメージ(T2I)拡散モデルにおける概念消去は、安全なコンテンツ生成には不可欠であるが、既存の推論時間法には重大な制限がある。
特徴補正アプローチは、しばしば制御されない過剰な補正を引き起こすが、トークンレベルの介入は意味的な粒度とコンテキストに悩まされる。
さらに、どちらの手法も重度のセマンティックドリフトや完全な表現崩壊を起こしやすい。
これらの課題に対処するため,我々は,動的セマンティックステアリング(DSS)を紹介した。
DSSが紹介する。
1)安全なセマンティックアンカーの発見を自動化するための感性セマンティック境界モデリング(SSBM)
2) 精密検出にクロスアテンション機能を活用し, 良好な目的から導かれる閉形解による補正を行う, SSG (Sensitive Semantic Guidance) について検討した。
これにより、良性のセマンティクスを保持しながら、センシティブなコンテンツを最適に抑制できる。
DSSは平均消去率91.0\%を達成し、SOTA法(18.6\%から85.9\%)を著しく上回り、出力忠実度に最小限の影響を与える。
関連論文リスト
- SECURE: Stable Early Collision Understanding via Robust Embeddings in Autonomous Driving [14.057807061501004]
SECURE - 安定早期衝突理解ロバスト埋め込み(Robust Embeddings)は、モデルロバスト性を正式に定義し、強制するフレームワークである。
本稿では,多目的損失を用いたベースラインモデルを微調整し,基準モデルからの偏差を最小化し,逆方向の摂動に対する感度を低下させる手法を提案する。DADおよびCDDデータセットを用いた実験により,本手法は種々の摂動に対する堅牢性を著しく向上するだけでなく,クリーンデータの性能向上も図っている。
論文 参考訳(メタデータ) (2026-04-01T19:42:32Z) - SafeRedir: Prompt Embedding Redirection for Robust Unlearning in Image Generation Models [67.84174763413178]
我々はSafeRedirを紹介した。SafeRedirは、迅速な埋め込みリダイレクトによる堅牢なアンラーニングのための軽量な推論時フレームワークである。
SafeRedirは,効果的な非学習能力,意味的・知覚的保存能力,堅牢な画像品質,対人攻撃に対する耐性の向上を実現している。
論文 参考訳(メタデータ) (2026-01-13T15:01:38Z) - Semantic Surgery: Zero-Shot Concept Erasure in Diffusion Models [27.672305802461377]
拡散プロセスの前にテキスト埋め込みを直接操作する,概念消去のための新しいトレーニングフリーゼロショットフレームワークを提案する。
我々は、局所性と画質を保ちながら、優れた完全性と堅牢性を達成する。
この堅牢性により、我々のフレームワークは脅威検出システムとして機能し、より安全なテキスト・画像生成のための実用的なソリューションを提供する。
論文 参考訳(メタデータ) (2025-10-26T22:04:17Z) - DeLeaker: Dynamic Inference-Time Reweighting For Semantic Leakage Mitigation in Text-to-Image Models [55.30555646945055]
テキスト・ツー・イメージ(T2I)モデルはセマンティック・リークに対して脆弱である。
DeLeakerは、モデルのアテンションマップに直接介入することで、漏洩を緩和する軽量なアプローチである。
SLIMはセマンティックリークに特化した最初のデータセットである。
論文 参考訳(メタデータ) (2025-10-16T17:39:21Z) - Detoxifying Large Language Models via Autoregressive Reward Guided Representation Editing [77.75609817898035]
大規模言語モデル(LLM)は、様々なタスクにわたって印象的なパフォーマンスを示してきたが、有害なコンテンツの生成には弱いままである。
textscAutoregressive textscReward textscGuided textscRe presentation textscEditing (ARGRE)を提案する。
ARGREは遅延表現空間内の毒性遷移を明示的にモデル化し、安定かつ正確な報酬誘導編集を可能にする。
論文 参考訳(メタデータ) (2025-09-24T03:40:32Z) - Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.32933059529135]
TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文 参考訳(メタデータ) (2025-08-28T07:09:21Z) - Advancing Reliable Test-Time Adaptation of Vision-Language Models under Visual Variations [67.35596444651037]
視覚言語モデル(VLM)は、素晴らしいゼロショット機能を示すが、ラベル付きデータが利用できない場合、下流タスクの分散シフトに苦慮する。
本稿では,信頼性を両面から高めるReliable Test-Time Adaptation (ReTA)法を提案する。
論文 参考訳(メタデータ) (2025-07-13T05:37:33Z) - Detect-and-Guide: Self-regulation of Diffusion Models for Safe Text-to-Image Generation via Guideline Token Optimization [22.225141381422873]
有害なコンテンツを生成するテキストと画像の拡散モデルに対する懸念が高まっている。
概念アンラーニングや安全ガイダンスのようなポストホックモデルの介入技術は、これらのリスクを軽減するために開発されている。
本稿では,自己診断と詳細な自己制御を行うための安全生成フレームワークであるDector-and-Guide(DAG)を提案する。
DAGは最先端の安全な生成性能を実現し、有害性軽減とテキスト追跡性能を現実のプロンプトでバランスさせる。
論文 参考訳(メタデータ) (2025-03-19T13:37:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。