論文の概要: EMMA: Concept Erasure Benchmark with Comprehensive Semantic Metrics and Diverse Categories
- arxiv url: http://arxiv.org/abs/2512.17320v1
- Date: Fri, 19 Dec 2025 08:08:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-22 19:25:54.297536
- Title: EMMA: Concept Erasure Benchmark with Comprehensive Semantic Metrics and Diverse Categories
- Title(参考訳): EMMA:概念消去ベンチマーク
- Authors: Lu Wei, Yuta Nakashima, Noa Garcia,
- Abstract要約: EMMAは概念消去の5つの重要な側面を12の指標で評価するベンチマークである。
EMMAは、画像の品質や時間効率といった標準的な指標を越えて、困難な条件下で堅牢性をテストする。
我々は5つのドメイン(オブジェクト、セレブ、アートスタイル、NSFW、著作権)における5つの概念消去方法を分析する。
- 参考スコア(独自算出の注目度): 22.090018707444596
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The widespread adoption of text-to-image (T2I) generation has raised concerns about privacy, bias, and copyright violations. Concept erasure techniques offer a promising solution by selectively removing undesired concepts from pre-trained models without requiring full retraining. However, these methods are often evaluated on a limited set of concepts, relying on overly simplistic and direct prompts. To test the boundaries of concept erasure techniques, and assess whether they truly remove targeted concepts from model representations, we introduce EMMA, a benchmark that evaluates five key dimensions of concept erasure over 12 metrics. EMMA goes beyond standard metrics like image quality and time efficiency, testing robustness under challenging conditions, including indirect descriptions, visually similar non-target concepts, and potential gender and ethnicity bias, providing a socially aware analysis of method behavior. Using EMMA, we analyze five concept erasure methods across five domains (objects, celebrities, art styles, NSFW, and copyright). Our results show that existing methods struggle with implicit prompts (i.e., generating the erased concept when it is indirectly referenced) and visually similar non-target concepts (i.e., failing to generate non-targeted concepts resembling the erased one), while some amplify gender and ethnicity bias compared to the original model.
- Abstract(参考訳): テキスト・ツー・イメージ(T2I)世代が広く採用されていることで、プライバシー、偏見、著作権侵害に対する懸念が高まっている。
概念消去技術は、完全な再トレーニングを必要とせずに、事前学習されたモデルから望ましくない概念を選択的に除去することで、有望な解決策を提供する。
しかし、これらの手法は、過度に単純で直接的なプロンプトに依存して、限られた概念に基づいてしばしば評価される。
概念消去手法の境界を検証し,対象とする概念をモデル表現から真に除去するかどうかを評価するために,概念消去の5つの重要な側面を12の指標で評価するベンチマークであるEMMAを導入する。
EMMAは、画像の品質や時間効率などの標準的な指標を超えて、間接的な記述、視覚的に類似しない概念、潜在的な性別と民族性バイアスなど、困難な条件下で堅牢性をテストする。
EMMAを用いて,5つのドメイン(オブジェクト,セレブ,アートスタイル,NSFW,著作権)のコンセプト消去手法を解析した。
以上の結果から,既存の手法は暗黙的なプロンプト(間接的に参照されたときに消去された概念を生成する)や視覚的に類似した非ターゲット概念(すなわち,消去された概念と類似した非ターゲット概念を生成できない)に苦しむ一方で,本来のモデルと比較して性別や民族バイアスを増幅するものもある。
関連論文リスト
- Erased or Dormant? Rethinking Concept Erasure Through Reversibility [6.895055915600732]
我々は、統一概念編集と消去安定拡散という2つの代表的な概念消去手法を評価する。
消去された概念は、最小限の適応の後、しばしばかなりの視覚的忠実度で再帰することを示す。
本研究は,既存の概念消去アプローチにおける限界を明らかにするものである。
論文 参考訳(メタデータ) (2025-05-22T03:26:46Z) - Concept Corrector: Erase concepts on the fly for text-to-image diffusion models [38.99973711993937]
概念消去は、モデルが生成できる望ましくない概念を消去することを目的としている。
本研究では,特定のタイミングで予測される最終生成画像から得られる視覚的特徴に基づいて,対象概念をチェックする概念コレクタを提案する。
パイプライン全体において、我々の手法はモデルパラメータを変更せず、特定のターゲット概念とそれに対応する代替コンテンツのみを必要とする。
論文 参考訳(メタデータ) (2025-02-22T21:53:43Z) - Erasing More Than Intended? How Concept Erasure Degrades the Generation of Non-Target Concepts [31.232389877218377]
評価後のパフォーマンスを評価するための総合的なベンチマークであるEraseBenchを紹介する。
我々は、相互関係の異なるレベルにおける非ターゲット概念に対する概念除去の意図しない結果に焦点をあてる。
以上の結果から, 消去が意図しない非目標概念の抑制につながる概念絡み現象が明らかとなった。
論文 参考訳(メタデータ) (2025-01-16T20:42:17Z) - Implicit Concept Removal of Diffusion Models [92.55152501707995]
テキスト・ツー・イメージ(T2I)拡散モデルはしばしば、透かしや安全でない画像のような望ましくない概念を不注意に生成する。
幾何学駆動制御に基づく新しい概念除去手法であるGeom-Erasingを提案する。
論文 参考訳(メタデータ) (2023-10-09T17:13:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。