論文の概要: Beyond Text Prompts: Precise Concept Erasure through Text-Image Collaboration
- arxiv url: http://arxiv.org/abs/2604.15829v1
- Date: Fri, 17 Apr 2026 08:32:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.824117
- Title: Beyond Text Prompts: Precise Concept Erasure through Text-Image Collaboration
- Title(参考訳): テキストプロンプトを超えて: テキストイメージコラボレーションによる精密な概念消去
- Authors: Jun Li, Lizhi Xiong, Ziqiang Li, Weiwei Jiang, Zhangjie Fu, Yong Li, Guo-Sen Xie,
- Abstract要約: テキストから画像への生成モデルは、大規模なトレーニングデータセットに埋め込まれた暗黙のバイアスにより、不安全または望ましくないコンテンツを不注意に生成することができる。
本稿では,テキスト画像を用いた協調的消去フレームワークTICoEを提案する。
- 参考スコア(独自算出の注目度): 31.335104022933695
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-to-image generative models have achieved impressive fidelity and diversity, but can inadvertently produce unsafe or undesirable content due to implicit biases embedded in large-scale training datasets. Existing concept erasure methods, whether text-only or image-assisted, face trade-offs: textual approaches often fail to fully suppress concepts, while naive image-guided methods risk over-erasing unrelated content. We propose TICoE, a text-image Collaborative Erasing framework that achieves precise and faithful concept removal through a continuous convex concept manifold and hierarchical visual representation learning. TICoE precisely removes target concepts while preserving unrelated semantic and visual content. To objectively assess the quality of erasure, we further introduce a fidelity-oriented evaluation strategy that measures post-erasure usability. Experiments on multiple benchmarks show that TICoE surpasses prior methods in concept removal precision and content fidelity, enabling safer, more controllable text-to-image generation. Our code is available at https://github.com/OpenAscent-L/TICoE.git
- Abstract(参考訳): テキストから画像への生成モデルは、印象的な忠実さと多様性を達成したが、大規模なトレーニングデータセットに埋め込まれた暗黙のバイアスのために、不注意に安全または望ましくないコンテンツを生成できる。
既存の概念消去手法は、テキストのみであれ、イメージアシストであれ、対面トレードオフである: テキストアプローチは、コンセプトを完全に抑圧するのに失敗することが多いが、画像誘導方式は、無関係なコンテンツを過剰に消去するリスクを負う。
本研究では,連続凸の概念多様体と階層的視覚表現学習を用いて,高精度かつ忠実な概念除去を実現するテキスト画像協調型消去フレームワークTICoEを提案する。
TICoEは、無関係なセマンティックコンテンツとビジュアルコンテンツを保持しながら、ターゲット概念を正確に除去する。
消去の質を客観的に評価するために,評価後のユーザビリティを計測する忠実度指向評価戦略を導入する。
複数のベンチマーク実験により、TICoEは概念除去精度とコンテンツ忠実度において従来の手法を超越し、より安全で制御可能なテキスト・ツー・イメージ生成を可能にした。
私たちのコードはhttps://github.com/OpenAscent-L/TICoE.gitで利用可能です。
関連論文リスト
- VCE: Safe Autoregressive Image Generation via Visual Contrast Exploitation [57.36681904639463]
自己回帰的テキスト・画像モデルを保護する方法はまだ未検討のままである。
コンテンツセマンティクスから安全でない概念を正確に分離する新しいフレームワークであるVisual Contrast Exploitation (VCE)を提案する。
提案手法は,安全でない概念を消去し,無関係な概念の整合性を保ちながら,最先端の成果を効果的に確保できることを実証する。
論文 参考訳(メタデータ) (2025-09-21T09:00:27Z) - One Image is Worth a Thousand Words: A Usability Preservable Text-Image Collaborative Erasing Framework [127.07102988701092]
我々は、最初のテキストイメージ協調概念消去(Co-Erasing)フレームワークを紹介する。
Co-Erasingは、テキストプロンプトと、プロンプトによって誘導されるそれに対応する望ましくないイメージによって、この概念を共同で記述する。
我々は,テキストガイドによる画像概念の洗練戦略を設計し,特定のテキスト概念に最も関係のある視覚的特徴に焦点を当てるようモデルに指示する。
論文 参考訳(メタデータ) (2025-05-16T11:25:50Z) - CRCE: Coreference-Retention Concept Erasure in Text-to-Image Diffusion Models [19.205261933636645]
本稿では,新しい概念消去フレームワークCRCEを紹介する。
コアフェルデンシャルと保持概念を意味的に明示的にモデル化することにより、CRCEはより正確な概念除去を可能にする。
実験により、CRCEは様々な消去タスクにおいて既存の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2025-03-18T13:09:01Z) - TRCE: Towards Reliable Malicious Concept Erasure in Text-to-Image Diffusion Models [53.937498564603054]
近年のテキスト・画像拡散モデルの進歩により、フォトリアリスティックな画像生成が可能になったが、NSFW画像のような悪意のあるコンテンツを生成するリスクもある。
リスクを軽減するため,概念消去手法が研究され,モデルが特定の概念を学習しやすくする。
本稿では,2段階のコンセプト消去戦略を用いて,信頼性の高い消去と知識保存の効果的なトレードオフを実現するTRCEを提案する。
論文 参考訳(メタデータ) (2025-03-10T14:37:53Z) - Safety Without Semantic Disruptions: Editing-free Safe Image Generation via Context-preserving Dual Latent Reconstruction [88.18235230849554]
大規模で未処理のデータセットでマルチモーダル生成モデルをトレーニングすることで、ユーザは有害で安全でない、議論の余地のない、文化的に不適切なアウトプットにさらされる可能性がある。
我々は、安全な埋め込みと、より安全な画像を生成するために、潜伏空間の重み付け可能な総和による修正拡散プロセスを活用する。
安全と検閲のトレードオフを特定し、倫理的AIモデルの開発に必要な視点を提示します。
論文 参考訳(メタデータ) (2024-11-21T09:47:13Z) - Implicit Concept Removal of Diffusion Models [92.55152501707995]
テキスト・ツー・イメージ(T2I)拡散モデルはしばしば、透かしや安全でない画像のような望ましくない概念を不注意に生成する。
幾何学駆動制御に基づく新しい概念除去手法であるGeom-Erasingを提案する。
論文 参考訳(メタデータ) (2023-10-09T17:13:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。