Fugu-MT 論文翻訳(概要): Espresso: Robust Concept Filtering in Text-to-Image Models

論文の概要: Espresso: Robust Concept Filtering in Text-to-Image Models

arxiv url: http://arxiv.org/abs/2404.19227v6
Date: Sun, 15 Dec 2024 16:20:37 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-24 15:24:32.838744
Title: Espresso: Robust Concept Filtering in Text-to-Image Models
Title（参考訳）: Espresso: テキスト・画像モデルにおけるロバストな概念フィルタリング
Authors: Anudeep Das, Vasisht Duddu, Rui Zhang, N. Asokan,
Abstract要約: Contrastive Language-Image Pre-Training (CLIP) に基づく最初のロバストな概念フィルタである Espresso を紹介する。我々は、生成した画像の埋め込みから、受け入れがたい概念と許容できる概念の両方のテキスト埋め込みまでの距離を用いて、受け入れがたい概念を識別する。これにより、ユーティリティを保ちながら、受け入れがたい概念と許容できる概念のテキスト埋め込みを分離することで、堅牢性を微調整できます。
参考スコア（独自算出の注目度）: 15.136993805135537
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Diffusion based text-to-image models are trained on large datasets scraped from the Internet, potentially containing unacceptable concepts (e.g., copyright-infringing or unsafe). We need concept removal techniques (CRTs) which are i) effective in preventing the generation of images with unacceptable concepts, ii) utility-preserving on acceptable concepts, and, iii) robust against evasion with adversarial prompts. No prior CRT satisfies all these requirements simultaneously. We introduce Espresso, the first robust concept filter based on Contrastive Language-Image Pre-Training (CLIP). We identify unacceptable concepts by using the distance between the embedding of a generated image to the text embeddings of both unacceptable and acceptable concepts. This lets us fine-tune for robustness by separating the text embeddings of unacceptable and acceptable concepts while preserving utility. We present a pipeline to evaluate various CRTs to show that Espresso is more effective and robust than prior CRTs, while retaining utility.
Abstract（参考訳）: 拡散ベースのテキスト・ツー・イメージモデルは、インターネットから取り除かれた大規模なデータセットでトレーニングされており、受け入れがたい概念(著作権侵害や安全でない)を含んでいる可能性がある。概念除去技術(CRT)が必要です。一容認できない概念による画像の発生を防止するのに有効なこと。二許容可能な概念の実用性保存及び三敵意による脱出に頑健であること。これらの要件を同時に満たすCRTは存在しない。本稿では,Contrastive Language-Image Pre-Training (CLIP)に基づく最初のロバストな概念フィルタであるEspressoを紹介する。我々は、生成した画像の埋め込みから、受け入れがたい概念と許容できる概念の両方のテキスト埋め込みまでの距離を用いて、受け入れがたい概念を識別する。これにより、ユーティリティを保ちながら、受け入れがたい概念と許容できる概念のテキスト埋め込みを分離することで、堅牢性を微調整できます。 Espresso が従来の CRT よりも有効で堅牢であることを示すため,実用性を維持しつつ,様々な CRT を評価するパイプラインを提案する。

関連論文リスト

ConceptPrism: Concept Disentanglement in Personalized Diffusion Models via Residual Token Optimization [11.472088067393074]
ConceptPrismは、画像固有の残留物から共有視覚概念を自動的に切り離す新しいフレームワークである。実験では、ConceptPrismは概念の絡み合いを効果的に解決し、忠実さと整合性の間のトレードオフを著しく改善する。
論文参考訳（メタデータ） (2026-02-23T07:46:19Z)
Concept Pinpoint Eraser for Text-to-image Diffusion Models via Residual Attention Gate [10.996274286143244]
拡散モデルにおける対象概念を最小限の歪みで保存しながら削除することを目的として,概念消去について検討した。本研究では, 対象概念を選択的に消去(あるいはカット)するEmphnonlinear Residual Attention Gates (ResAGs) を追加することで, 概念ピンポイント消去 (Concept Pinpoint Eraser, CPE) と呼ばれる新しいフレームワークを提案する。 CPEは、様々な概念を維持しながら、攻撃プロンプトに対する堅牢さで目標概念を削除し、先行技術より優れています。
論文参考訳（メタデータ） (2025-06-28T08:17:19Z)
Do Concept Replacement Techniques Really Erase Unacceptable Concepts? [9.816422194344398]
概念置換技術(CRT)は、しばしばモデルから受け入れられない概念を「取り除く」ことで、この問題に対処することを目的としている。優れたCRTは、許容できない概念を置き換える一方で、生成モデルへの入力で指定された他の概念を保存すべきである、と我々は主張する。本稿では,有効性と忠実性の両方を達成するために,ターゲット画像編集手法を提案する。
論文参考訳（メタデータ） (2025-06-10T17:02:36Z)
One Image is Worth a Thousand Words: A Usability Preservable Text-Image Collaborative Erasing Framework [127.07102988701092]
我々は、最初のテキストイメージ協調概念消去(Co-Erasing)フレームワークを紹介する。 Co-Erasingは、テキストプロンプトと、プロンプトによって誘導されるそれに対応する望ましくないイメージによって、この概念を共同で記述する。我々は,テキストガイドによる画像概念の洗練戦略を設計し,特定のテキスト概念に最も関係のある視覚的特徴に焦点を当てるようモデルに指示する。
論文参考訳（メタデータ） (2025-05-16T11:25:50Z)
CRCE: Coreference-Retention Concept Erasure in Text-to-Image Diffusion Models [19.074434401274285]
本稿では,新しい概念消去フレームワークCRCEを紹介する。コアフェルデンシャルと保持概念を意味的に明示的にモデル化することにより、CRCEはより正確な概念除去を可能にする。実験により、CRCEは様々な消去タスクにおいて既存の手法よりも優れていることが示された。
論文参考訳（メタデータ） (2025-03-18T13:09:01Z)
Sparse Autoencoder as a Zero-Shot Classifier for Concept Erasing in Text-to-Image Diffusion Models [24.15603438969762]
Interpret then Deactivate (ItD) は、T2I拡散モデルにおける正確な概念除去を可能にする新しいフレームワークである。 ItDはスパースオートエンコーダを使用して、各概念を複数の機能の組み合わせとして解釈する。さらなるトレーニングを必要とせずに、簡単に複数の概念を消去できる。
論文参考訳（メタデータ） (2025-03-12T14:46:40Z)
Concept Corrector: Erase concepts on the fly for text-to-image diffusion models [13.065682925662237]
概念消去は、モデルが生成できる望ましくない概念を消去することを目的としている。本研究では,特定のタイミングで予測される最終生成画像から得られる視覚的特徴に基づいて,対象概念をチェックする概念コレクタを提案する。パイプライン全体において、我々の手法はモデルパラメータを変更せず、特定のターゲット概念とそれに対応する代替コンテンツのみを必要とする。
論文参考訳（メタデータ） (2025-02-22T21:53:43Z)
CE-SDWV: Effective and Efficient Concept Erasure for Text-to-Image Diffusion Models via a Semantic-Driven Word Vocabulary [55.3680995649415]
大規模テキスト・ツー・イメージ(T2I)拡散モデルは、様々な概念に関する顕著な生成性能を達成している。実際には、プライバシーと安全性の制限により、NSFW(Not Safe For Work)の概念に関する生成能力は望ましくない。テキスト意味空間におけるT2I拡散モデルのターゲット概念を除去するフレームワークを提案する。
論文参考訳（メタデータ） (2025-01-26T15:39:47Z)
OmniPrism: Learning Disentangled Visual Concept for Image Generation [57.21097864811521]
創造的な視覚概念の生成は、しばしば関連する結果を生み出すために参照イメージ内の特定の概念からインスピレーションを引き出す。我々は,創造的画像生成のための視覚的概念分離手法であるOmniPrismを提案する。提案手法は,自然言語で案内される不整合概念表現を学習し,これらの概念を組み込むために拡散モデルを訓練する。
論文参考訳（メタデータ） (2024-12-16T18:59:52Z)
Continuous Concepts Removal in Text-to-image Diffusion Models [27.262721132177845]
著作権を侵害したり、乱暴な主題を描写するコンテンツを作成するためのテキスト・ツー・イメージモデルの可能性について懸念が高まっている。本稿では,知識蒸留パラダイムを設計したCCRTという新しい手法を提案する。一連のテキストプロンプトを使用することで、連続的な概念削除プロセス中のテキストイメージのアライメント動作を制限します。
論文参考訳（メタデータ） (2024-11-30T20:40:10Z)
EIUP: A Training-Free Approach to Erase Non-Compliant Concepts Conditioned on Implicit Unsafe Prompts [32.590822043053734]
非有毒なテキストは、暗黙の安全でないプロンプトと呼ばれる非準拠のイメージを生成するリスクを伴っている。我々は、非準拠の概念を消去プロンプトに組み込む、単純で効果的なアプローチを提案する。本手法は,画像の忠実度を高いスコアで評価しながら,優れた消去効果を示す。
論文参考訳（メタデータ） (2024-08-02T05:17:14Z)
Reliable and Efficient Concept Erasure of Text-to-Image Diffusion Models [76.39651111467832]
本稿では,Reliable and Efficient Concept Erasure (RECE)を提案する。派生した埋め込みによって表現される不適切なコンテンツを緩和するために、RECEはそれらをクロスアテンション層における無害な概念と整合させる。新たな表現埋め込みの導出と消去を反復的に行い、不適切な概念の徹底的な消去を実現する。
論文参考訳（メタデータ） (2024-07-17T08:04:28Z)
ConceptExpress: Harnessing Diffusion Models for Single-image Unsupervised Concept Extraction [20.43411883845885]
本研究では,非教師付き概念抽出(UCE)という,概念の人間的知識のない非教師付き概念抽出手法を提案する。複数の概念を含むイメージを与えられたタスクは、事前訓練された拡散モデルから既存の知識のみに依存する個々の概念を抽出し、再現することを目的としている。本稿では,事前学習した拡散モデル固有の能力を2つの側面に解き放つことで,UCEに対処するConceptExpressを提案する。
論文参考訳（メタデータ） (2024-07-09T17:50:28Z)
ConceptPrune: Concept Editing in Diffusion Models via Skilled Neuron Pruning [10.201633236997104]
大規模テキスト・画像拡散モデルでは、印象的な画像生成能力が示されている。提案するConceptPruneでは,まず,望ましくない概念を生成するための事前学習モデル内の重要な領域を同定する。芸術的スタイル、ヌード性、オブジェクトの消去、ジェンダーのデバイアスなど、さまざまな概念に対する実験は、ターゲットのコンセプトをごくわずかに刈って効率よく消去できることを実証している。
論文参考訳（メタデータ） (2024-05-29T16:19:37Z)
Non-confusing Generation of Customized Concepts in Diffusion Models [135.4385383284657]
テキスト誘導拡散モデル(TGDM)を用いた合成概念生成における概念間視覚混乱の共通課題に取り組む。既存のカスタマイズされた生成方法は、第2ステージの微調整のみに焦点を当て、第1ステージを見下ろしている。本稿では,CLIF(CLIF)と呼ばれる単純かつ効果的な画像言語微調整法を提案する。
論文参考訳（メタデータ） (2024-05-11T05:01:53Z)
Multi-Concept T2I-Zero: Tweaking Only The Text Embeddings and Nothing Else [75.6806649860538]
我々は,事前学習した拡散モデルを用いた自然多概念生成という,より野心的な目標を考える。マルチコンセプト生成性能を著しく低下させる概念支配と非局所的貢献を観察する。我々は、より現実的なマルチコンセプトのテキスト・ツー・イメージ生成のために、テキストの埋め込みを微調整することで、上記の問題を克服する最小の低コストのソリューションを設計する。
論文参考訳（メタデータ） (2023-10-11T12:05:44Z)
Implicit Concept Removal of Diffusion Models [92.55152501707995]
テキスト・ツー・イメージ(T2I)拡散モデルはしばしば、透かしや安全でない画像のような望ましくない概念を不注意に生成する。幾何学駆動制御に基づく新しい概念除去手法であるGeom-Erasingを提案する。
論文参考訳（メタデータ） (2023-10-09T17:13:10Z)
Degeneration-Tuning: Using Scrambled Grid shield Unwanted Concepts from Stable Diffusion [106.42918868850249]
SD重みから不要な概念の内容を保護するために,textbf Degeneration-Tuning (DT) という新しい手法を提案する。この適応はモデルの重みのレベルで発生するため、DT後のSDは、CrutNetのような他の条件付き拡散フレームワークに移植して不要な概念を保護することができる。
論文参考訳（メタデータ） (2023-08-02T03:34:44Z)
Ablating Concepts in Text-to-Image Diffusion Models [57.9371041022838]
大規模テキスト・画像拡散モデルでは、強力な構成能力を持つ高忠実度画像を生成することができる。これらのモデルは典型的には膨大な量のインターネットデータに基づいて訓練されており、しばしば著作権のある資料、ライセンスされた画像、個人写真を含んでいる。本稿では,事前訓練されたモデルにおいて,目標概念の生成を防止し,効率的に概念を宣言する手法を提案する。
論文参考訳（メタデータ） (2023-03-23T17:59:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。