Fugu-MT 論文翻訳(概要): TrojanEdit: Backdooring Text-Based Image Editing Models

論文の概要: TrojanEdit: Backdooring Text-Based Image Editing Models

arxiv url: http://arxiv.org/abs/2411.14681v1
Date: Fri, 22 Nov 2024 02:27:27 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:50.066006
Title: TrojanEdit: Backdooring Text-Based Image Editing Models
Title（参考訳）: TrojanEdit: テキストベースの画像編集モデルのバックドア化
Authors: Ji Guo, Peihong Chen, Wenbo Jiang, Guoming Lu,
Abstract要約: 画像編集モデルのためのバックドアアタックフレームワークTrojanEditを提案する。 5種類の視覚的トリガ,3種類のテキスト的トリガを探索し,それらを15種類のマルチモーダルトリガとして組み合わせる。実験の結果,画像編集モデルはテクスチャトリガのバックドアバイアスを有することがわかった。
参考スコア（独自算出の注目度）: 1.392448435105643
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: As diffusion models have achieved success in image generation tasks, many studies have extended them to other related fields like image editing. Unlike image generation, image editing aims to modify an image based on user requests while keeping other parts of the image unchanged. Among these, text-based image editing is the most representative task.Some studies have shown that diffusion models are vulnerable to backdoor attacks, where attackers may poison the training data to inject the backdoor into models. However, previous backdoor attacks on diffusion models primarily focus on image generation models without considering image editing models. Given that image editing models accept multimodal inputs, it raises a new question regarding the effectiveness of different modalities triggers in backdoor attacks on these models. To address this question, we propose a backdoor attack framework for image editing models, named TrojanEdit, which can handle different modalities triggers. We explore five types of visual triggers, three types of textual triggers, and combine them together as fifteen types of multimodal triggers, conducting extensive experiments for three types of backdoor attack goals. Our experimental results show that the image editing model has a backdoor bias for texture triggers. Compared to visual triggers, textual triggers have stronger attack effectiveness but also cause more damage to the model's normal functionality. Furthermore, we found that multimodal triggers can achieve a good balance between the attack effectiveness and model's normal functionality.
Abstract（参考訳）: 拡散モデルが画像生成タスクで成功したため、多くの研究が画像編集などの他の関連分野に拡張してきた。画像生成とは異なり、画像編集は、画像の他の部分を変更せずに、ユーザの要求に基づいて画像を修正することを目的としている。これらのうち、テキストベースの画像編集が最も代表的なタスクであり、ある研究では拡散モデルがバックドア攻撃に弱いことが示されており、攻撃者はトレーニングデータに毒を加えてモデルにバックドアを注入する可能性がある。しかし、拡散モデルに対する過去のバックドア攻撃は、主に画像編集モデルを考えることなく、画像生成モデルに焦点を当てていた。画像編集モデルがマルチモーダル入力を受け入れることを考えると、これらのモデルに対するバックドア攻撃において異なるモダリティトリガの有効性に関する新たな疑問が提起される。そこで本研究では,異なるモダリティトリガを処理可能な画像編集モデルであるTrojanEditを提案する。我々は,5種類の視覚的トリガー,3種類のテキスト的トリガーを探索し,それらを15種類のマルチモーダルトリガーとして組み合わせ,3種類のバックドア攻撃目標に対する広範囲な実験を行った。実験の結果,画像編集モデルはテクスチャトリガのバックドアバイアスを有することがわかった。視覚的なトリガーと比較して、テキストトリガーは攻撃効果が強いが、モデルの通常の機能にダメージを与える。さらに,マルチモーダルトリガは,攻撃効率とモデルの通常の機能とのバランスが良好であることが判明した。

関連論文リスト

Muddit: Liberating Generation Beyond Text-to-Image with a Unified Discrete Diffusion Model [87.23753533733046]
テキストと画像の両モードをまたいで高速かつ並列に生成できる,統一的な離散拡散変換器であるMudditを導入する。 Mudditは、スクラッチからトレーニングされた以前の統一拡散モデルとは異なり、トレーニング済みのテキストからイメージまでのバックボーンから、強力な視覚的事前情報を軽量のテキストデコーダに統合する。
論文参考訳（メタデータ） (2025-05-29T16:15:48Z)
Parasite: A Steganography-based Backdoor Attack Framework for Diffusion Models [9.459318290809907]
本研究では,拡散モデルにおけるイメージ・ツー・イメージタスクのための新しいバックドアアタック手法"Parasite"を提案する。新規攻撃手法としての「パラサイト」は、バックドア攻撃を実行するための既存の検出フレームワークを効果的にバイパスする。
論文参考訳（メタデータ） (2025-04-08T08:53:47Z)
EditAR: Unified Conditional Generation with Autoregressive Models [58.093860528672735]
本稿では,条件付き画像生成タスクのための単一の統合自己回帰フレームワークであるEditARを提案する。このモデルは、画像と命令の両方を入力として取り、バニラの次のパラダイムで編集された画像トークンを予測する。確立されたベンチマークにおいて,様々なタスクにまたがる実効性を評価し,様々なタスク固有の手法に対する競争性能を示す。
論文参考訳（メタデータ） (2025-01-08T18:59:35Z)
How to Backdoor Consistency Models? [10.977907906989342]
バックドア攻撃に対する一貫性モデルの脆弱性に関する最初の研究を行う。提案フレームワークは,バックドア攻撃に対する一貫性モデルの脆弱性を実証する。我々のフレームワークは、高い実用性と特異性を維持しながら、一貫性モデルの妥協に成功した。
論文参考訳（メタデータ） (2024-10-14T22:25:06Z)
BadCM: Invisible Backdoor Attack Against Cross-Modal Learning [110.37205323355695]
クロスモーダルバックドアにおけるパズルの欠片を補うために,新たな両面バックドアを導入する。 BadCMは、1つの統合されたフレームワーク内で多様なクロスモーダルアタックのために意図的に設計された最初の目に見えないバックドアメソッドである。
論文参考訳（メタデータ） (2024-10-03T03:51:53Z)
Stealth edits to large language models [76.53356051271014]
モデルの編集可能性を評価するために、1つのメトリックを使用できることを示す。また、ステルス攻撃に対する言語モデルの脆弱性を明らかにします。
論文参考訳（メタデータ） (2024-06-18T14:43:18Z)
Stealthy Targeted Backdoor Attacks against Image Captioning [16.409633596670368]
本稿では,画像キャプションモデルに対するバックドア攻撃を標的とした新たな手法を提案する。本手法は,物体検出に普遍摂動技術を活用することで,まず特別なトリガを学習する。我々のアプローチは、モデルクリーンパフォーマンスに無視できる影響を与えながら、高い攻撃成功率を達成することができる。
論文参考訳（メタデータ） (2024-06-09T18:11:06Z)
Invisible Backdoor Attacks on Diffusion Models [22.08671395877427]
近年の研究では、バックドア攻撃に対する拡散モデルの脆弱性が明らかにされている。本稿では,目に見えないトリガーの獲得と,挿入されたバックドアのステルスネスとレジリエンスの向上を目的とした,革新的なフレームワークを提案する。
論文参考訳（メタデータ） (2024-06-02T17:43:19Z)
Backdoor Attack with Mode Mixture Latent Modification [26.720292228686446]
本研究では,微調整の要領でバックドアを注入するために,クリーンモデルへの最小限の変更しか必要としないバックドア攻撃パラダイムを提案する。提案手法の有効性を4つのベンチマーク・データセットで評価した。
論文参考訳（メタデータ） (2024-03-12T09:59:34Z)
VL-Trojan: Multimodal Instruction Backdoor Attacks against Autoregressive Visual Language Models [65.23688155159398]
VLM(Autoregressive Visual Language Models)は、マルチモーダルなコンテキストにおいて、驚くべき数ショットの学習機能を示す。近年,マルチモーダル・インストラクション・チューニングが提案されている。敵は、指示や画像に埋め込まれたトリガーで有毒なサンプルを注入することで、バックドアを埋め込むことができる。本稿では,マルチモーダルなバックドア攻撃,すなわちVL-Trojanを提案する。
論文参考訳（メタデータ） (2024-02-21T14:54:30Z)
On the Multi-modal Vulnerability of Diffusion Models [56.08923332178462]
本稿では,MMP-Attackによる拡散モデル生成結果の操作について,特定の接尾辞を元のプロンプトに付加することで提案する。我々のゴールは、拡散モデルを誘導し、元のオブジェクトを同時に除去しながら特定のオブジェクトを生成することである。
論文参考訳（メタデータ） (2024-02-02T12:39:49Z)
Object-oriented backdoor attack against image captioning [40.5688859498834]
画像分類タスクに対するバックドア攻撃は広く研究され、成功したことが証明されている。本稿では,トレーニングデータから画像キャプションモデルへのバックドア攻撃について検討する。本手法は,画像キャプティングモデルのバックドア攻撃に対する弱点を証明し,画像キャプティング分野におけるバックドア攻撃に対する防御意識を高めることを期待する。
論文参考訳（メタデータ） (2024-01-05T01:52:13Z)
Protect Federated Learning Against Backdoor Attacks via Data-Free Trigger Generation [25.072791779134]
Federated Learning (FL)は、大規模クライアントが生データを共有せずに、協力的にモデルをトレーニングすることを可能にする。信頼できないクライアントのデータ監査が欠如しているため、FLは特にバックドアアタックに対する攻撃に対して脆弱である。バックドア攻撃の2つの特徴に基づく,データフリーなトリガジェネレーションに基づく防衛手法を提案する。
論文参考訳（メタデータ） (2023-08-22T10:16:12Z)
Text-to-Image Diffusion Models can be Easily Backdoored through Multimodal Data Poisoning [29.945013694922924]
本稿では,多様なセマンティックレベルで画像合成を行う一般的なマルチモーダル・バックドア・アタック・フレームワークであるBadT2Iを提案する。具体的には、Pixel-Backdoor、Object-Backdoor、Style-Backdoorの3つのレベルに対してバックドア攻撃を行います。正規化損失を利用して,大規模なテキスト・画像拡散モデルにバックドアを効率よく注入する。
論文参考訳（メタデータ） (2023-05-07T03:21:28Z)
Mask and Restore: Blind Backdoor Defense at Test Time with Masked Autoencoder [57.739693628523]
Masked AutoEncoder (BDMAE) を用いたブラインドバックドア防御のためのフレームワークを提案する。 BDMAEは、画像構造的類似性とテスト画像とMAE復元の間のラベル整合性を用いて、トークン空間で可能なトリガを検出する。私たちのアプローチは、モデル復元、パターンのトリガー、画像の良心に盲目です。
論文参考訳（メタデータ） (2023-03-27T19:23:33Z)
Benchmarking Robustness of Multimodal Image-Text Models under Distribution Shift [50.64474103506595]
本稿では,5つのタスクに対する共通の摂動下での12のオープンソース画像テキストモデルの堅牢性について検討する。文字レベルの摂動はテキストの最も深刻な分布シフトであり、ズームボケは画像データにとって最も深刻なシフトである。
論文参考訳（メタデータ） (2022-12-15T18:52:03Z)
SINE: SINgle Image Editing with Text-to-Image Diffusion Models [10.67527134198167]
本研究の目的は、単一画像編集の問題に対処することである。分類器フリーガイダンスに基づく新しいモデルベースガイダンスを提案する。スタイルの変更、コンテンツの追加、オブジェクト操作など、有望な編集機能を示す。
論文参考訳（メタデータ） (2022-12-08T18:57:13Z)
Composing Ensembles of Pre-trained Models via Iterative Consensus [95.10641301155232]
本稿では,異なる事前学習モデルのアンサンブルを構成するための統一的なフレームワークを提案する。事前学習したモデルを「ジェネレータ」あるいは「スコーラ」として使用し、クローズドループ反復コンセンサス最適化により構成する。スコアラーのアンサンブルによって達成されたコンセンサスは、シングルスコアラーのフィードバックよりも優れていることを示す。
論文参考訳（メタデータ） (2022-10-20T18:46:31Z)
Frequency Domain Model Augmentation for Adversarial Attack [91.36850162147678]
ブラックボックス攻撃の場合、代用モデルと被害者モデルの間のギャップは通常大きい。そこで本研究では,通常の訓練モデルと防衛モデルの両方に対して,より伝達可能な対角線モデルを構築するための新しいスペクトルシミュレーション攻撃を提案する。
論文参考訳（メタデータ） (2022-07-12T08:26:21Z)
Dual-Key Multimodal Backdoors for Visual Question Answering [26.988750557552983]
マルチモーダルネットワークは、Dual-Key Multimodal Backdoorsと呼ばれる新しいタイプの攻撃に対して脆弱であることを示す。この攻撃は、最先端のネットワークが使用する複雑な融合機構を利用して、効果的でステルス的なバックドアを埋め込む。本稿では,視覚的質問応答(VQA)タスクにおけるマルチモーダルバックドアについて,複数のアーキテクチャと視覚的特徴バックボーンを用いた広範な検討を行う。
論文参考訳（メタデータ） (2021-12-14T18:59:52Z)
Check Your Other Door! Establishing Backdoor Attacks in the Frequency Domain [80.24811082454367]
検出不能で強力なバックドア攻撃を確立するために周波数領域を利用する利点を示す。また、周波数ベースのバックドア攻撃を成功させる2つの防御方法と、攻撃者がそれらを回避できる可能性を示す。
論文参考訳（メタデータ） (2021-09-12T12:44:52Z)
Clean-Label Backdoor Attacks on Video Recognition Models [87.46539956587908]
画像バックドア攻撃は、ビデオでははるかに効果が低いことを示す。本稿では,映像認識モデルに対するバックドアトリガとして,ユニバーサル・ディバイサル・トリガーを提案する。提案したバックドア攻撃は,最先端のバックドア防御・検出手法に耐性がある。
論文参考訳（メタデータ） (2020-03-06T04:51:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。