論文の概要: Progressive Feedback-Enhanced Transformer for Image Forgery Localization
- arxiv url: http://arxiv.org/abs/2311.08910v2
- Date: Sat, 08 Feb 2025 09:30:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:26:21.314845
- Title: Progressive Feedback-Enhanced Transformer for Image Forgery Localization
- Title(参考訳): 画像フォージェリーローカライゼーションのためのプログレッシブフィードバック強化トランス
- Authors: Haochen Zhu, Gang Cao, Xianglin Huang,
- Abstract要約: 本稿では,プログレッシブフィードbACkエンハンストランスフォーマー(ProFact)ネットワークを提案する。
実世界の法医学的シナリオに近い大規模な画像サンプルを自動的に生成する効果的な手法を提案する。
提案するローカライザは,画像フォージェリーのローカライゼーション能力とロバスト性において,最先端のローカライザを大きく上回っている。
- 参考スコア(独自算出の注目度): 3.3499889693267093
- License:
- Abstract: Blind detection of the forged regions in digital images is an effective authentication means to counter the malicious use of local image editing techniques. Existing encoder-decoder forensic networks overlook the fact that detecting complex and subtle tampered regions typically requires more feedback information. In this paper, we propose a Progressive FeedbACk-enhanced Transformer (ProFact) network to achieve coarse-to-fine image forgery localization. Specifically, the coarse localization map generated by an initial branch network is adaptively fed back to the early transformer encoder layers, which can enhance the representation of positive features while suppressing interference factors. The cascaded transformer network, combined with a contextual spatial pyramid module, is designed to refine discriminative forensic features for improving the forgery localization accuracy and reliability. Furthermore, we present an effective strategy to automatically generate large-scale forged image samples close to real-world forensic scenarios, especially in realistic and coherent processing. Leveraging on such samples, a progressive and cost-effective two-stage training protocol is applied to the ProFact network. The extensive experimental results on nine public forensic datasets show that our proposed localizer greatly outperforms the state-of-the-art on the generalization ability and robustness of image forgery localization. Code will be publicly available at https://github.com/multimediaFor/ProFact.
- Abstract(参考訳): デジタル画像における偽領域の盲検検出は、ローカル画像編集技術の悪用に対抗する効果的な認証手段である。
既存のエンコーダ・デコーダ法定ネットワークは、複雑で微妙な改ざんされた領域を検出するには、通常より多くのフィードバック情報を必要とするという事実を無視する。
本稿では,プログレッシブフィードbACk拡張トランスフォーマー(ProFact)ネットワークを提案する。
具体的には、初期分岐ネットワークによって生成された粗い局所化マップを初期変圧器エンコーダ層に適応的にフィードバックし、干渉因子を抑えつつ正の特徴の表現を高めることができる。
カスケード変換器ネットワークは、コンテキスト空間ピラミッドモジュールと組み合わせて、偽の局所化精度と信頼性を向上させるために識別法医学的特徴を洗練させるように設計されている。
さらに,実世界の法医学的シナリオ,特に現実的かつ一貫性のある処理において,大規模な画像サンプルを自動的に生成する効果的な手法を提案する。
このようなサンプルを活用して、ProFactネットワークにプログレッシブで費用対効果の高い2段階トレーニングプロトコルを適用する。
9つの公開法医学的データセットの広範な実験結果から,提案したローカライザは,画像フォージェリーのローカライゼーションの一般化能力とロバスト性において,最先端のローカライザを大きく上回っていることが明らかとなった。
コードはhttps://github.com/multimediaFor/ProFact.comで公開される。
関連論文リスト
- In-Domain GAN Inversion for Faithful Reconstruction and Editability [132.68255553099834]
ドメイン誘導型ドメイン正規化とエンコーダで構成されたドメイン内GANインバージョンを提案し、事前学習されたGANモデルのネイティブ潜在空間における反転コードを正規化する。
エンコーダ構造,開始反転点,および逆パラメータ空間の効果を総合的に解析し,再構成品質と編集特性とのトレードオフを観察する。
論文 参考訳(メタデータ) (2023-09-25T08:42:06Z) - Effective Image Tampering Localization via Enhanced Transformer and
Co-attention Fusion [5.691973573807887]
本稿では,2分岐拡張型トランスフォーマーエンコーダを用いた画像改ざんネットワーク(EITLNet)を提案する。
RGBとノイズストリームから抽出した特徴は、座標注意に基づく融合モジュールによって効果的に融合される。
論文 参考訳(メタデータ) (2023-09-17T15:43:06Z) - ReContrast: Domain-Specific Anomaly Detection via Contrastive
Reconstruction [29.370142078092375]
殆どの高度な教師なし異常検出(UAD)手法は、大規模データセットで事前訓練された冷凍エンコーダネットワークの特徴表現をモデル化することに依存している。
本稿では,事前学習した画像領域に対するバイアスを低減するために,ネットワーク全体を最適化する新しい疫学的UAD手法であるReContrastを提案する。
2つの一般的な産業欠陥検出ベンチマークと3つの医用画像UADタスクで実験を行い、現在の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-05T05:21:15Z) - Effective Image Tampering Localization via Semantic Segmentation Network [0.4297070083645049]
既存の画像法は、精度と堅牢性の低い課題に直面している。
本稿では,ディープセマンティックセグメンテーションネットワークに基づく画像改ざん手法を提案する。
論文 参考訳(メタデータ) (2022-08-29T17:22:37Z) - Transformer-based SAR Image Despeckling [53.99620005035804]
本稿では,SAR画像復号化のためのトランスフォーマーネットワークを提案する。
提案する非特定ネットワークは、トランスフォーマーベースのエンコーダにより、異なる画像領域間のグローバルな依存関係を学習することができる。
実験により,提案手法は従来型および畳み込み型ニューラルネットワークに基づく解法よりも大幅に改善されていることが示された。
論文 参考訳(メタデータ) (2022-01-23T20:09:01Z) - TransForensics: Image Forgery Localization with Dense Self-Attention [37.2172540238706]
TransForensicsはトランスフォーマーにインスパイアされた新しい画像フォージェリローカライゼーション手法である。
フレームワークの主要な2つのコンポーネントは、密集自己アテンションエンコーダと密集補正モジュールである。
主要なベンチマーク実験により、TransForensicsは最先端の手法よりも大きなマージンで優れていることを示す。
論文 参考訳(メタデータ) (2021-08-09T08:43:26Z) - D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and
Localization [108.8592577019391]
画像スプライシング偽造検出は、画像指紋によって改ざんされた領域と非改ざんされた領域を区別するグローバルバイナリ分類タスクである。
画像スプライシングフォージェリ検出のためのデュアルエンコーダU-Net(D-Unet)という,固定されていないエンコーダと固定エンコーダを用いた新しいネットワークを提案する。
D-Unetと最先端技術の比較実験において、D-Unetは画像レベルおよび画素レベルの検出において他の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-03T10:54:02Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z) - In-Domain GAN Inversion for Real Image Editing [56.924323432048304]
トレーニング済みのGANジェネレータに実際のイメージを送出する一般的な方法は、遅延コードに戻すことである。
既存の反転法は、通常、画素値によってターゲット画像の再構成にフォーカスするが、反転したコードは元の潜伏空間のセマンティックドメインに着陸しない。
本稿では、入力画像を忠実に再構成し、変換されたコードが編集に意味のある意味を持つようにするためのドメイン内GAN逆変換手法を提案する。
論文 参考訳(メタデータ) (2020-03-31T18:20:18Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。