論文の概要: Progressive Feedback-Enhanced Transformer for Image Forgery Localization
- arxiv url: http://arxiv.org/abs/2311.08910v1
- Date: Wed, 15 Nov 2023 12:31:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-16 16:12:16.865031
- Title: Progressive Feedback-Enhanced Transformer for Image Forgery Localization
- Title(参考訳): 画像偽造定位のためのプログレッシブフィードバックエンハンスドトランス
- Authors: Haochen Zhu, Gang Cao, Xianglin Huang
- Abstract要約: 本稿では,プログレッシブフィードbACkエンハンストランスフォーマー(ProFact)ネットワークを提案する。
実世界の法医学的シナリオに近い大規模な画像サンプルを自動的に生成する効果的な手法を提案する。
提案するローカライザは,画像フォージェリーのローカライゼーション能力とロバスト性において,最先端のローカライザを大きく上回っている。
- 参考スコア(独自算出の注目度): 3.765051882812805
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Blind detection of the forged regions in digital images is an effective
authentication means to counter the malicious use of local image editing
techniques. Existing encoder-decoder forensic networks overlook the fact that
detecting complex and subtle tampered regions typically requires more feedback
information. In this paper, we propose a Progressive FeedbACk-enhanced
Transformer (ProFact) network to achieve coarse-to-fine image forgery
localization. Specifically, the coarse localization map generated by an initial
branch network is adaptively fed back to the early transformer encoder layers
for enhancing the representation of positive features while suppressing
interference factors. The cascaded transformer network, combined with a
contextual spatial pyramid module, is designed to refine discriminative
forensic features for improving the forgery localization accuracy and
reliability. Furthermore, we present an effective strategy to automatically
generate large-scale forged image samples close to real-world forensic
scenarios, especially in realistic and coherent processing. Leveraging on such
samples, a progressive and cost-effective two-stage training protocol is
applied to the ProFact network. The extensive experimental results on nine
public forensic datasets show that our proposed localizer greatly outperforms
the state-of-the-art on the generalization ability and robustness of image
forgery localization. Code will be publicly available at
https://github.com/multimediaFor/ProFact.
- Abstract(参考訳): デジタル画像における偽領域の盲検検出は、ローカル画像編集技術の悪用に対抗する効果的な認証手段である。
既存のエンコーダ・デコーダ法定ネットワークは、複雑で微妙な改ざんされた領域を検出するには、通常より多くのフィードバック情報を必要とするという事実を無視する。
本稿では,画像偽造ローカライズを実現するために,progressive feedback-enhanced transformer (profact) ネットワークを提案する。
具体的には、初期分岐ネットワークによって生成された粗い局所化マップを初期変圧器エンコーダ層に適応的に送り戻し、干渉因子を抑えつつ正の特徴の表現を高める。
カスケードトランスフォーマーネットワークは、文脈的空間ピラミッドモジュールと組み合わせて、偽造のローカライズ精度と信頼性を向上させるための識別法医学的特徴を洗練するように設計されている。
さらに,実世界の法医学的シナリオ,特に現実的かつコヒーレントな処理において,大規模な画像サンプルを自動的に生成する効果的な戦略を提案する。
このようなサンプルを活用して、ProFactネットワークにプログレッシブでコスト効率のよい2段階トレーニングプロトコルを適用する。
9つの公衆法医学データセットの広範な実験結果から,提案するローカライザは,画像偽造ローカライゼーションの一般化能力とロバスト性において,最先端のものを大幅に上回っていることが示された。
コードはhttps://github.com/multimediaFor/ProFact.comで公開される。
関連論文リスト
- In-Domain GAN Inversion for Faithful Reconstruction and Editability [132.68255553099834]
ドメイン誘導型ドメイン正規化とエンコーダで構成されたドメイン内GANインバージョンを提案し、事前学習されたGANモデルのネイティブ潜在空間における反転コードを正規化する。
エンコーダ構造,開始反転点,および逆パラメータ空間の効果を総合的に解析し,再構成品質と編集特性とのトレードオフを観察する。
論文 参考訳(メタデータ) (2023-09-25T08:42:06Z) - Effective Image Tampering Localization via Enhanced Transformer and
Co-attention Fusion [5.691973573807887]
本稿では,2分岐拡張型トランスフォーマーエンコーダを用いた画像改ざんネットワーク(EITLNet)を提案する。
RGBとノイズストリームから抽出した特徴は、座標注意に基づく融合モジュールによって効果的に融合される。
論文 参考訳(メタデータ) (2023-09-17T15:43:06Z) - ReContrast: Domain-Specific Anomaly Detection via Contrastive
Reconstruction [29.370142078092375]
殆どの高度な教師なし異常検出(UAD)手法は、大規模データセットで事前訓練された冷凍エンコーダネットワークの特徴表現をモデル化することに依存している。
本稿では,事前学習した画像領域に対するバイアスを低減するために,ネットワーク全体を最適化する新しい疫学的UAD手法であるReContrastを提案する。
2つの一般的な産業欠陥検出ベンチマークと3つの医用画像UADタスクで実験を行い、現在の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-05T05:21:15Z) - Effective Image Tampering Localization via Semantic Segmentation Network [0.4297070083645049]
既存の画像法は、精度と堅牢性の低い課題に直面している。
本稿では,ディープセマンティックセグメンテーションネットワークに基づく画像改ざん手法を提案する。
論文 参考訳(メタデータ) (2022-08-29T17:22:37Z) - Transformer-based SAR Image Despeckling [53.99620005035804]
本稿では,SAR画像復号化のためのトランスフォーマーネットワークを提案する。
提案する非特定ネットワークは、トランスフォーマーベースのエンコーダにより、異なる画像領域間のグローバルな依存関係を学習することができる。
実験により,提案手法は従来型および畳み込み型ニューラルネットワークに基づく解法よりも大幅に改善されていることが示された。
論文 参考訳(メタデータ) (2022-01-23T20:09:01Z) - TransForensics: Image Forgery Localization with Dense Self-Attention [37.2172540238706]
TransForensicsはトランスフォーマーにインスパイアされた新しい画像フォージェリローカライゼーション手法である。
フレームワークの主要な2つのコンポーネントは、密集自己アテンションエンコーダと密集補正モジュールである。
主要なベンチマーク実験により、TransForensicsは最先端の手法よりも大きなマージンで優れていることを示す。
論文 参考訳(メタデータ) (2021-08-09T08:43:26Z) - D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and
Localization [108.8592577019391]
画像スプライシング偽造検出は、画像指紋によって改ざんされた領域と非改ざんされた領域を区別するグローバルバイナリ分類タスクである。
画像スプライシングフォージェリ検出のためのデュアルエンコーダU-Net(D-Unet)という,固定されていないエンコーダと固定エンコーダを用いた新しいネットワークを提案する。
D-Unetと最先端技術の比較実験において、D-Unetは画像レベルおよび画素レベルの検出において他の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-03T10:54:02Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z) - In-Domain GAN Inversion for Real Image Editing [56.924323432048304]
トレーニング済みのGANジェネレータに実際のイメージを送出する一般的な方法は、遅延コードに戻すことである。
既存の反転法は、通常、画素値によってターゲット画像の再構成にフォーカスするが、反転したコードは元の潜伏空間のセマンティックドメインに着陸しない。
本稿では、入力画像を忠実に再構成し、変換されたコードが編集に意味のある意味を持つようにするためのドメイン内GAN逆変換手法を提案する。
論文 参考訳(メタデータ) (2020-03-31T18:20:18Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。