論文の概要: Auto-Focus Contrastive Learning for Image Manipulation Detection
- arxiv url: http://arxiv.org/abs/2211.10922v1
- Date: Sun, 20 Nov 2022 09:40:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 20:14:23.404134
- Title: Auto-Focus Contrastive Learning for Image Manipulation Detection
- Title(参考訳): 画像操作検出のためのオートフォーカスコントラスト学習
- Authors: Wenyan Pan, Zhili Zhou, Guangcan Liu, Teng Huang, Hongyang Yan, Q.M.
Jonathan Wu
- Abstract要約: 画像操作検出のためのAF-CL(Auto-Focus Contrastive Learning)ネットワークを提案する。
マルチスケールビュー生成(MSVG)とトレース関係モデリング(TRM)の2つの主要なアイデアを含んでいる。
- 参考スコア(独自算出の注目度): 28.332585163675617
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generally, current image manipulation detection models are simply built on
manipulation traces. However, we argue that those models achieve sub-optimal
detection performance as it tends to: 1) distinguish the manipulation traces
from a lot of noisy information within the entire image, and 2) ignore the
trace relations among the pixels of each manipulated region and its
surroundings. To overcome these limitations, we propose an Auto-Focus
Contrastive Learning (AF-CL) network for image manipulation detection. It
contains two main ideas, i.e., multi-scale view generation (MSVG) and trace
relation modeling (TRM). Specifically, MSVG aims to generate a pair of views,
each of which contains the manipulated region and its surroundings at a
different scale, while TRM plays a role in modeling the trace relations among
the pixels of each manipulated region and its surroundings for learning the
discriminative representation. After learning the AF-CL network by minimizing
the distance between the representations of corresponding views, the learned
network is able to automatically focus on the manipulated region and its
surroundings and sufficiently explore their trace relations for accurate
manipulation detection. Extensive experiments demonstrate that, compared to the
state-of-the-arts, AF-CL provides significant performance improvements, i.e.,
up to 2.5%, 7.5%, and 0.8% F1 score, on CAISA, NIST, and Coverage datasets,
respectively.
- Abstract(参考訳): 一般的に、現在の画像操作検出モデルは、単に操作トレース上に構築されている。
しかし、これらのモデルが準最適検出性能を達成していると主張する。
1)画像全体のノイズの多い情報と操作トレースを区別し、
2) 各操作領域とその周囲の画素間のトレース関係を無視する。
これらの制約を克服するために,画像検出のためのオートフォーカスコントラスト学習(AF-CL)ネットワークを提案する。
マルチスケールビュー生成(MSVG)とトレース関係モデリング(TRM)の2つの主要なアイデアを含んでいる。
特にMSVGは、操作された領域とその周辺を異なるスケールで含む一対のビューを生成することを目的としており、TRMは各操作された領域とその周辺領域のトレース関係をモデル化し、識別表現を学習する役割を担っている。
対応するビューの表現間の距離を最小化してAF-CLネットワークを学習した後、学習ネットワークは、操作された領域とその周辺に自動的に集中し、そのトレース関係を十分に探索し、正確な操作検出を行うことができる。
AF-CLは最先端技術と比較すると、CAISA、NIST、Coverageのデータセットでそれぞれ2.5%、7.5%、0.8%のF1スコアの大幅なパフォーマンス向上を実現している。
関連論文リスト
- MLMT-CNN for Object Detection and Segmentation in Multi-layer and Multi-spectral Images [4.2623421577291225]
画像バンド間の依存関係を利用して3次元ARローカライゼーションを生成するマルチタスク深層学習フレームワークを提案する。
我々のフレームワークは、すべてのモードで平均0.72 IoUと0.90 F1スコアを達成する。
論文 参考訳(メタデータ) (2024-07-19T17:21:53Z) - Learning 1D Causal Visual Representation with De-focus Attention Networks [108.72931590504406]
本稿では,1次元因果モデルを用いた画像表現の実現可能性について検討する。
本稿では,学習可能な帯域通過フィルタを用いて様々な注意パターンを生成するDe-focus Attention Networksを提案する。
論文 参考訳(メタデータ) (2024-06-06T17:59:56Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [63.54342601757723]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Towards Generic Image Manipulation Detection with Weakly-Supervised
Self-Consistency Learning [49.43362803584032]
本稿では,弱い教師付き画像操作検出を提案する。
このような設定は、より多くのトレーニングイメージを活用することができ、新しい操作テクニックに迅速に適応する可能性がある。
マルチソース整合性(MSC)とパッチ整合性(IPC)の2つの一貫性特性が学習される。
論文 参考訳(メタデータ) (2023-09-03T19:19:56Z) - Towards Effective Image Manipulation Detection with Proposal Contrastive
Learning [61.5469708038966]
本稿では,効果的な画像操作検出のためのコントラスト学習(PCL)を提案する。
我々のPCLは、RGBとノイズビューから2種類のグローバル特徴を抽出し、2ストリームアーキテクチャで構成されている。
我々のPCLは、実際にラベル付けされていないデータに容易に適用でき、手作業によるラベル付けコストを削減し、より一般化可能な機能を促進することができる。
論文 参考訳(メタデータ) (2022-10-16T13:30:13Z) - Noise and Edge Based Dual Branch Image Manipulation Detection [9.400611271697302]
本稿では、モデル入力として、改良された制約付き畳み込みによって抽出されたノイズ画像を用いる。
高解像度ブランチとコンテキストブランチで構成されるデュアルブランチネットワークは、アーティファクトのトレースを可能な限りキャプチャするために使用される。
特別に設計された操作エッジ検出モジュールは、これらのアーティファクトをよりよく識別するために、デュアルブランチネットワークに基づいて構築される。
論文 参考訳(メタデータ) (2022-07-02T03:28:51Z) - Learning Hierarchical Graph Representation for Image Manipulation
Detection [50.04902159383709]
画像操作検出の目的は、画像内の操作された領域を特定し、特定することである。
最近のアプローチでは、画像に残っている改ざんするアーティファクトをキャプチャするために、洗練された畳み込みニューラルネットワーク(CNN)が採用されている。
本稿では2つの並列分岐からなる階層型グラフ畳み込みネットワーク(HGCN-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-15T01:54:25Z) - Image Manipulation Detection by Multi-View Multi-Scale Supervision [11.319080833880307]
画像操作検出の主な課題は、新しいデータの操作に敏感な一般化可能な特徴の学習方法である。
本稿では,多視点特徴学習とマルチスケール監視による両面の考察を行う。
我々の思考はMVSS-Netと呼ばれる新しいネットワークによって実現される。
論文 参考訳(メタデータ) (2021-04-14T13:05:58Z) - DetCo: Unsupervised Contrastive Learning for Object Detection [64.22416613061888]
教師なしのコントラスト学習は,CNNを用いた画像表現学習において大きな成功を収めている。
我々は,グローバルイメージとローカルイメージパッチのコントラストをフルに検討する,DetCoという新しいコントラスト学習手法を提案する。
DetCoは1倍のスケジュールでMask RCNN-C4/FPN/RetinaNet上で1.6/1.2/1.0 APで教師付き手法を一貫して上回っている。
論文 参考訳(メタデータ) (2021-02-09T12:47:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。