論文の概要: Noise and Edge Based Dual Branch Image Manipulation Detection
- arxiv url: http://arxiv.org/abs/2207.00724v1
- Date: Sat, 2 Jul 2022 03:28:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-05 14:39:17.590167
- Title: Noise and Edge Based Dual Branch Image Manipulation Detection
- Title(参考訳): ノイズとエッジに基づくデュアルブランチ画像のマニピュレーション検出
- Authors: Zhongyuan Zhang, Yi Qian, Yanxiang Zhao, Lin Zhu, and Jinjin Wang
- Abstract要約: 本稿では、モデル入力として、改良された制約付き畳み込みによって抽出されたノイズ画像を用いる。
高解像度ブランチとコンテキストブランチで構成されるデュアルブランチネットワークは、アーティファクトのトレースを可能な限りキャプチャするために使用される。
特別に設計された操作エッジ検出モジュールは、これらのアーティファクトをよりよく識別するために、デュアルブランチネットワークに基づいて構築される。
- 参考スコア(独自算出の注目度): 9.400611271697302
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unlike ordinary computer vision tasks that focus more on the semantic content
of images, the image manipulation detection task pays more attention to the
subtle information of image manipulation. In this paper, the noise image
extracted by the improved constrained convolution is used as the input of the
model instead of the original image to obtain more subtle traces of
manipulation. Meanwhile, the dual-branch network, consisting of a
high-resolution branch and a context branch, is used to capture the traces of
artifacts as much as possible. In general, most manipulation leaves
manipulation artifacts on the manipulation edge. A specially designed
manipulation edge detection module is constructed based on the dual-branch
network to identify these artifacts better. The correlation between pixels in
an image is closely related to their distance. The farther the two pixels are,
the weaker the correlation. We add a distance factor to the self-attention
module to better describe the correlation between pixels. Experimental results
on four publicly available image manipulation datasets demonstrate the
effectiveness of our model.
- Abstract(参考訳): 画像の意味的内容にもっとフォーカスする通常のコンピュータビジョンタスクとは異なり、画像操作検出タスクは画像操作の微妙な情報により多くの注意を払う。
本稿では、改良された制約付き畳み込みによって抽出されたノイズ画像を、元の画像の代わりにモデルの入力として使用し、より微妙な操作の痕跡を得る。
一方、高解像度ブランチとコンテキストブランチで構成されるデュアルブランチネットワークは、アーティファクトのトレースを可能な限りキャプチャするために使用される。
一般に、ほとんどの操作は操作エッジに操作アーティファクトを残します。
特別に設計された操作エッジ検出モジュールはデュアルブランチネットワークに基づいて構築され、これらのアーティファクトをよりよく識別する。
画像中の画素間の相関は、その距離と密接に関連している。
2つのピクセルが遠くなるほど相関は弱くなる。
画素間の相関をよりよく記述するために、自己アテンションモジュールに距離係数を加える。
4つの公開画像操作データセットの実験結果から,本モデルの有効性が示された。
関連論文リスト
- Distractors-Immune Representation Learning with Cross-modal Contrastive Regularization for Change Captioning [71.14084801851381]
変更キャプションは、類似した画像間のセマンティックな変化を簡潔に記述することを目的としている。
既存のほとんどの手法は、それらの違いを直接キャプチャし、エラーを起こしやすい特徴を得るリスクを負う。
本稿では,2つの画像表現の対応するチャネルを関連づけるイントラクタ免疫表現学習ネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T13:00:33Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Transformer-Based UNet with Multi-Headed Cross-Attention Skip
Connections to Eliminate Artifacts in Scanned Documents [0.0]
Swin Transformerのバックボーンを使用したUNet構造の変更を行い、スキャンされたドキュメントの典型的なアーティファクトを削除する。
合成データのエラー率を最大53.9%削減したテキスト抽出品質の改善をアーカイブする。
論文 参考訳(メタデータ) (2023-06-05T12:12:23Z) - Auto-Focus Contrastive Learning for Image Manipulation Detection [28.332585163675617]
画像操作検出のためのAF-CL(Auto-Focus Contrastive Learning)ネットワークを提案する。
マルチスケールビュー生成(MSVG)とトレース関係モデリング(TRM)の2つの主要なアイデアを含んでいる。
論文 参考訳(メタデータ) (2022-11-20T09:40:36Z) - Learning Hierarchical Graph Representation for Image Manipulation
Detection [50.04902159383709]
画像操作検出の目的は、画像内の操作された領域を特定し、特定することである。
最近のアプローチでは、画像に残っている改ざんするアーティファクトをキャプチャするために、洗練された畳み込みニューラルネットワーク(CNN)が採用されている。
本稿では2つの並列分岐からなる階層型グラフ畳み込みネットワーク(HGCN-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-15T01:54:25Z) - M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。
本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。
最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文 参考訳(メタデータ) (2021-04-20T05:43:44Z) - Swapping Autoencoder for Deep Image Manipulation [94.33114146172606]
画像操作に特化して設計されたディープモデルであるSwapping Autoencoderを提案する。
キーとなるアイデアは、2つの独立したコンポーネントで画像をエンコードし、交換された組み合わせをリアルなイメージにマップするように強制することだ。
複数のデータセットの実験により、我々のモデルはより良い結果が得られ、最近の生成モデルと比較してかなり効率が良いことが示されている。
論文 参考訳(メタデータ) (2020-07-01T17:59:57Z) - Self-Supervised Linear Motion Deblurring [112.75317069916579]
深層畳み込みニューラルネットワークは、画像の劣化の最先端技術である。
本稿では,自己監督型動作遅延に対する識別可能なreblurモデルを提案する。
我々の実験は、自己監督された単一画像の劣化が本当に実現可能であることを実証した。
論文 参考訳(メタデータ) (2020-02-10T20:15:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。