論文の概要: ObjectFormer for Image Manipulation Detection and Localization
- arxiv url: http://arxiv.org/abs/2203.14681v1
- Date: Mon, 28 Mar 2022 12:27:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 15:26:20.538394
- Title: ObjectFormer for Image Manipulation Detection and Localization
- Title(参考訳): 画像操作検出およびローカライズのためのobjectformer
- Authors: Junke Wang, Zuxuan Wu, Jingjing Chen, Xintong Han, Abhinav
Shrivastava, Ser-Nam Lim, and Yu-Gang Jiang
- Abstract要約: 画像操作の検出とローカライズを行うObjectFormerを提案する。
画像の高周波特徴を抽出し,マルチモーダルパッチの埋め込みとしてRGB特徴と組み合わせる。
各種データセットについて広範な実験を行い,提案手法の有効性を検証した。
- 参考スコア(独自算出の注目度): 118.89882740099137
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in image editing techniques have posed serious challenges to
the trustworthiness of multimedia data, which drives the research of image
tampering detection. In this paper, we propose ObjectFormer to detect and
localize image manipulations. To capture subtle manipulation traces that are no
longer visible in the RGB domain, we extract high-frequency features of the
images and combine them with RGB features as multimodal patch embeddings.
Additionally, we use a set of learnable object prototypes as mid-level
representations to model the object-level consistencies among different
regions, which are further used to refine patch embeddings to capture the
patch-level consistencies. We conduct extensive experiments on various datasets
and the results verify the effectiveness of the proposed method, outperforming
state-of-the-art tampering detection and localization methods.
- Abstract(参考訳): 画像編集技術の最近の進歩はマルチメディアデータの信頼性に深刻な課題をもたらし、画像改ざん検出の研究が進められている。
本稿では,画像操作の検出とローカライズを行うobjectformerを提案する。
RGB領域では見えなくなった微妙な修正トレースをキャプチャするために、画像の高周波特徴を抽出し、マルチモーダルパッチの埋め込みとしてRGB特徴と組み合わせる。
さらに、学習可能なオブジェクトプロトタイプのセットを中レベル表現として使用し、異なる領域間のオブジェクトレベルのコンプリートをモデル化し、パッチレベルのコンプリートをキャプチャするためにパッチ埋め込みをさらに洗練するために使用します。
提案手法の有効性を検証するため,様々なデータセットを広範囲に実験し,提案手法の有効性を検証した。
関連論文リスト
- Mixture-of-Noises Enhanced Forgery-Aware Predictor for Multi-Face Manipulation Detection and Localization [52.87635234206178]
本稿では,多面的操作検出と局所化に適したMoNFAPという新しいフレームワークを提案する。
このフレームワークには2つの新しいモジュールが含まれている: Forgery-aware Unified Predictor (FUP) Module と Mixture-of-Noises Module (MNM)。
論文 参考訳(メタデータ) (2024-08-05T08:35:59Z) - Robust CLIP-Based Detector for Exposing Diffusion Model-Generated Images [13.089550724738436]
拡散モデル(DM)は画像生成に革命をもたらし、様々な分野にまたがる高品質な画像を生成する。
超現実的画像を作成する能力は、現実的コンテンツと合成的コンテンツを区別する上で大きな課題となる。
この研究は、CLIPモデルによって抽出された画像とテキストの特徴をMLP(Multilayer Perceptron)分類器と統合する堅牢な検出フレームワークを導入する。
論文 参考訳(メタデータ) (2024-04-19T14:30:41Z) - MSMG-Net: Multi-scale Multi-grained Supervised Metworks for Multi-task
Image Manipulation Detection and Localization [1.14219428942199]
マルチスケール多層深層ネットワーク(MSMG-Net)を提案する。
我々のMSMG-Netでは,並列なマルチスケール特徴抽出構造を用いてマルチスケール特徴抽出を行う。
MSMG-Netはオブジェクトレベルのセマンティクスを効果的に認識し、エッジアーティファクトをエンコードする。
論文 参考訳(メタデータ) (2022-11-06T14:58:21Z) - Benchmarking performance of object detection under image distortions in
an uncontrolled environment [0.483420384410068]
オブジェクト検出アルゴリズムの堅牢性は、現実世界のアプリケーションにおいて顕著な役割を果たす。
物体検出法の性能は, 被写体内歪みに悩まされていることが証明されている。
本稿では,最先端のオブジェクト検出手法の性能評価フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-28T09:06:52Z) - Towards Effective Image Manipulation Detection with Proposal Contrastive
Learning [61.5469708038966]
本稿では,効果的な画像操作検出のためのコントラスト学習(PCL)を提案する。
我々のPCLは、RGBとノイズビューから2種類のグローバル特徴を抽出し、2ストリームアーキテクチャで構成されている。
我々のPCLは、実際にラベル付けされていないデータに容易に適用でき、手作業によるラベル付けコストを削減し、より一般化可能な機能を促進することができる。
論文 参考訳(メタデータ) (2022-10-16T13:30:13Z) - Multi-Scale Iterative Refinement Network for RGB-D Salient Object
Detection [7.062058947498447]
RGB画像の様々なスケールや解像度に、様々な特徴レベルの意味的ギャップがあるため、健全な視覚的手がかりが現れる。
同様のサージェントパターンは、クロスモーダルなディープイメージとマルチスケールバージョンで利用できる。
注意に基づく融合モジュール (ABF) を設計し, 相互相関に対処する。
論文 参考訳(メタデータ) (2022-01-24T10:33:00Z) - Detect and Locate: A Face Anti-Manipulation Approach with Semantic and
Noise-level Supervision [67.73180660609844]
本稿では,画像中の偽造顔を効率的に検出する,概念的にシンプルだが効果的な方法を提案する。
提案手法は,画像に関する意味の高い意味情報を提供するセグメンテーションマップに依存する。
提案モデルでは,最先端検出精度と顕著なローカライゼーション性能を実現する。
論文 参考訳(メタデータ) (2021-07-13T02:59:31Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。
本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。
最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文 参考訳(メタデータ) (2021-04-20T05:43:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。