論文の概要: PSCC-Net: Progressive Spatio-Channel Correlation Network for Image
Manipulation Detection and Localization
- arxiv url: http://arxiv.org/abs/2103.10596v1
- Date: Fri, 19 Mar 2021 02:22:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 14:34:19.103832
- Title: PSCC-Net: Progressive Spatio-Channel Correlation Network for Image
Manipulation Detection and Localization
- Title(参考訳): PSCC-Net:画像操作検出と位置推定のためのプログレッシブ・スパニシブ・チャネル相関ネットワーク
- Authors: Xiaohong Liu, Yaojie Liu, Jun Chen, Xiaoming Liu
- Abstract要約: 画像操作を検出・ローカライズするprogressive spatio-channel correlation networkを開発した。
軽量のバックボーンとプログレッシブ機構のおかげで、PSCC-Netは50以上のFPSで1,080P画像を処理できる。
- 参考スコア(独自算出の注目度): 30.33536626488314
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To defend against manipulation of image content, such as splicing, copy-move,
and removal, we develop a Progressive Spatio-Channel Correlation Network
(PSCC-Net) to detect and localize image manipulations. PSCC-Net processes the
image in a two-path procedure: a top-down path that extracts local and global
features and a bottom-up path that detects whether the input image is
manipulated, and estimates its manipulation masks at 4 scales, where each mask
is conditioned on the previous one. Different from the conventional
encoder-decoder and no-pooling structures, PSCC-Net leverages features at
different scales with dense cross-connections to produce manipulation masks in
a coarse-to-fine fashion. Moreover, a Spatio-Channel Correlation Module (SCCM)
captures both spatial and channel-wise correlations in the bottom-up path,
which endows features with holistic cues, enabling the network to cope with a
wide range of manipulation attacks. Thanks to the light-weight backbone and
progressive mechanism, PSCC-Net can process 1,080P images at 50+ FPS. Extensive
experiments demonstrate the superiority of PSCC-Net over the state-of-the-art
methods on both detection and localization.
- Abstract(参考訳): スプライシング、コピーモーブ、削除といった画像コンテンツの操作を防御するため、画像操作を検出・ローカライズするprogressive spatio-channel correlation network(pscc-net)を開発した。
pscc-netは、局所的および大域的な特徴を抽出するトップダウンパスと、入力画像が操作されているかどうかを検出するボトムアップパスの2つのパス手順で画像を処理し、その操作マスクを4つのスケールで推定する。
従来のエンコーダデコーダやノープール構造とは異なり、PSCC-Netは密接な相互接続を持つ異なるスケールの機能を活用して、粗大な操作マスクを生成する。
さらに、空間的・チャネル的相関モジュール(SCCM)は、ボトムアップ経路における空間的相関とチャネル的相関の両方をキャプチャし、ネットワークが広範囲な操作攻撃に対処できるようにする。
軽量のバックボーンとプログレッシブ機構のおかげで、PSCC-Netは50以上のFPSで1,080P画像を処理できる。
大規模な実験では、PSCC-Netが検出と局所化の両面で最先端の手法よりも優れていることを示した。
関連論文リスト
- GlobalMamba: Global Image Serialization for Vision Mamba [73.50475621164037]
視覚マンバは、視覚トークンの数に対して線形複雑度で強い性能を示した。
既存のほとんどの方法はパッチベースの画像トークン化を採用し、因果処理のためにそれらを1Dシーケンスにフラット化する。
本稿では,グローバルな画像シリアライズ手法を提案し,その画像を因果トークンのシーケンスに変換する。
論文 参考訳(メタデータ) (2024-10-14T09:19:05Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Towards Generic Image Manipulation Detection with Weakly-Supervised
Self-Consistency Learning [49.43362803584032]
本稿では,弱い教師付き画像操作検出を提案する。
このような設定は、より多くのトレーニングイメージを活用することができ、新しい操作テクニックに迅速に適応する可能性がある。
マルチソース整合性(MSC)とパッチ整合性(IPC)の2つの一貫性特性が学習される。
論文 参考訳(メタデータ) (2023-09-03T19:19:56Z) - Deep Neural Networks Fused with Textures for Image Classification [20.58839604333332]
きめ細かい画像分類はコンピュータビジョンにおいて難しい課題である。
グローバルテクスチャと局所パッチ情報を組み合わせたFGICの融合手法を提案する。
提案手法は,有意なマージンを有する既存手法よりも高い分類精度を達成できた。
論文 参考訳(メタデータ) (2023-08-03T15:21:08Z) - Co-attention Propagation Network for Zero-Shot Video Object Segmentation [91.71692262860323]
ゼロショットオブジェクトセグメンテーション(ZS-VOS)は、これらのオブジェクトを事前に知ることなく、ビデオシーケンス内のオブジェクトをセグメンテーションすることを目的としている。
既存のZS-VOSメソッドは、しばしば前景と背景を区別したり、複雑なシナリオで前景を追跡するのに苦労する。
本稿では,オブジェクトの追跡とセグメンテーションが可能なエンコーダデコーダに基づく階層的コアテンション伝搬ネットワーク(HCPN)を提案する。
論文 参考訳(メタデータ) (2023-04-08T04:45:48Z) - Adjacent Context Coordination Network for Salient Object Detection in
Optical Remote Sensing Images [102.75699068451166]
本稿では,光RSI-SODのためのエンコーダ・デコーダアーキテクチャにおいて,隣接した特徴のコーディネートを探索するための新しいアジャセントコンテキストコーディネートネットワーク(ACCoNet)を提案する。
提案されたACCoNetは、9つの評価基準の下で22の最先端メソッドを上回り、1つのNVIDIA Titan X GPU上で81fpsで動作する。
論文 参考訳(メタデータ) (2022-03-25T14:14:55Z) - Learning Hierarchical Graph Representation for Image Manipulation
Detection [50.04902159383709]
画像操作検出の目的は、画像内の操作された領域を特定し、特定することである。
最近のアプローチでは、画像に残っている改ざんするアーティファクトをキャプチャするために、洗練された畳み込みニューラルネットワーク(CNN)が採用されている。
本稿では2つの並列分岐からなる階層型グラフ畳み込みネットワーク(HGCN-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-15T01:54:25Z) - Evidential fully convolutional network for semantic segmentation [6.230751621285322]
本稿では,完全畳み込みネットワーク(fcn)と,イメージセマンティクスセグメンテーションのためのデンプスターシェーファー層からなるハイブリッドアーキテクチャを提案する。
提案手法は,多クラス集合に混乱する画素を割り当てることで,意味セグメンテーションの精度とキャリブレーションを改善することを示す。
論文 参考訳(メタデータ) (2021-03-25T01:21:22Z) - Sequential vessel segmentation via deep channel attention network [5.941874421818899]
本稿では,新しいエンコーダ・デコーダ・ディープネットワークアーキテクチャを提案する。
これは、現在のフレーム中心のスライディングウィンドウ内の2D+tシーケンシャル画像のコンテキストフレームを利用して、現在のフレームから2D容器マスクを分割する。
このアーキテクチャは、エンコーダ段階での時間空間的特徴抽出、スキップ接続層における特徴融合、デコーダ段階でのチャネルアテンション機構を備える。
論文 参考訳(メタデータ) (2021-02-10T02:45:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。