論文の概要: Two-stream Encoder-Decoder Network for Localizing Image Forgeries
- arxiv url: http://arxiv.org/abs/2009.12881v1
- Date: Sun, 27 Sep 2020 15:49:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 03:44:41.148309
- Title: Two-stream Encoder-Decoder Network for Localizing Image Forgeries
- Title(参考訳): 画像処理のための2ストリームエンコーダデコーダネットワーク
- Authors: Aniruddha Mazumdar and Prabin Kumar Bora
- Abstract要約: 本稿では,高レベル画像と低レベル画像の両方を利用する2ストリームエンコーダデコーダネットワークを提案する。
提案手法の性能評価のために,複数の標準法医学データセットの実験的検討を行った。
- 参考スコア(独自算出の注目度): 4.982505311411925
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a novel two-stream encoder-decoder network, which
utilizes both the high-level and the low-level image features for precisely
localizing forged regions in a manipulated image. This is motivated from the
fact that the forgery creation process generally introduces both the high-level
artefacts (e.g. unnatural contrast) and the low-level artefacts (e.g. noise
inconsistency) to the forged images. In the proposed two-stream network, one
stream learns the low-level manipulation-related features in the encoder side
by extracting noise residuals through a set of high-pass filters in the first
layer of the encoder network. In the second stream, the encoder learns the
high-level image manipulation features from the input image RGB values. The
coarse feature maps of both the encoders are upsampled by their corresponding
decoder network to produce dense feature maps. The dense feature maps of the
two streams are concatenated and fed to a final convolutional layer with
sigmoidal activation to produce pixel-wise prediction. We have carried out
experimental analysis on multiple standard forensics datasets to evaluate the
performance of the proposed method. The experimental results show the efficacy
of the proposed method with respect to the state-of-the-art.
- Abstract(参考訳): 本稿では,高レベル画像と低レベル画像の両方を用いて,操作画像内の鍛造領域を高精度にローカライズする,新しい2ストリームエンコーダ・デコーダネットワークを提案する。
これは、偽造作成プロセスが一般的に、高レベルのアーティファクト(例えば、不自然なコントラスト)と低レベルのアーティファクト(例えば、ノイズの非一貫性)の両方を偽造画像に導入しているという事実に動機づけられている。
提案する2ストリームネットワークでは,エンコーダネットワークの第1層における高域フィルタの集合を通してノイズ残差を抽出することにより,エンコーダ側の低レベル操作関連特徴を学習する。
第2ストリームでは、エンコーダは入力画像RGB値から高レベル画像操作特徴を学習する。
両エンコーダの粗い特徴マップは、対応するデコーダネットワークによってアップサンプリングされ、密集した特徴マップを生成する。
2つのストリームの高密度特徴写像は連結され、シグモダル活性化を伴う最終畳み込み層に供給され、ピクセルワイズ予測を生成する。
提案手法の性能評価のために,複数の標準法医学データセットの実験的検討を行った。
実験結果から,提案手法の有効性が示唆された。
関連論文リスト
- HybridFlow: Infusing Continuity into Masked Codebook for Extreme Low-Bitrate Image Compression [51.04820313355164]
HyrbidFlowは、連続的な機能ベースのストリームとコードブックベースのストリームを組み合わせることで、極めて低い条件下で高い知覚品質と高い忠実性を実現する。
実験の結果、超低速で複数のデータセットにまたがる優れた性能が示された。
論文 参考訳(メタデータ) (2024-04-20T13:19:08Z) - Neuromorphic Synergy for Video Binarization [54.195375576583864]
バイモーダルオブジェクトは視覚システムによって容易に認識できる情報を埋め込む視覚形式として機能する。
ニューロモルフィックカメラは、動きのぼかしを緩和する新しい機能を提供するが、最初にブルーを脱色し、画像をリアルタイムでバイナライズするのは簡単ではない。
本稿では,イベント空間と画像空間の両方で独立に推論を行うために,バイモーダル目標特性の事前知識を活用するイベントベースバイナリ再構築手法を提案する。
また、このバイナリ画像を高フレームレートバイナリビデオに伝搬する効率的な統合手法も開発している。
論文 参考訳(メタデータ) (2024-02-20T01:43:51Z) - DocBinFormer: A Two-Level Transformer Network for Effective Document
Image Binarization [17.087982099845156]
文書のバイナライゼーションは、あらゆる文書分析タスクにおいて最も最適なパフォーマンスを達成するための基本的で重要なステップである。
文書画像の効果的なバイナライゼーションのための視覚変換器をベースとした新しい2レベル視覚変換器(TL-ViT)アーキテクチャであるDocBinFormerを提案する。
論文 参考訳(メタデータ) (2023-12-06T16:01:29Z) - Triple-View Knowledge Distillation for Semi-Supervised Semantic
Segmentation [54.23510028456082]
半教師付きセマンティックセグメンテーションのためのトリプルビュー知識蒸留フレームワークTriKDを提案する。
このフレームワークは、トリプルビューエンコーダとデュアル周波数デコーダを含む。
論文 参考訳(メタデータ) (2023-09-22T01:02:21Z) - A Multi-Stream Fusion Network for Image Splicing Localization [18.505512386111985]
本稿では,複数のエンコーダストリームからなるエンコーダデコーダアーキテクチャを提案する。
各ストリームは、改ざんされた画像または手作りの信号で供給され、個別に処理され、各ストリームから関連する情報を分離して取得する。
複数のストリームから抽出された特徴は、アーキテクチャのボトルネックに融合し、出力のローカライゼーションマップを生成するデコーダネットワークに伝播する。
論文 参考訳(メタデータ) (2022-12-02T12:17:53Z) - Towards Complex Backgrounds: A Unified Difference-Aware Decoder for
Binary Segmentation [4.6932442139663015]
本稿では、差分認識デコーダと呼ばれる新しい統合二重分岐デコーダパラダイムを提案する。
差分認識デコーダは、エンコーダによって出力されるマルチレベル特徴を用いて、人間の目を3段階に模倣する。
その結果、差認識デコーダは、他の最先端のバイナリセグメンテーション手法よりも高い精度で実現できることを示した。
論文 参考訳(メタデータ) (2022-10-27T03:45:29Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - Sequential vessel segmentation via deep channel attention network [5.941874421818899]
本稿では,新しいエンコーダ・デコーダ・ディープネットワークアーキテクチャを提案する。
これは、現在のフレーム中心のスライディングウィンドウ内の2D+tシーケンシャル画像のコンテキストフレームを利用して、現在のフレームから2D容器マスクを分割する。
このアーキテクチャは、エンコーダ段階での時間空間的特徴抽出、スキップ接続層における特徴融合、デコーダ段階でのチャネルアテンション機構を備える。
論文 参考訳(メタデータ) (2021-02-10T02:45:08Z) - Convolutional Autoencoder for Blind Hyperspectral Image Unmixing [0.0]
スペクトルアンミックス(英: spectrum unmixing)は、混合ピクセルを2つの基本的代表、すなわちエンドメンバーとアブリダンスに分解する技法である。
本稿では,ハイパースペクトル画像にブラインドアンミックスを行う新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-11-18T17:41:31Z) - Beyond Single Stage Encoder-Decoder Networks: Deep Decoders for Semantic
Image Segmentation [56.44853893149365]
セマンティックセグメンテーションのための単一エンコーダ-デコーダ手法は、セマンティックセグメンテーションの品質とレイヤー数あたりの効率の観点からピークに達している。
そこで本研究では,より多くの情報コンテンツを取得するために,浅層ネットワークの集合を用いたデコーダに基づく新しいアーキテクチャを提案する。
アーキテクチャをさらに改善するために,ネットワークの注目度を高めるために,クラスの再バランスを目的とした重み関数を導入する。
論文 参考訳(メタデータ) (2020-07-19T18:44:34Z) - Rethinking and Improving Natural Language Generation with Layer-Wise
Multi-View Decoding [59.48857453699463]
シーケンシャル・ツー・シーケンス学習では、デコーダは注意機構に依存してエンコーダから情報を効率的に抽出する。
近年の研究では、異なるエンコーダ層からの表現を多様なレベルの情報に利用することが提案されている。
本稿では, 各デコーダ層に対して, グローバルビューとして機能する最後のエンコーダ層からの表現とともに, ソースシーケンスの立体視のために他のエンコーダ層からのデコーダ層からのデコーダ層を補足するレイヤワイド・マルチビューデコーダを提案する。
論文 参考訳(メタデータ) (2020-05-16T20:00:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。