論文の概要: A Multi-Stream Fusion Network for Image Splicing Localization
- arxiv url: http://arxiv.org/abs/2212.01128v1
- Date: Fri, 2 Dec 2022 12:17:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 16:59:07.098900
- Title: A Multi-Stream Fusion Network for Image Splicing Localization
- Title(参考訳): 画像スプライシングローカライゼーションのためのマルチストリームフュージョンネットワーク
- Authors: Maria Siopi and Giorgos Kordopatis-Zilos and Polychronis Charitidis
and Ioannis Kompatsiaris and Symeon Papadopoulos
- Abstract要約: 本稿では,複数のエンコーダストリームからなるエンコーダデコーダアーキテクチャを提案する。
各ストリームは、改ざんされた画像または手作りの信号で供給され、個別に処理され、各ストリームから関連する情報を分離して取得する。
複数のストリームから抽出された特徴は、アーキテクチャのボトルネックに融合し、出力のローカライゼーションマップを生成するデコーダネットワークに伝播する。
- 参考スコア(独自算出の注目度): 18.505512386111985
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we address the problem of image splicing localization with a
multi-stream network architecture that processes the raw RGB image in parallel
with other handcrafted forensic signals. Unlike previous methods that either
use only the RGB images or stack several signals in a channel-wise manner, we
propose an encoder-decoder architecture that consists of multiple encoder
streams. Each stream is fed with either the tampered image or handcrafted
signals and processes them separately to capture relevant information from each
one independently. Finally, the extracted features from the multiple streams
are fused in the bottleneck of the architecture and propagated to the decoder
network that generates the output localization map. We experiment with two
handcrafted algorithms, i.e., DCT and Splicebuster. Our proposed approach is
benchmarked on three public forensics datasets, demonstrating competitive
performance against several competing methods and achieving state-of-the-art
results, e.g., 0.898 AUC on CASIA.
- Abstract(参考訳): 本稿では,RGB画像と他の手作りの法医学的信号とを並行して処理するマルチストリームネットワークアーキテクチャを用いて,画像スプライシングローカライズの問題に対処する。
rgb画像のみを使用する従来の方法や、複数の信号をチャネル毎にスタックする手法とは異なり、複数のエンコーダストリームからなるエンコーダ-デコーダアーキテクチャを提案する。
各ストリームには、改ざんされた画像または手作りの信号が供給され、それらを別々に処理し、関連する情報をそれぞれ独立して取得する。
最後に、複数のストリームから抽出された特徴をアーキテクチャのボトルネックに融合し、出力ローカライゼーションマップを生成するデコーダネットワークに伝播する。
DCTとSplicebusterの2つの手作りアルゴリズムを実験した。
提案手法は,3つの公開鑑識データセット上でベンチマークを行い,いくつかの競合手法との競合性能を示し,casia上の0.898 aucなど,最先端の成果を得る。
関連論文リスト
- A TextGCN-Based Decoding Approach for Improving Remote Sensing Image Captioning [0.15346678870160887]
テキストグラフ畳み込みネットワーク(TextGCN)と多層LSTMをデプロイする新しいエンコーダデコーダ構成を提案する。
TextGCNによって生成された埋め込みは、文レベルとコーパスレベルの両方で単語間の意味的関係をキャプチャすることでデコーダの理解を高める。
我々は,他の最先端のエンコーダ・デコーダフレームワークに対して,我々のアプローチを広範囲に評価する。
論文 参考訳(メタデータ) (2024-09-27T06:12:31Z) - Neural Distributed Image Compression with Cross-Attention Feature
Alignment [1.2234742322758418]
一対のステレオ画像は、重なり合う視野を持ち、同期および校正された一対のカメラによってキャプチャされる。
1つの画像は圧縮・送信され、もう1つの画像はデコーダでのみ利用できると仮定する。
提案アーキテクチャでは、入力画像をDNNを用いて潜時空間にマッピングし、潜時表現を定量化し、エントロピー符号化を用いて無害に圧縮する。
論文 参考訳(メタデータ) (2022-07-18T10:15:04Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Adjacent Context Coordination Network for Salient Object Detection in
Optical Remote Sensing Images [102.75699068451166]
本稿では,光RSI-SODのためのエンコーダ・デコーダアーキテクチャにおいて,隣接した特徴のコーディネートを探索するための新しいアジャセントコンテキストコーディネートネットワーク(ACCoNet)を提案する。
提案されたACCoNetは、9つの評価基準の下で22の最先端メソッドを上回り、1つのNVIDIA Titan X GPU上で81fpsで動作する。
論文 参考訳(メタデータ) (2022-03-25T14:14:55Z) - LoopITR: Combining Dual and Cross Encoder Architectures for Image-Text
Retrieval [117.15862403330121]
共同学習のためのネットワークにおいて,デュアルエンコーダとクロスエンコーダを組み合わせたLoopITRを提案する。
具体的には、二重エンコーダをクロスエンコーダに強陰性を与え、より識別性の高いクロスエンコーダを用いてその予測を二重エンコーダに戻す。
論文 参考訳(メタデータ) (2022-03-10T16:41:12Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - Convolutional Autoencoder for Blind Hyperspectral Image Unmixing [0.0]
スペクトルアンミックス(英: spectrum unmixing)は、混合ピクセルを2つの基本的代表、すなわちエンドメンバーとアブリダンスに分解する技法である。
本稿では,ハイパースペクトル画像にブラインドアンミックスを行う新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-11-18T17:41:31Z) - Two-stream Encoder-Decoder Network for Localizing Image Forgeries [4.982505311411925]
本稿では,高レベル画像と低レベル画像の両方を利用する2ストリームエンコーダデコーダネットワークを提案する。
提案手法の性能評価のために,複数の標準法医学データセットの実験的検討を行った。
論文 参考訳(メタデータ) (2020-09-27T15:49:17Z) - Wireless Image Retrieval at the Edge [20.45405359815043]
本研究では、エッジデバイスが画像をキャプチャし、エッジサーバから同様の画像を検索するために使用される無線エッジにおける画像検索問題について検討する。
我々の目標は、無線リンクに対する電力及び帯域幅制約下での検索タスクの精度を最大化することである。
本稿では,デジタル通信とアナログ通信の2つの方法を提案する。
論文 参考訳(メタデータ) (2020-07-21T16:15:40Z) - Beyond Single Stage Encoder-Decoder Networks: Deep Decoders for Semantic
Image Segmentation [56.44853893149365]
セマンティックセグメンテーションのための単一エンコーダ-デコーダ手法は、セマンティックセグメンテーションの品質とレイヤー数あたりの効率の観点からピークに達している。
そこで本研究では,より多くの情報コンテンツを取得するために,浅層ネットワークの集合を用いたデコーダに基づく新しいアーキテクチャを提案する。
アーキテクチャをさらに改善するために,ネットワークの注目度を高めるために,クラスの再バランスを目的とした重み関数を導入する。
論文 参考訳(メタデータ) (2020-07-19T18:44:34Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。