論文の概要: Camera Model Identification with SPAIR-Swin and Entropy based Non-Homogeneous Patches
- arxiv url: http://arxiv.org/abs/2503.22120v1
- Date: Fri, 28 Mar 2025 03:47:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-31 15:31:25.887055
- Title: Camera Model Identification with SPAIR-Swin and Entropy based Non-Homogeneous Patches
- Title(参考訳): SPAIR-Swin and Entropy based Non-homogeneous Patches を用いたカメラモデル同定
- Authors: Protyay Dey, Rejoy Chakraborty, Abhilasha S. Jadhav, Kapil Rana, Gaurav Sharma, Puneet Goyal,
- Abstract要約: ソースカメラモデル識別(SCMI)は、画像鑑定において、認証と著作権保護を含む応用において重要な役割を担っている。
空間的注意機構と逆残差ブロック(SPAIR)とスウィントランスフォーマーを組み合わせた新しいモデルであるSPAIR-Swinを提案する。
SPAIR-Swinは、グローバル機能とローカル機能の両方を効果的にキャプチャし、SCMIに特に有効であるノイズパターンなどのアーティファクトの堅牢な識別を可能にする。
- 参考スコア(独自算出の注目度): 8.348489591573966
- License:
- Abstract: Source camera model identification (SCMI) plays a pivotal role in image forensics with applications including authenticity verification and copyright protection. For identifying the camera model used to capture a given image, we propose SPAIR-Swin, a novel model combining a modified spatial attention mechanism and inverted residual block (SPAIR) with a Swin Transformer. SPAIR-Swin effectively captures both global and local features, enabling robust identification of artifacts such as noise patterns that are particularly effective for SCMI. Additionally, unlike conventional methods focusing on homogeneous patches, we propose a patch selection strategy for SCMI that emphasizes high-entropy regions rich in patterns and textures. Extensive evaluations on four benchmark SCMI datasets demonstrate that SPAIR-Swin outperforms existing methods, achieving patch-level accuracies of 99.45%, 98.39%, 99.45%, and 97.46% and image-level accuracies of 99.87%, 99.32%, 100%, and 98.61% on the Dresden, Vision, Forchheim, and Socrates datasets, respectively. Our findings highlight that high-entropy patches, which contain high-frequency information such as edge sharpness, noise, and compression artifacts, are more favorable in improving SCMI accuracy. Code will be made available upon request.
- Abstract(参考訳): ソースカメラモデル識別(SCMI)は、画像鑑定において、認証と著作権保護を含む応用において重要な役割を担っている。
空間的注意機構と逆残差ブロック(SPAIR)とスウィントランスフォーマーを組み合わせた新しいモデルであるSPAIR-Swinを提案する。
SPAIR-Swinは、グローバル機能とローカル機能の両方を効果的にキャプチャし、SCMIに特に有効であるノイズパターンなどのアーティファクトの堅牢な識別を可能にする。
また,同種パッチに着目した従来の手法とは異なり,パターンやテクスチャに富む高エントロピー領域を重視したSCMIのパッチ選択戦略を提案する。
4つのベンチマークSCMIデータセットの大規模な評価によると、SPAIR-Swinは、パッチレベルの精度を99.45%、98.39%、99.45%、97.46%、画像レベルの精度を99.87%、99.32%、100%、98.61%、ドレスデン、ビジョン、フォルヒハイム、ソクラテスのデータセットでそれぞれ向上している。
その結果, エッジシャープネス, ノイズ, 圧縮アーティファクトなどの高周波情報を含む高エントロピーパッチは, SCMI精度の向上に有効であることが示唆された。
コードは要求に応じて利用可能になる。
関連論文リスト
- Hybrid Deepfake Image Detection: A Comprehensive Dataset-Driven Approach Integrating Convolutional and Attention Mechanisms with Frequency Domain Features [0.6700983301090583]
ディープフェイク検出に3つの異なるニューラルネットワークアーキテクチャを用いるアンサンブルベースのアプローチを提案する。
実画像と偽画像を結合クラスタにグループ化する上で,これらのモデルの有効性を実証的に実証した。
我々の重み付けアンサンブルモデルは、SPカップ2025大会の検証データセットにおいて、93.23%の優れた精度を達成する。
論文 参考訳(メタデータ) (2025-02-15T06:02:11Z) - A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - Adaptive Residual Transformation for Enhanced Feature-Based OOD Detection in SAR Imagery [5.63530048112308]
実際の戦場シナリオにおける未知の標的の存在は避けられない。
この問題に対処するために、様々な機能ベースのアウト・オブ・ディストリビューションアプローチが開発されている。
我々は,特徴量に基づくOOD検出をクラス局所化された特徴量に基づくアプローチに変換することを提案する。
論文 参考訳(メタデータ) (2024-11-01T00:09:02Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
ディープニューラルネットワークは、アンダーサンプル計測から高忠実度画像を再構成する大きな可能性を示している。
我々のモデルは、離散化に依存しないアーキテクチャであるニューラル演算子に基づいている。
我々の推論速度は拡散法よりも1,400倍速い。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Cascaded Cross-Attention Networks for Data-Efficient Whole-Slide Image
Classification Using Transformers [0.11219061154635457]
全スライディングイメージングは、組織標本の高解像度画像のキャプチャとデジタル化を可能にする。
高解像度情報を効果的に活用するための候補としてトランスフォーマーアーキテクチャが提案されている。
本稿では,抽出されたパッチ数と線形にスケールするクロスアテンション機構に基づく新しいカスケード型クロスアテンションネットワーク(CCAN)を提案する。
論文 参考訳(メタデータ) (2023-05-11T16:42:24Z) - Enhanced Sharp-GAN For Histopathology Image Synthesis [63.845552349914186]
病理組織像合成は、正確ながん検出のためのディープラーニングアプローチの訓練において、データ不足の問題に対処することを目的としている。
核トポロジと輪郭正則化を用いて合成画像の品質を向上させる新しい手法を提案する。
提案手法は、Sharp-GANを2つのデータセット上の4つの画像品質指標すべてで上回る。
論文 参考訳(メタデータ) (2023-01-24T17:54:01Z) - Lightweight 3D Convolutional Neural Network for Schizophrenia diagnosis
using MRI Images and Ensemble Bagging Classifier [1.487444917213389]
本稿では,MRI画像を用いた統合失調症診断のための軽量3次元畳み込みニューラルネットワーク(CNN)フレームワークを提案する。
精度は92.22%、感度94.44%、特異度90%、精度90.43%、リコール94.44%、F1スコア92.39%、G平均92.19%である。
論文 参考訳(メタデータ) (2022-11-05T10:27:37Z) - SAR Despeckling using a Denoising Diffusion Probabilistic Model [52.25981472415249]
スペックルの存在は画像品質を劣化させ、SAR画像理解アプリケーションの性能に悪影響を及ぼす。
本稿では,SAR脱種のための拡散確率モデルであるSAR-DDPMを紹介する。
提案手法は, 最先端の切り離し法と比較して, 定量化と定性化の両面で有意な改善を実現している。
論文 参考訳(メタデータ) (2022-06-09T14:00:26Z) - Coarse-to-Fine Sparse Transformer for Hyperspectral Image Reconstruction [138.04956118993934]
本稿では, サース・トゥ・ファインス・スパース・トランス (CST) を用いた新しいトランス方式を提案する。
HSI再構成のための深層学習にHSI空間を埋め込んだCST
特に,CSTは,提案したスペクトル認識スクリーニング機構(SASM)を粗いパッチ選択に使用し,選択したパッチを,細かなピクセルクラスタリングと自己相似性キャプチャのために,カスタマイズしたスペクトル集約ハッシュ型マルチヘッド自己アテンション(SAH-MSA)に入力する。
論文 参考訳(メタデータ) (2022-03-09T16:17:47Z) - Hierarchical Convolutional Neural Network with Feature Preservation and
Autotuned Thresholding for Crack Detection [5.735035463793008]
ドローンの画像はインフラ表面の欠陥の自動検査にますます使われている。
本稿では,階層型畳み込みニューラルネットワークを用いた深層学習手法を提案する。
提案手法は, 道路, 橋, 舗装の表面ひび割れの同定に応用されている。
論文 参考訳(メタデータ) (2021-04-21T13:07:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。