論文の概要: Holistic Image Manipulation Detection using Pixel Co-occurrence Matrices
- arxiv url: http://arxiv.org/abs/2104.05693v1
- Date: Mon, 12 Apr 2021 17:54:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 14:03:35.338264
- Title: Holistic Image Manipulation Detection using Pixel Co-occurrence Matrices
- Title(参考訳): 画素共起行列を用いた全体像操作検出
- Authors: Lakshmanan Nataraj, Michael Goebel, Tajuddin Manhar Mohammed,
Shivkumar Chandrasekaran, B. S. Manjunath
- Abstract要約: digital image forensicsは、デジタル操作された画像を検出することを目的としている。
文献におけるほとんどの検出方法は、特定の種類の操作を検出することに焦点を当てている。
本稿では,画素共起行列と深層学習を組み合わせることで,改ざん画像を検出する新しい手法を提案する。
- 参考スコア(独自算出の注目度): 16.224649756613655
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Digital image forensics aims to detect images that have been digitally
manipulated. Realistic image forgeries involve a combination of splicing,
resampling, region removal, smoothing and other manipulation methods. While
most detection methods in literature focus on detecting a particular type of
manipulation, it is challenging to identify doctored images that involve a host
of manipulations. In this paper, we propose a novel approach to holistically
detect tampered images using a combination of pixel co-occurrence matrices and
deep learning. We extract horizontal and vertical co-occurrence matrices on
three color channels in the pixel domain and train a model using a deep
convolutional neural network (CNN) framework. Our method is agnostic to the
type of manipulation and classifies an image as tampered or untampered. We
train and validate our model on a dataset of more than 86,000 images.
Experimental results show that our approach is promising and achieves more than
0.99 area under the curve (AUC) evaluation metric on the training and
validation subsets. Further, our approach also generalizes well and achieves
around 0.81 AUC on an unseen test dataset comprising more than 19,740 images
released as part of the Media Forensics Challenge (MFC) 2020. Our score was
highest among all other teams that participated in the challenge, at the time
of announcement of the challenge results.
- Abstract(参考訳): digital image forensicsは、デジタル操作された画像を検出することを目的としている。
リアル画像の偽造には、スプライシング、再サンプリング、領域除去、スムース化、その他の操作方法の組み合わせが含まれる。
文学におけるほとんどの検出方法は、特定の種類の操作を検出することに焦点を当てているが、多数の操作を含むドクター画像を特定することは困難である。
本稿では,画素共起行列と深層学習を組み合わせることで,改ざん画像を検出する新しい手法を提案する。
画素領域内の3色チャネル上の水平および垂直共起行列を抽出し,deep convolutional neural network(cnn)フレームワークを用いてモデルを訓練する。
本手法は操作のタイプと無関係であり,画像の改ざんやアンスタンプ化に分類する。
86,000以上のイメージのデータセットでモデルをトレーニングし、検証します。
実験の結果,本手法は有望であり,トレーニングおよび検証サブセットの曲線評価基準(AUC)の下で0.99以上の領域を達成できることがわかった。
さらに,メディア・インフォメーション・チャレンジ(mfc)2020で発表された19,740枚以上の画像を含む,未発見のテストデータセット上で約0.81 aucを達成した。
私たちのスコアは、チャレンジ結果の発表時にチャレンジに参加した他のチームの中で最高でした。
関連論文リスト
- A Large-scale AI-generated Image Inpainting Benchmark [11.216906046169683]
本稿では,高品質な塗り絵データセットの作成手法を提案し,それをDiQuID作成に適用する。
DiQuIDは、MS-COCO、RAISE、OpenImagesから78,000個のオリジナル画像から生成された95,000枚のインペイント画像で構成されている。
我々は、最先端の偽造検出手法を用いて包括的なベンチマーク結果を提供し、検出アルゴリズムの評価と改善におけるデータセットの有効性を実証する。
論文 参考訳(メタデータ) (2025-02-10T15:56:28Z) - Semi-Supervised Segmentation via Embedding Matching [0.8896991256227597]
深層畳み込みニューラルネットワークは医用画像セグメンテーションで広く使われているが、訓練には多くのラベル付き画像を必要とする。
本稿では,ほとんどラベルのない画像とラベル付き画像の小さなセットをトレーニングで活用する,新しい半教師付きセグメンテーション手法を提案する。
提案手法はハースドルフの95番目のパーセンタイル (HD95) と0.929のイオウ (IoU) で、HD95 (4.07) とイオウ (0.927) を最短で上回った。
論文 参考訳(メタデータ) (2024-07-05T16:49:21Z) - Detecting Generated Images by Real Images Only [64.12501227493765]
既存の画像検出手法は、生成画像中の視覚的アーティファクトを検出したり、大規模なトレーニングによって、実画像と生成画像の両方から識別的特徴を学習する。
本稿では,新たな視点から生成した画像検出問題にアプローチする。
実画像の共通性を見つけ、特徴空間内の密接な部分空間にマッピングすることで、生成した画像は生成モデルに関係なくサブ空間の外側に投影される。
論文 参考訳(メタデータ) (2023-11-02T03:09:37Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Cascaded Cross-Attention Networks for Data-Efficient Whole-Slide Image
Classification Using Transformers [0.11219061154635457]
全スライディングイメージングは、組織標本の高解像度画像のキャプチャとデジタル化を可能にする。
高解像度情報を効果的に活用するための候補としてトランスフォーマーアーキテクチャが提案されている。
本稿では,抽出されたパッチ数と線形にスケールするクロスアテンション機構に基づく新しいカスケード型クロスアテンションネットワーク(CCAN)を提案する。
論文 参考訳(メタデータ) (2023-05-11T16:42:24Z) - Enhanced Sharp-GAN For Histopathology Image Synthesis [63.845552349914186]
病理組織像合成は、正確ながん検出のためのディープラーニングアプローチの訓練において、データ不足の問題に対処することを目的としている。
核トポロジと輪郭正則化を用いて合成画像の品質を向上させる新しい手法を提案する。
提案手法は、Sharp-GANを2つのデータセット上の4つの画像品質指標すべてで上回る。
論文 参考訳(メタデータ) (2023-01-24T17:54:01Z) - ObjectFormer for Image Manipulation Detection and Localization [118.89882740099137]
画像操作の検出とローカライズを行うObjectFormerを提案する。
画像の高周波特徴を抽出し,マルチモーダルパッチの埋め込みとしてRGB特徴と組み合わせる。
各種データセットについて広範な実験を行い,提案手法の有効性を検証した。
論文 参考訳(メタデータ) (2022-03-28T12:27:34Z) - SISL:Self-Supervised Image Signature Learning for Splicing Detection and
Localization [11.437760125881049]
画像の周波数変換からスプライシング検出/局所化モデルを訓練するための自己教師型アプローチを提案する。
提案したモデルでは,ラベルやメタデータを使わずに,標準データセット上で同様のあるいはより良いパフォーマンスが得られる。
論文 参考訳(メタデータ) (2022-03-15T12:26:29Z) - CNN Filter Learning from Drawn Markers for the Detection of Suggestive
Signs of COVID-19 in CT Images [58.720142291102135]
畳み込みニューラルネットワーク(CNN)のフィルタを推定するために,大規模な注釈付きデータセットやバックプロパゲーションを必要としない手法を提案する。
少数のCT画像に対して、ユーザは、代表的な正常領域と異常領域にマーカーを描画する。
本発明の方法は、カーネルがマークされたものに似た拡張領域に特有な一連の畳み込み層からなる特徴抽出器を生成する。
論文 参考訳(メタデータ) (2021-11-16T15:03:42Z) - M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。
本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。
最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文 参考訳(メタデータ) (2021-04-20T05:43:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。