論文の概要: Training CNNs in Presence of JPEG Compression: Multimedia Forensics vs
Computer Vision
- arxiv url: http://arxiv.org/abs/2009.12088v1
- Date: Fri, 25 Sep 2020 08:47:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 22:50:12.216314
- Title: Training CNNs in Presence of JPEG Compression: Multimedia Forensics vs
Computer Vision
- Title(参考訳): JPEG圧縮の存在下でCNNを訓練する - マルチメディアフォサイシクスとコンピュータビジョン
- Authors: Sara Mandelli, Nicol\`o Bonettini, Paolo Bestagini, Stefano Tubaro
- Abstract要約: 我々は,異なるコンピュータビジョンと法医学的画像分類問題を考慮したCNNトレーニングにおけるJPEGの効果に着目した。
法医学的検知器を適切に訓練するためには,トレーニングデータセットを作成する際にこれらの効果を検討する必要がある。
- 参考スコア(独自算出の注目度): 18.3198215837364
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Convolutional Neural Networks (CNNs) have proved very accurate in multiple
computer vision image classification tasks that required visual inspection in
the past (e.g., object recognition, face detection, etc.). Motivated by these
astonishing results, researchers have also started using CNNs to cope with
image forensic problems (e.g., camera model identification, tampering
detection, etc.). However, in computer vision, image classification methods
typically rely on visual cues easily detectable by human eyes. Conversely,
forensic solutions rely on almost invisible traces that are often very subtle
and lie in the fine details of the image under analysis. For this reason,
training a CNN to solve a forensic task requires some special care, as common
processing operations (e.g., resampling, compression, etc.) can strongly hinder
forensic traces. In this work, we focus on the effect that JPEG has on CNN
training considering different computer vision and forensic image
classification problems. Specifically, we consider the issues that rise from
JPEG compression and misalignment of the JPEG grid. We show that it is
necessary to consider these effects when generating a training dataset in order
to properly train a forensic detector not losing generalization capability,
whereas it is almost possible to ignore these effects for computer vision
tasks.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)は、過去に視覚検査を必要とする複数のコンピュータビジョン画像分類タスク(物体認識、顔検出など)において非常に正確であることが証明されている。
これらの驚くべき結果に動機づけられた研究者たちは、cnnを使って画像法医学的な問題(カメラのモデル識別、改ざん検出など)に対処し始めた。
しかし、コンピュータビジョンでは、画像分類法は通常、人間の目で容易に検出できる視覚手がかりに依存する。
逆に、法医学的な解決策は、しばしば非常に微妙で分析中の画像の細部にあるほとんど見えない痕跡に依存している。
このため、一般的な処理操作(リサンプリング、圧縮など)が法医学的トレースを強く妨げる可能性があるため、法医学的タスクを解決するためにCNNを訓練するには特別な注意が必要である。
本研究では,異なるコンピュータビジョンと法医学的画像分類問題を考慮したCNNトレーニングにおけるJPEGの効果に着目した。
具体的には、JPEG圧縮とJPEGグリッドの誤調整から生じる問題を考察する。
一般化能力が失われることなく鑑識検出器を適切に訓練するためには、訓練データセットを生成する際にこれらの効果を検討する必要があるが、コンピュータビジョンタスクではこれらの効果を無視することはほぼ可能である。
関連論文リスト
- Visual Context-Aware Person Fall Detection [52.49277799455569]
画像中の個人とオブジェクトを半自動分離するセグメンテーションパイプラインを提案する。
ベッド、椅子、車椅子などの背景オブジェクトは、転倒検知システムに挑戦し、誤ったポジティブアラームを引き起こす。
トレーニング中のオブジェクト固有のコンテキスト変換が、この課題を効果的に軽減することを示す。
論文 参考訳(メタデータ) (2024-04-11T19:06:36Z) - Human-imperceptible, Machine-recognizable Images [76.01951148048603]
より良い開発AIシステムと、センシティブなトレーニングデータから距離を置くことの間の、ソフトウェアエンジニアに関する大きな対立が露呈している。
画像が暗号化され、人間に認識され、機械に認識される」という、効率的なプライバシー保護学習パラダイムを提案する。
提案手法は,機械が認識可能な情報を保存しながら,暗号化された画像が人間に認識されなくなることを保証できることを示す。
論文 参考訳(メタデータ) (2023-06-06T13:41:37Z) - Pretrained ViTs Yield Versatile Representations For Medical Images [4.443013185089128]
ヴィジュアルトランスフォーマー(ViT)はCNNの対抗馬として登場している。
いくつかの標準的な2次元医用画像ベンチマークのデータセットとタスクについて、一連の実験を行った。
以上の結果から,CNNはスクラッチからトレーニングすると性能が向上するが,ImageNetで事前トレーニングを行った場合,市販のビジョントランスフォーマーはCNNと同等に動作可能であることがわかった。
論文 参考訳(メタデータ) (2023-03-13T11:53:40Z) - Forged Image Detection using SOTA Image Classification Deep Learning
Methods for Image Forensics with Error Level Analysis [2.719418335747252]
画像法医学はコンピュータビジョンアプリケーションの主要な分野の1つである。
forgery of image is sub-category of image forensics and can detected using Error Level Analysis。
我々は,CASIA ITDE v.2データセットを用いた誤りレベルの解析により,最先端の画像分類モデルを用いて転送学習を行う。
論文 参考訳(メタデータ) (2022-11-28T10:10:42Z) - Saccade Mechanisms for Image Classification, Object Detection and
Tracking [12.751552698602744]
生体視覚からのササード機構を用いて、ディープニューラルネットワークを分類や物体検出の問題をより効率的にする方法について検討する。
提案手法は、注意駆動型視覚処理とササードのアイデアに基づいており、注意に影響された眼球運動のミニチュア化を図っている。
論文 参考訳(メタデータ) (2022-06-10T13:50:34Z) - Follow My Eye: Using Gaze to Supervise Computer-Aided Diagnosis [54.60796004113496]
医用画像を読む放射線科医の眼球運動は,DNNベースのコンピュータ支援診断システム(CAD)を訓練するための新たな指導形態であることが実証された。
画像を読んでいるときに、放射線科医の視線を記録します。
視線情報は処理され、アテンション一貫性モジュールを介してDNNの注意を監督するために使用される。
論文 参考訳(メタデータ) (2022-04-06T08:31:05Z) - BreakingBED -- Breaking Binary and Efficient Deep Neural Networks by
Adversarial Attacks [65.2021953284622]
CNNのホワイトボックス攻撃やブラックボックス攻撃に対する堅牢性について検討する。
結果は、蒸留されたCNN、エージェントベースの最新のprunedモデル、およびバイナライズニューラルネットワークのために示されています。
論文 参考訳(メタデータ) (2021-03-14T20:43:19Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - A Transferable Anti-Forensic Attack on Forensic CNNs Using A Generative
Adversarial Network [24.032025811564814]
畳み込みニューラルネットワーク(CNN)はマルチメディア法医学で広く使われている。
これらのCNNベースのフォレンジックアルゴリズムをだますために、反フォレンジック攻撃が開発されている。
様々な操作操作で残されている法医学的痕跡を除去する新しい対法医学的攻撃フレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-23T19:31:59Z) - D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and
Localization [108.8592577019391]
画像スプライシング偽造検出は、画像指紋によって改ざんされた領域と非改ざんされた領域を区別するグローバルバイナリ分類タスクである。
画像スプライシングフォージェリ検出のためのデュアルエンコーダU-Net(D-Unet)という,固定されていないエンコーダと固定エンコーダを用いた新しいネットワークを提案する。
D-Unetと最先端技術の比較実験において、D-Unetは画像レベルおよび画素レベルの検出において他の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-03T10:54:02Z) - CNN-based fast source device identification [30.17213343080699]
畳み込みニューラルネットワーク(CNN)を用いた高速かつ正確な解法を提案する。
具体的には、カメラ指紋と画像ノイズをパッチレベルで比較する方法を学習する2チャンネルCNNを提案する。
このアプローチは、ソーシャルネットワークなど、大規模な画像データベースが分析されるシナリオに特に適している。
論文 参考訳(メタデータ) (2020-01-31T14:01:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。