論文の概要: Q-matrix Unaware Double JPEG Detection using DCT-Domain Deep BiLSTM
Network
- arxiv url: http://arxiv.org/abs/2104.04765v1
- Date: Sat, 10 Apr 2021 13:41:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 13:45:41.886640
- Title: Q-matrix Unaware Double JPEG Detection using DCT-Domain Deep BiLSTM
Network
- Title(参考訳): DCT-Domain Deep BiLSTM Network を用いたQ行列の二重JPEG検出
- Authors: Vinay Verma, Deepak Singh, and Nitin Khanna
- Abstract要約: 本論文では, JPEG画像から量子化されたDCT係数を, 画素領域で減圧することなく直接抽出する。
提案手法は, 比較的大規模かつ多種多様な公開データセットにおいて, 単一および二重圧縮パッチのベースラインメソッドを上回っている。
- 参考スコア(独自算出の注目度): 15.927832064514266
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The double JPEG compression detection has received much attention in recent
years due to its applicability as a forensic tool for the most widely used JPEG
file format. Existing state-of-the-art CNN-based methods either use histograms
of all the frequencies or rely on heuristics to select histograms of specific
low frequencies to classify single and double compressed images. However, even
amidst lower frequencies of double compressed images/patches, histograms of all
the frequencies do not have distinguishable features to separate them from
single compressed images. This paper directly extracts the quantized DCT
coefficients from the JPEG images without decompressing them in the pixel
domain, obtains all AC frequencies' histograms, uses a module based on $1\times
1$ depth-wise convolutions to learn the inherent relation between each
histogram and corresponding q-factor, and utilizes a tailor-made BiLSTM network
for selectively encoding these feature vector sequences. The proposed system
outperforms several baseline methods on a relatively large and diverse publicly
available dataset of single and double compressed patches. Another essential
aspect of any single vs. double JPEG compression detection system is handling
the scenario where test patches are compressed with entirely different
quantization matrices (Q-matrices) than those used while training; different
camera manufacturers and image processing software generally utilize their
customized quantization matrices. A set of extensive experiments shows that the
proposed system trained on a single dataset generalizes well on other datasets
compressed with completely unseen quantization matrices and outperforms the
state-of-the-art methods in both seen and unseen quantization matrices
scenarios.
- Abstract(参考訳): 近年、JPEG圧縮検出が注目されているのは、最も広く使われているJPEGファイルフォーマットの法医学ツールとしての利用性である。
既存のcnnベースの手法では、全ての周波数のヒストグラムを使用するか、特定の低周波のヒストグラムを選択するヒューリスティックスに依存している。
しかし、二重圧縮画像/パッチの低い周波数でも、すべての周波数のヒストグラムは単一の圧縮画像と区別できる特徴を持っていない。
本稿では,JPEG画像からの量子化DCT係数を直接抽出し,すべてのAC周波数のヒストグラムを取得し,各ヒストグラムと対応するq-要素の固有関係を学習するために1\times 1$ depth-wise convolutionsに基づくモジュールを用いて,これらの特徴ベクトル列を選択的に符号化するためにテーラーメイドのBiLSTMネットワークを利用する。
提案手法は, 比較的大規模かつ多種多様な公開データセットにおいて, 単一および二重圧縮パッチのベースラインメソッドを上回っている。
単一のJPEG圧縮検出システムにおけるもうひとつの重要な側面は、テストパッチがトレーニング中に使用するものと全く異なる量子化行列(Q-行列)で圧縮されるシナリオを扱うことだ。
一連の広範な実験により、単一のデータセットでトレーニングされたシステムは、完全に未知の量子化行列で圧縮された他のデータセットによく一般化し、観測および未検出の量子化行列のシナリオにおいて最先端の方法を上回ることが示されている。
関連論文リスト
- Quantization-free Lossy Image Compression Using Integer Matrix Factorization [8.009813033356478]
我々は、新しい量子化自由損失画像圧縮法を開発するために、整数行列分解(IMF)の変種を導入する。
IMFは、画像データの低ランク表現を、有界整数要素を持つ2つの小さな因子行列の積として提供する。
我々の手法は、JPEGを低ビットレートで0.25ビット/ピクセル(bpp)以下で連続的に上回り、高いビットレートで比較する。
論文 参考訳(メタデータ) (2024-08-22T19:08:08Z) - JDEC: JPEG Decoding via Enhanced Continuous Cosine Coefficients [17.437568540883106]
本稿では,コサインの連続的定式化による局所的暗黙的ニューラル表現を用いたJPEG画像デコーディングの実践的手法を提案する。
提案するネットワークは,フレキシブルカラー画像JPEGアーティファクト削除タスクにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-04-03T03:28:04Z) - Learned Lossless Compression for JPEG via Frequency-Domain Prediction [50.20577108662153]
JPEG画像のロスレス圧縮を学習するための新しいフレームワークを提案する。
周波数領域での学習を可能にするために、DCT係数は暗黙の局所冗長性を利用するためにグループに分割される。
グループ化されたDCT係数のエントロピーモデリングを実現するために、重み付きブロックに基づいてオートエンコーダのようなアーキテクチャを設計する。
論文 参考訳(メタデータ) (2023-03-05T13:15:28Z) - Data-Efficient Sequence-Based Visual Place Recognition with Highly
Compressed JPEG Images [17.847661026367767]
視覚的場所認識(VPR)は、ロボットプラットフォームが環境中をローカライズすることを可能にする基本的なタスクである。
JPEGは画像圧縮標準であり、VPRアプリケーションの低データ伝送を容易にするために高い圧縮比を使用することができる。
高レベルのJPEG圧縮を適用すると、画像の明度とサイズが大幅に削減される。
論文 参考訳(メタデータ) (2023-02-26T13:13:51Z) - Modality-Agnostic Variational Compression of Implicit Neural
Representations [96.35492043867104]
Inlicit Neural Representation (INR) としてパラメータ化されたデータの関数的ビューに基づくモーダリティ非依存型ニューラル圧縮アルゴリズムを提案する。
潜時符号化と疎性の間のギャップを埋めて、ソフトゲーティング機構に非直線的にマッピングされたコンパクト潜時表現を得る。
このような潜在表現のデータセットを得た後、ニューラル圧縮を用いてモーダリティ非依存空間におけるレート/歪みトレードオフを直接最適化する。
論文 参考訳(メタデータ) (2023-01-23T15:22:42Z) - Multi-scale Transformer Network with Edge-aware Pre-training for
Cross-Modality MR Image Synthesis [52.41439725865149]
クロスモダリティ磁気共鳴(MR)画像合成は、与えられたモダリティから欠落するモダリティを生成するために用いられる。
既存の(教師付き学習)手法は、効果的な合成モデルを訓練するために、多くのペア化されたマルチモーダルデータを必要とすることが多い。
マルチスケールトランスフォーマーネットワーク(MT-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T11:40:40Z) - Lossy Medical Image Compression using Residual Learning-based Dual
Autoencoder Model [12.762298148425794]
本稿では,2段階のオートエンコーダをベースとした,マラリアRBC細胞イメージパッチの圧縮のための圧縮機・圧縮機フレームワークを提案する。
提案した残差ベースデュアルオートエンコーダネットワークは、元の画像の再構成に使用されるユニークな特徴を抽出するために訓練される。
このアルゴリズムは、JPEG-LS、JP2K-LM、CALIC、最近のニューラルネットワークアプローチよりも76%、78%、75%、および74%のビット節約率で大幅に改善されている。
論文 参考訳(メタデータ) (2021-08-24T08:38:58Z) - Image Splicing Detection, Localization and Attribution via JPEG Primary
Quantization Matrix Estimation and Clustering [49.75353434786065]
画像領域の異なる2つのJPEGアーチファクトの不整合の検出は、しばしば局所的な画像操作を検出するために使用される。
ドナー画像の異なる領域を識別するエンド・ツー・エンドシステムを提案する。
論文 参考訳(メタデータ) (2021-02-02T11:21:49Z) - Boosting CNN-based primary quantization matrix estimation of double JPEG
images via a classification-like architecture [14.216829750046099]
二重JPEG圧縮画像の一次量子化行列の推定は、画像法医学において重要な問題である。
本稿では,シミル分類アーキテクチャを用いて推定を行う深層学習手法を提案する。
その結果,最先端技術と比較して,提案手法の優れた性能が確認された。
論文 参考訳(メタデータ) (2020-12-01T13:20:11Z) - Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。
我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文 参考訳(メタデータ) (2020-06-22T17:59:07Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。