論文の概要: DocQT: Improving Document Forgery Localization Robustness via Diverse JPEG Quantization Tables
- arxiv url: http://arxiv.org/abs/2605.19688v1
- Date: Tue, 19 May 2026 11:20:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 01:01:02.810132
- Title: DocQT: Improving Document Forgery Localization Robustness via Diverse JPEG Quantization Tables
- Title(参考訳): DocQT: 分散JPEG量子化テーブルによる文書フォージェリローカライゼーションロバストネスの改善
- Authors: Kylian Ronfleux-Corail, Guillaume Bernard, Mickaël Coustaty, Nicolas Sidère,
- Abstract要約: ドキュメントローカライゼーションモデルは、公開ベンチマークで高いパフォーマンスを達成するが、操作するドキュメント操作に一般化することができない。
トレーニング中に使用されるJPEG量子化テーブルの狭い分布と、現実の保険文書パイプラインで発生する異質な圧縮プロファイルとのミスマッチである。
- 参考スコア(独自算出の注目度): 1.6184400662251226
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Document manipulation localization models achieve strong performance on public benchmarks yet fail to generalize to operational document workflows. We identify a critical and overlooked source of this gap: the mismatch between the narrow distribution of JPEG quantization tables used during training -restricted to standard libjpeg quality factors -and the heterogeneous compression profiles encountered in real-world insurance document pipelines. To isolate this factor, we conduct a controlled factorial study comparing two architectures with contrasting levels of quantization table awareness -FFDN [2] and Mesorch [20] -each trained under either standard quality factor augmentation (Standard-QT ) or operationally calibrated quantization tables sampled from DocQT, a quantization-table bank derived from a MAIF operational image corpus (Real-QT ), and evaluated under three recompression conditions. Training under Real-QT yields substantial localization gains on DocTamper [15] and significantly reduces the pixel-level false positive rate on authentic operational documents, but only for architectures that explicitly ingest the quantization table as input. The released DocQT quantization-table dataset and compression-reproduction material are directly available at https://github.com/Kyliroco/Improving-Document-Forgery-Localization-Robustness-via-Diverse-JPEG-Quan tization-Tables. These results demonstrate that standard quality factor augmentation does not adequately proxy operational compression diversity, and that architectural choices explicitly conditioning on the quantization table provide a meaningful robustness advantage for real-world deployment.
- Abstract(参考訳): ドキュメント操作のローカライゼーションモデルは、公開ベンチマークでは高いパフォーマンスを達成するが、運用ドキュメントワークフローへの一般化には失敗する。
トレーニング中に使用されるJPEG量子化テーブルの分布が、標準のlibjpegの品質要因に制限されていることと、現実の保険文書パイプラインで発生する異質な圧縮プロファイルとのミスマッチである。
この因子を分離するために,MAIF操作画像コーパス(Real-QT)から抽出した量子化テーブルであるDocQT(DocQT)からサンプリングした標準的な品質因子増強(Standard-QT )または操作的に校正された量子化テーブル(DocQT )の下で訓練された2つのアーキテクチャと対照的な量子化テーブル認識(FFDN [2] と Mesorch [20])を比較検討し,3つの再圧縮条件下で評価した。
Real-QT によるトレーニングでは,DocTamper [15] で相当なローカライズゲインが得られ,実際の操作文書上での画素レベルの偽陽性率を大幅に低減するが,量子化テーブルを入力として明示的に取り込むアーキテクチャに限られる。
リリースされたDocQT量子化テーブルデータセットと圧縮再生資料はhttps://github.com/Kyliroco/Improving-Document-Forgery-Localization-via-Diverse-JPEG-Quantization-Ta blesで直接公開されている。
これらの結果から, 標準的な品質因子の増大は, 操作圧縮の多様性を適切に推し進めるものではないこと, 量子化テーブルに明示的に条件付けるアーキテクチャ上の選択は, 実世界の展開に有意義な堅牢性をもたらすことが示唆された。
関連論文リスト
- Hybrid Quantum Image Preparation via JPEG Compression [0.0]
量子ピクセル情報符号化(QPIE)における画像ローディングの量子実装コストを削減するハイブリッド古典量子画像作成方式を提案する。
提案手法は、JPEG支援QPIE (JQPIE) と呼ばれ、量子化されたJPEG係数のみを量子レジスタにロードする。
論文 参考訳(メタデータ) (2026-02-05T21:23:58Z) - Continual Action Quality Assessment via Adaptive Manifold-Aligned Graph Regularization [53.82400605816587]
アクション品質アセスメント(AQA)は、ビデオにおける人間の行動を定量化し、スポーツスコアリング、リハビリテーション、スキル評価の応用を支援する。
大きな課題は、現実世界のシナリオにおける品質分布の非定常的な性質にある。
本稿では,進化する分布を扱うための連続学習機能を備えた連続AQA(Continuous AQA)を紹介する。
論文 参考訳(メタデータ) (2025-10-08T10:09:47Z) - Cat: Post-Training Quantization Error Reduction via Cluster-based Affine Transformation [47.791962198275066]
Post-Training Quantization (PTQ)は、フル精度(FP)値を量子化および圧縮データタイプに変換することにより、ディープニューラルネットワークのメモリフットプリントと計算オーバーヘッドを低減する。
PTQはQAT(Quantization-Aware Training)よりもコスト効率が高いが、低ビット量子化条件下での精度劣化に非常に敏感である。
本稿ではクラスタベースのアフィン変換(CAT)を提案する。クラスタ固有のパラメータを用いて,LQ出力をFP出力と整合させる。
論文 参考訳(メタデータ) (2025-09-30T14:00:28Z) - Compressed Feature Quality Assessment: Dataset and Baselines [89.62929964441962]
圧縮された特徴のセマンティック忠実度を評価するための最初のベンチマークデータセットを提案する。
MSE、コサイン類似性、CKA(Centered Kernel Alignment)という3つの広く使われているメトリクスを、意味的劣化を捉える能力の観点から体系的に評価する。
この研究は、基礎的なベンチマークを確立し、コミュニティがCFQAを探索するための重要なリソースを提供することによって、この分野を前進させます。
論文 参考訳(メタデータ) (2025-06-09T04:16:39Z) - Palette: Image-to-Image Diffusion Models [50.268441533631176]
我々は条件付き拡散モデルを用いた画像から画像への変換のためのシンプルで一般的なフレームワークであるPaletteを紹介する。
4つの困難な画像から画像への変換タスクにおいて、Paletteは強力なGANと回帰ベースラインを上回っている。
本稿では、FID、インセプションスコア、事前訓練されたResNet-50の分類精度、参照画像に対する知覚距離などのサンプル品質スコアについて報告する。
論文 参考訳(メタデータ) (2021-11-10T17:49:29Z) - Towards Flexible Blind JPEG Artifacts Removal [73.46374658847675]
人工物除去と細部保存のトレードオフを制御するために,適応可能な品質因子を予測できるフレキシブルブラインド畳み込みニューラルネットワーク,すなわちFBCNNを提案する。
提案するFBCNNは,定量的な計測値と視覚的品質の両方の観点から,最先端の手法に対して良好な性能を実現する。
論文 参考訳(メタデータ) (2021-09-29T17:12:10Z) - Boosting CNN-based primary quantization matrix estimation of double JPEG
images via a classification-like architecture [14.216829750046099]
二重JPEG圧縮画像の一次量子化行列の推定は、画像法医学において重要な問題である。
本稿では,シミル分類アーキテクチャを用いて推定を行う深層学習手法を提案する。
その結果,最先端技術と比較して,提案手法の優れた性能が確認された。
論文 参考訳(メタデータ) (2020-12-01T13:20:11Z) - The Rate-Distortion-Accuracy Tradeoff: JPEG Case Study [30.84385779593074]
JPEG圧縮標準における量子化テーブルの設計に焦点をあてる。
連続的な最適化を通じて、これらのテーブルの新たな最適チューニングを提供する。
本報告では,これらのテーブルの簡易かつ簡易な変更による性能向上について報告する。
論文 参考訳(メタデータ) (2020-08-03T01:39:01Z) - Feature Quantization Improves GAN Training [126.02828112121874]
識別器の特徴量子化(FQ)は、真と偽のデータの両方を共有離散空間に埋め込む。
本手法は,既存のGANモデルに容易に接続でき,訓練における計算オーバーヘッドがほとんどない。
論文 参考訳(メタデータ) (2020-04-05T04:06:50Z) - Optimizing JPEG Quantization for Classification Networks [32.20485214224392]
単純なソートされたランダムサンプリング手法は、標準JPEG Q-tableの性能を上回ることができることを示す。
新しいQテーブルは、精度が固定されたときに圧縮率を10%から200%向上させることができる。
論文 参考訳(メタデータ) (2020-03-05T19:13:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。