論文の概要: Lightweight Adaptive Feature De-drifting for Compressed Image
Classification
- arxiv url: http://arxiv.org/abs/2401.01724v1
- Date: Wed, 3 Jan 2024 13:03:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-04 14:11:42.646278
- Title: Lightweight Adaptive Feature De-drifting for Compressed Image
Classification
- Title(参考訳): 圧縮画像分類のための軽量適応型脱ドリフト
- Authors: Long Peng, Yang Cao, Yuejin Sun, Yang Wang
- Abstract要約: 高品質な画像で訓練された高レベルの視覚モデルは、圧縮された画像を扱う際に性能劣化に悩まされる。
ビジュアルアーティファクトを扱うために、さまざまな学習ベースのJPEGアーティファクト除去手法が提案されている。
本稿では,プレトレーニング済み画像分類モデルの性能向上を図るために,新しい軽量AFDモジュールを提案する。
- 参考スコア(独自算出の注目度): 10.265991649449507
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: JPEG is a widely used compression scheme to efficiently reduce the volume of
transmitted images. The artifacts appear among blocks due to the information
loss, which not only affects the quality of images but also harms the
subsequent high-level tasks in terms of feature drifting. High-level vision
models trained on high-quality images will suffer performance degradation when
dealing with compressed images, especially on mobile devices. Numerous
learning-based JPEG artifact removal methods have been proposed to handle
visual artifacts. However, it is not an ideal choice to use these JPEG artifact
removal methods as a pre-processing for compressed image classification for the
following reasons: 1. These methods are designed for human vision rather than
high-level vision models; 2. These methods are not efficient enough to serve as
pre-processing on resource-constrained devices. To address these issues, this
paper proposes a novel lightweight AFD module to boost the performance of
pre-trained image classification models when facing compressed images. First, a
FDE-Net is devised to generate the spatial-wise FDM in the DCT domain. Next,
the estimated FDM is transmitted to the FE-Net to generate the mapping
relationship between degraded features and corresponding high-quality features.
A simple but effective RepConv block equipped with structural
re-parameterization is utilized in FE-Net, which enriches feature
representation in the training phase while maintaining efficiency in the
deployment phase. After training on limited compressed images, the AFD-Module
can serve as a "plug-and-play" model for pre-trained classification models to
improve their performance on compressed images. Experiments demonstrate that
our proposed AFD module can comprehensively improve the accuracy of the
pre-trained classification models and significantly outperform the existing
methods.
- Abstract(参考訳): JPEGは、送信された画像のボリュームを効率的に削減するために広く使われている圧縮方式である。
これらの成果物は, 画像の品質に影響を及ぼすだけでなく, 特徴漂流の点でも高いレベルのタスクに悪影響を及ぼす情報損失により, ブロック間に出現する。
高品質な画像で訓練された高レベルの視覚モデルは、圧縮された画像、特にモバイルデバイスで処理する際の性能劣化に悩まされる。
ビジュアルアーティファクトを扱うために、多くの学習ベースのJPEGアーティファクト除去手法が提案されている。
しかし、これらのjpegアーティファクト除去手法を圧縮画像分類の前処理として使用するのは、以下の理由から理想的ではない。
1. これらの方法は、高レベルの視覚モデルではなく、人間の視覚のために設計されている。
2)これらの手法は,資源制約装置の事前処理に適さない。
そこで本稿では,圧縮画像に対して予め学習した画像分類モデルの性能を向上させるための軽量afdモジュールを提案する。
まず、DCT領域における空間的FDMを生成するためにFDE-Netを考案する。
次に、推定されたFDMをFE-Netに送信し、劣化特徴とそれに対応する高品質特徴とのマッピング関係を生成する。
構造的再パラメータ化を備えた簡易かつ効果的なRepConvブロックをFE-Netで利用し、デプロイフェーズにおける効率を維持しつつ、トレーニングフェーズにおける特徴表現を充実させる。
限られた圧縮画像のトレーニングの後、AFD-Moduleはプレトレーニング済みの分類モデルのための"plug-and-play"モデルとして機能し、圧縮画像のパフォーマンスを改善する。
提案するafdモジュールは,事前学習した分類モデルの精度を包括的に向上させ,既存の手法を大きく上回ることを実証する。
関連論文リスト
- Toward Scalable Image Feature Compression: A Content-Adaptive and Diffusion-Based Approach [44.03561901593423]
本稿では,スケーラブルな画像圧縮のためのコンテンツ適応拡散モデルを提案する。
提案手法は拡散過程を通じて微細なテクスチャを符号化し,知覚品質を向上する。
画像再構成および下流マシンビジョンタスクにおいて,提案手法の有効性を示す実験を行った。
論文 参考訳(メタデータ) (2024-10-08T15:48:34Z) - Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Multi-Modality Deep Network for JPEG Artifacts Reduction [33.02405073842042]
テキスト誘導JPEGアーティファクト削減のためのマルチモーダル融合学習法を提案する。
提案手法は,最先端の手法と比較して,より優れたデブロッキング結果が得られる。
論文 参考訳(メタデータ) (2023-05-04T11:54:02Z) - High-Perceptual Quality JPEG Decoding via Posterior Sampling [13.238373528922194]
JPEGアーチファクト修正のための異なるパラダイムを提案する。
我々は、圧縮された入力と整合しながら、シャープで詳細で視覚的に再構成された画像を得ることを目指している。
我々のソリューションは、完全な整合性のある入力に対して、多種多様な可塑性かつ高速な再構成を提供する。
論文 参考訳(メタデータ) (2022-11-21T19:47:59Z) - Towards Flexible Blind JPEG Artifacts Removal [73.46374658847675]
人工物除去と細部保存のトレードオフを制御するために,適応可能な品質因子を予測できるフレキシブルブラインド畳み込みニューラルネットワーク,すなわちFBCNNを提案する。
提案するFBCNNは,定量的な計測値と視覚的品質の両方の観点から,最先端の手法に対して良好な性能を実現する。
論文 参考訳(メタデータ) (2021-09-29T17:12:10Z) - Learning a Single Model with a Wide Range of Quality Factors for JPEG
Image Artifacts Removal [24.25688335628976]
ロスシー圧縮は、圧縮された画像にアーティファクトをもたらし、視覚的品質を低下させる。
本稿では,高度に堅牢な圧縮アーティファクト除去ネットワークを提案する。
提案するネットワークは,幅広い品質要因を扱うためにトレーニング可能な単一モデルアプローチである。
論文 参考訳(メタデータ) (2020-09-15T08:16:58Z) - Early Exit or Not: Resource-Efficient Blind Quality Enhancement for
Compressed Images [54.40852143927333]
ロスシー画像圧縮は、通信帯域を節約するために広範に行われ、望ましくない圧縮アーティファクトをもたらす。
圧縮画像に対する資源効率の高いブラインド品質向上手法(RBQE)を提案する。
提案手法は, 評価された画像の品質に応じて, 自動的にエンハンスメントを終了するか, 継続するかを決定することができる。
論文 参考訳(メタデータ) (2020-06-30T07:38:47Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。