論文の概要: Sensitivity Decouple Learning for Image Compression Artifacts Reduction
- arxiv url: http://arxiv.org/abs/2405.09291v1
- Date: Wed, 15 May 2024 12:29:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-16 13:36:32.797163
- Title: Sensitivity Decouple Learning for Image Compression Artifacts Reduction
- Title(参考訳): 画像圧縮アーチファクト削減のための感度分離学習
- Authors: Li Ma, Yifan Zhao, Peixi Peng, Yonghong Tian,
- Abstract要約: 本稿では, 固有属性を2つの相補的特徴に分解して, アーティファクトの低減を図ることを提案する。
提案するDAGNでは,圧縮不感な特徴の整合性を維持するために,多機能融合モジュールを開発した。
提案手法はBSD500上で平均2.06dBのPSNRゲインを達成し,最先端の手法より優れている。
- 参考スコア(独自算出の注目度): 39.67836965306397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the benefit of deep learning techniques, recent researches have made significant progress in image compression artifacts reduction. Despite their improved performances, prevailing methods only focus on learning a mapping from the compressed image to the original one but ignore the intrinsic attributes of the given compressed images, which greatly harms the performance of downstream parsing tasks. Different from these methods, we propose to decouple the intrinsic attributes into two complementary features for artifacts reduction,ie, the compression-insensitive features to regularize the high-level semantic representations during training and the compression-sensitive features to be aware of the compression degree. To achieve this, we first employ adversarial training to regularize the compressed and original encoded features for retaining high-level semantics, and we then develop the compression quality-aware feature encoder for compression-sensitive features. Based on these dual complementary features, we propose a Dual Awareness Guidance Network (DAGN) to utilize these awareness features as transformation guidance during the decoding phase. In our proposed DAGN, we develop a cross-feature fusion module to maintain the consistency of compression-insensitive features by fusing compression-insensitive features into the artifacts reduction baseline. Our method achieves an average 2.06 dB PSNR gains on BSD500, outperforming state-of-the-art methods, and only requires 29.7 ms to process one image on BSD500. Besides, the experimental results on LIVE1 and LIU4K also demonstrate the efficiency, effectiveness, and superiority of the proposed method in terms of quantitative metrics, visual quality, and downstream machine vision tasks.
- Abstract(参考訳): ディープラーニング技術の利点により、最近の研究は画像圧縮アーティファクトの削減に大きな進歩をもたらした。
改良された性能にもかかわらず、一般的な方法は圧縮された画像から元の画像へのマッピングを学ぶことのみに焦点をあてるが、圧縮された画像の本質的な特性は無視する。
これらの方法とは違って,固有属性を2つの相補的特徴に分解してアーティファクトの削減,すなわち,トレーニング中の高レベルな意味表現を正規化するための圧縮非感性特徴,圧縮度を意識する圧縮感性特徴に分解することを提案する。
そこで我々はまず,ハイレベルなセマンティクスを維持するために圧縮および原文のエンコーダを正規化するための対角訓練を行い,その上で,圧縮に敏感な機能のための圧縮品質認識機能エンコーダを開発した。
これら2つの相補的特徴に基づいて、復号フェーズにおける変換誘導としてこれらの認識機能を利用するために、DAGN(Dual Awareness Guidance Network)を提案する。
提案したDAGNでは,圧縮非感性特徴をアーティファクトリダクションベースラインに融合することにより圧縮非感性特徴の整合性を維持するために,クロスファンクション融合モジュールを開発した。
提案手法は,BSD500上での平均2.06dBPSNRゲインを達成し,最先端の手法より優れ,BSD500上で1つの画像を処理するのに29.7msしか必要としない。
さらに,LIVE1 と LIU4K の実験結果は,定量的な計測値,視覚的品質,ダウンストリームマシンビジョンタスクの観点から,提案手法の有効性,有効性,優位性を示す。
関連論文リスト
- Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - Machine Perception-Driven Image Compression: A Layered Generative
Approach [32.23554195427311]
階層型生成画像圧縮モデルを提案する。
タスクに依存しない学習に基づく圧縮モデルを提案し、様々な圧縮されたドメインベースの分析タスクを効果的にサポートする。
圧縮比、再構成画像品質、下流知覚性能の最良のバランス点を得るために、共同最適化スケジュールを採用する。
論文 参考訳(メタデータ) (2023-04-14T02:12:38Z) - JND-Based Perceptual Optimization For Learned Image Compression [42.822121565430926]
学習画像圧縮方式におけるJNDに基づく知覚品質損失を提案する。
提案手法は,同じビットレートのベースラインモデルよりも知覚品質が向上したことを示す。
論文 参考訳(メタデータ) (2023-02-25T14:49:09Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Metric Learning for Anti-Compression Facial Forgery Detection [32.33501564446107]
新規な抗圧縮顔面フォージェリー検出フレームワークを提案する。
オリジナル版と圧縮版の両方を使って、圧縮に敏感な埋め込み機能空間を学習する。
論文 参考訳(メタデータ) (2021-03-15T14:11:14Z) - Early Exit or Not: Resource-Efficient Blind Quality Enhancement for
Compressed Images [54.40852143927333]
ロスシー画像圧縮は、通信帯域を節約するために広範に行われ、望ましくない圧縮アーティファクトをもたらす。
圧縮画像に対する資源効率の高いブラインド品質向上手法(RBQE)を提案する。
提案手法は, 評価された画像の品質に応じて, 自動的にエンハンスメントを終了するか, 継続するかを決定することができる。
論文 参考訳(メタデータ) (2020-06-30T07:38:47Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。