論文の概要: Variable-Rate Deep Image Compression through Spatially-Adaptive Feature
Transform
- arxiv url: http://arxiv.org/abs/2108.09551v1
- Date: Sat, 21 Aug 2021 17:30:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-24 15:53:37.292211
- Title: Variable-Rate Deep Image Compression through Spatially-Adaptive Feature
Transform
- Title(参考訳): 空間適応型特徴変換による可変レート深部画像圧縮
- Authors: Myungseo Song, Jinyoung Choi, Bohyung Han
- Abstract要約: 空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。
本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮速度をカバーしている。
提案するフレームワークにより,様々なタスクに対してタスク対応の画像圧縮を行うことができる。
- 参考スコア(独自算出の注目度): 58.60004238261117
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We propose a versatile deep image compression network based on Spatial
Feature Transform (SFT arXiv:1804.02815), which takes a source image and a
corresponding quality map as inputs and produce a compressed image with
variable rates. Our model covers a wide range of compression rates using a
single model, which is controlled by arbitrary pixel-wise quality maps. In
addition, the proposed framework allows us to perform task-aware image
compressions for various tasks, e.g., classification, by efficiently estimating
optimized quality maps specific to target tasks for our encoding network. This
is even possible with a pretrained network without learning separate models for
individual tasks. Our algorithm achieves outstanding rate-distortion trade-off
compared to the approaches based on multiple models that are optimized
separately for several different target rates. At the same level of
compression, the proposed approach successfully improves performance on image
classification and text region quality preservation via task-aware quality map
estimation without additional model training. The code is available at the
project website: https://github.com/micmic123/QmapCompression
- Abstract(参考訳): 本研究では,空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。
本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮率をカバーする。
さらに,提案フレームワークでは,符号化ネットワークの目的タスクに特化して最適化された品質マップを効率的に推定することにより,様々なタスクに対するタスク認識画像圧縮を行うことができる。
これは、個別のタスクの別々のモデルを学ぶことなく、事前訓練されたネットワークで可能だ。
本アルゴリズムは,複数の異なるターゲットレートに対して別々に最適化された複数のモデルに基づくアプローチと比較して,優れたレートゆがみトレードオフを実現する。
同じレベルの圧縮では、モデルトレーニングを伴わずにタスク認識品質マップ推定により、画像分類とテキスト領域の品質保存の性能を向上する。
コードはプロジェクトのwebサイトで入手できる。 https://github.com/micmic123/qmapcompression
関連論文リスト
- Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Multiscale Augmented Normalizing Flows for Image Compression [17.441496966834933]
本稿では,非可逆潜在変数モデルである拡張正規化フローに対して,階層的潜在空間を適応させる新しい概念を提案する。
私たちの最高のパフォーマンスモデルは、比較対象のシングルスケールモデルよりも7%以上、平均的なコスト削減を実現しました。
論文 参考訳(メタデータ) (2023-05-09T13:42:43Z) - Selective compression learning of latent representations for
variable-rate image compression [38.077284943341105]
本稿では、ディープラーニングに基づく可変レート画像圧縮のための、潜在表現を部分的に完全に一般化した方法で符号化する選択的圧縮法を提案する。
提案手法は、個別に訓練された参照圧縮モデルと同等の圧縮効率を達成でき、選択圧縮による復号時間を削減することができる。
論文 参考訳(メタデータ) (2022-11-08T09:09:59Z) - High-Fidelity Variable-Rate Image Compression via Invertible Activation
Transformation [24.379052026260034]
Invertible Activation Transformation (IAT) モジュールを提案する。
IATとQLevelは、画像圧縮モデルに、画像の忠実さを良く保ちながら、細かな可変レート制御能力を与える。
提案手法は,特に複数再符号化後に,最先端の可変レート画像圧縮法よりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2022-09-12T07:14:07Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Early Exit or Not: Resource-Efficient Blind Quality Enhancement for
Compressed Images [54.40852143927333]
ロスシー画像圧縮は、通信帯域を節約するために広範に行われ、望ましくない圧縮アーティファクトをもたらす。
圧縮画像に対する資源効率の高いブラインド品質向上手法(RBQE)を提案する。
提案手法は, 評価された画像の品質に応じて, 自動的にエンハンスメントを終了するか, 継続するかを決定することができる。
論文 参考訳(メタデータ) (2020-06-30T07:38:47Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。