論文の概要: SigVIC: Spatial Importance Guided Variable-Rate Image Compression
- arxiv url: http://arxiv.org/abs/2303.09112v1
- Date: Thu, 16 Mar 2023 06:57:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 16:37:15.876534
- Title: SigVIC: Spatial Importance Guided Variable-Rate Image Compression
- Title(参考訳): SigVIC:空間的重要度誘導可変レート画像圧縮
- Authors: Jiaming Liang, Meiqin Liu, Chao Yao, Chunyu Lin, Yao Zhao
- Abstract要約: 可変レート機構は、学習に基づく画像圧縮の柔軟性と効率を改善した。
可変レートの最も一般的なアプローチの1つは、チャネルワイズまたは空間均一な内部特徴のスケーリングである。
本稿では,空間的重要度を適応的に学習する空間的ゲーティングユニット(SGU)を設計した空間的重要度誘導可変画像圧縮(SigVIC)を提案する。
- 参考スコア(独自算出の注目度): 43.062173445454775
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Variable-rate mechanism has improved the flexibility and efficiency of
learning-based image compression that trains multiple models for different
rate-distortion tradeoffs. One of the most common approaches for variable-rate
is to channel-wisely or spatial-uniformly scale the internal features. However,
the diversity of spatial importance is instructive for bit allocation of image
compression. In this paper, we introduce a Spatial Importance Guided
Variable-rate Image Compression (SigVIC), in which a spatial gating unit (SGU)
is designed for adaptively learning a spatial importance mask. Then, a spatial
scaling network (SSN) takes the spatial importance mask to guide the feature
scaling and bit allocation for variable-rate. Moreover, to improve the quality
of decoded image, Top-K shallow features are selected to refine the decoded
features through a shallow feature fusion module (SFFM). Experiments show that
our method outperforms other learning-based methods (whether variable-rate or
not) and traditional codecs, with storage saving and high flexibility.
- Abstract(参考訳): 可変レート機構は、異なるレート歪みトレードオフのために複数のモデルを訓練する学習ベースの画像圧縮の柔軟性と効率を改善した。
可変レートの最も一般的なアプローチの1つは、チャネルワイズまたは空間均一な内部特徴のスケーリングである。
しかし,画像圧縮のビット割り当てには空間的重要性の多様性が不可欠である。
本稿では,空間的重要性のマスクを適応的に学習するための空間的ゲーティングユニット(SGU)を設計した空間的重要度誘導可変画像圧縮(SigVIC)を提案する。
そして、空間スケーリングネットワーク(SSN)は、空間重要マスクを用いて、可変レートの特徴スケーリングとビット割り当てをガイドする。
さらに、デコード画像の品質を向上させるため、トップk浅層特徴を選択し、浅層特徴融合モジュール(sffm)を介してデコード特徴を洗練する。
実験により,本手法は,従来のコーデックや可変レートよりも優れ,ストレージの節約や柔軟性が高いことがわかった。
関連論文リスト
- SQ-GAN: Semantic Image Communications Using Masked Vector Quantization [55.02795214161371]
本研究ではセマンティック・マスケッドVQ-GAN(SQ-GAN)を導入し,セマンティック・タスク指向通信のための画像圧縮を最適化する手法を提案する。
SQ-GANは、セマンティックセマンティックセグメンテーションと新しいセマンティック条件適応マスクモジュール(SAMM)を使用して、画像のセマンティックな重要な特徴を選択的にエンコードする。
論文 参考訳(メタデータ) (2025-02-13T17:35:57Z) - DeepFGS: Fine-Grained Scalable Coding for Learned Image Compression [27.834491128701963]
本稿では,DeepFGSと呼ばれる微細な画像圧縮フレームワークを提案する。
エントロピー符号化では,基本的特徴とスケーラブルな特徴の相関関係を網羅する相互エントロピーモデルを設計する。
実験の結果,提案したDeepFGSは,従来の学習ベースでスケーラブルな画像圧縮モデルよりも優れていた。
論文 参考訳(メタデータ) (2024-11-30T11:19:38Z) - Multi-scale Unified Network for Image Classification [33.560003528712414]
CNNは、実世界のマルチスケール画像入力を扱う際に、性能と計算効率において顕著な課題に直面している。
本稿では,マルチスケール,統一ネットワーク,スケール不変制約からなるMultiscale Unified Network(MUSN)を提案する。
MUSNは精度が44.53%向上し、マルチスケールシナリオではFLOPを7.01-16.13%減少させる。
論文 参考訳(メタデータ) (2024-03-27T06:40:26Z) - Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - Multiscale Augmented Normalizing Flows for Image Compression [17.441496966834933]
本稿では,非可逆潜在変数モデルである拡張正規化フローに対して,階層的潜在空間を適応させる新しい概念を提案する。
私たちの最高のパフォーマンスモデルは、比較対象のシングルスケールモデルよりも7%以上、平均的なコスト削減を実現しました。
論文 参考訳(メタデータ) (2023-05-09T13:42:43Z) - Variable-Rate Deep Image Compression through Spatially-Adaptive Feature
Transform [58.60004238261117]
空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。
本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮速度をカバーしている。
提案するフレームワークにより,様々なタスクに対してタスク対応の画像圧縮を行うことができる。
論文 参考訳(メタデータ) (2021-08-21T17:30:06Z) - Learned Multi-Resolution Variable-Rate Image Compression with
Octave-based Residual Blocks [15.308823742699039]
一般化オクターブ畳み込み(GoConv)と一般化オクターブ畳み込み(GoTConv)を用いた新しい可変レート画像圧縮フレームワークを提案する。
単一モデルが異なるビットレートで動作し、複数レートの画像特徴を学習できるようにするため、新しい目的関数が導入される。
実験結果から,H.265/HEVCベースのBPGや最先端の学習に基づく可変レート法などの標準コーデックよりも高い性能を示した。
論文 参考訳(メタデータ) (2020-12-31T06:26:56Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。