論文の概要: CBANet: Towards Complexity and Bitrate Adaptive Deep Image Compression
using a Single Network
- arxiv url: http://arxiv.org/abs/2105.12386v1
- Date: Wed, 26 May 2021 08:13:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-27 13:17:53.550236
- Title: CBANet: Towards Complexity and Bitrate Adaptive Deep Image Compression
using a Single Network
- Title(参考訳): cbanet:単一ネットワークを用いた複雑化とビットレート適応型深部画像圧縮
- Authors: Jinyang Guo, Dong Xu, Guo Lu
- Abstract要約: CBANet(Complexity and Bitrate Adaptive Network)と呼ばれる新しいディープ画像圧縮フレームワークを提案する。
我々のCBANetは、動的計算複雑性制約の下での速度と歪みのトレードオフを考察している。
その結果、CBANetでは、計算複雑性の制約によって1つのシングルが複数のデコードをサポートできるようになった。
- 参考スコア(独自算出の注目度): 24.418215098116335
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a new deep image compression framework called
Complexity and Bitrate Adaptive Network (CBANet), which aims to learn one
single network to support variable bitrate coding under different computational
complexity constraints. In contrast to the existing state-of-the-art learning
based image compression frameworks that only consider the rate-distortion
trade-off without introducing any constraint related to the computational
complexity, our CBANet considers the trade-off between the rate and distortion
under dynamic computational complexity constraints. Specifically, to decode the
images with one single decoder under various computational complexity
constraints, we propose a new multi-branch complexity adaptive module, in which
each branch only takes a small portion of the computational budget of the
decoder. The reconstructed images with different visual qualities can be
readily generated by using different numbers of branches. Furthermore, to
achieve variable bitrate decoding with one single decoder, we propose a bitrate
adaptive module to project the representation from a base bitrate to the
expected representation at a target bitrate for transmission. Then it will
project the transmitted representation at the target bitrate back to that at
the base bitrate for the decoding process. The proposed bit adaptive module can
significantly reduce the storage requirement for deployment platforms. As a
result, our CBANet enables one single codec to support multiple bitrate
decoding under various computational complexity constraints. Comprehensive
experiments on two benchmark datasets demonstrate the effectiveness of our
CBANet for deep image compression.
- Abstract(参考訳): 本稿では,異なる計算量制約下で可変ビットレート符号化をサポートするために,単一のネットワークを学習することを目的とした,cbanetと呼ばれる新しい深層画像圧縮フレームワークを提案する。
既存の最先端学習ベースの画像圧縮フレームワークとは対照的に,計算複雑性に関する制約を導入することなく,レートゆがみトレードオフのみを考慮し,動的計算複雑性制約下でのレートと歪みのトレードオフを検討する。
具体的には,1つのデコーダで画像のデコードを行うために,各ブランチがデコーダの計算予算のごく一部だけを取る,新しいマルチブランチ複雑性適応モジュールを提案する。
異なる枝数を用いて、視覚的品質の異なる再構成画像を容易に生成することができる。
さらに,1つのデコーダを用いて可変ビットレート復号化を実現するため,送信対象ビットレートにおいて,ベースビットレートから期待表現へ表現を投影するビットレート適応モジュールを提案する。
そして、送信された表現を対象ビットレートに投影し、デコード処理のベースビットレートに戻す。
提案したビット適応モジュールは,デプロイメントプラットフォームのストレージ要件を大幅に削減することができる。
その結果、CBANetは1つの1つのコーデックで、様々な計算複雑性制約の下で複数のビットレートデコーディングをサポートできます。
2つのベンチマークデータセットに関する総合的な実験は、深部画像圧縮におけるCBANetの有効性を示す。
関連論文リスト
- Rate-Distortion-Cognition Controllable Versatile Neural Image Compression [47.72668401825835]
速度歪み認識制御可能な多目的画像圧縮法を提案する。
本手法は, 良好なICM性能とフレキシブルレート・ディストーション・コグニテーション制御を実現する。
論文 参考訳(メタデータ) (2024-07-16T13:17:51Z) - AdaBM: On-the-Fly Adaptive Bit Mapping for Image Super-Resolution [53.23803932357899]
我々は、処理時間を数時間から秒に短縮する最初のオンザフライ適応量子化フレームワークを導入する。
我々は,従来の適応量子化法と競合する性能を実現し,処理時間をx2000で高速化する。
論文 参考訳(メタデータ) (2024-04-04T08:37:27Z) - MISC: Ultra-low Bitrate Image Semantic Compression Driven by Large Multimodal Model [78.4051835615796]
本稿では,マルチモーダル画像セマンティック圧縮法を提案する。
画像の意味情報を抽出するLMMエンコーダと、その意味に対応する領域を特定するマップエンコーダと、非常に圧縮されたビットストリームを生成する画像エンコーダと、前記情報に基づいて画像を再構成するデコーダとからなる。
知覚50%を節約しながら最適な一貫性と知覚結果を達成することができ、これは次世代のストレージと通信において強力な可能性を持つ。
論文 参考訳(メタデータ) (2024-02-26T17:11:11Z) - Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - Computationally-Efficient Neural Image Compression with Shallow Decoders [43.115831685920114]
本稿では,JPEGに類似した浅い,あるいは線形な復号変換を用いることで,復号化複雑性のギャップを解消する。
我々は、より強力なエンコーダネットワークと反復符号化を採用することにより、符号化と復号の間のしばしば非対称な予算を利用する。
論文 参考訳(メタデータ) (2023-04-13T03:38:56Z) - Split Hierarchical Variational Compression [21.474095984110622]
可変オートエンコーダ(VAE)は、画像データセットの圧縮を行う上で大きな成功を収めている。
SHVCは、ピクセルごとの自己回帰と完全に分解された確率モデルとの一般化を可能にする、効率的な自己回帰的サブピクセル畳み込みを導入している。
論文 参考訳(メタデータ) (2022-04-05T09:13:38Z) - Learned Multi-Resolution Variable-Rate Image Compression with
Octave-based Residual Blocks [15.308823742699039]
一般化オクターブ畳み込み(GoConv)と一般化オクターブ畳み込み(GoTConv)を用いた新しい可変レート画像圧縮フレームワークを提案する。
単一モデルが異なるビットレートで動作し、複数レートの画像特徴を学習できるようにするため、新しい目的関数が導入される。
実験結果から,H.265/HEVCベースのBPGや最先端の学習に基づく可変レート法などの標準コーデックよりも高い性能を示した。
論文 参考訳(メタデータ) (2020-12-31T06:26:56Z) - How to Exploit the Transferability of Learned Image Compression to
Conventional Codecs [25.622863999901874]
本稿では,学習した画像の符号化をサロゲートとして利用して,画像の符号化を最適化する方法を示す。
提案手法は,MS-SSIM歪みをデコードオーバーヘッドを伴わずに20%以上の速度改善で補正するために,従来の画像を再構成することができる。
論文 参考訳(メタデータ) (2020-12-03T12:34:51Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。