論文の概要: Exploring Resolution Fields for Scalable Image Compression with
Uncertainty Guidance
- arxiv url: http://arxiv.org/abs/2306.08941v1
- Date: Thu, 15 Jun 2023 08:26:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-16 15:54:30.235440
- Title: Exploring Resolution Fields for Scalable Image Compression with
Uncertainty Guidance
- Title(参考訳): 不確実性指導によるスケーラブル画像圧縮のための解決フィールドの検討
- Authors: Dongyi Zhang, Feng Li, Man Liu, Runmin Cong, Huihui Bai, Meng Wang and
Yao Zhao
- Abstract要約: 本研究では,スケーラブルな画像圧縮における分解能場の可能性について検討する。
本稿では,より適応的で多目的な圧縮を実現するための相互ピラミッドネットワーク(RPN)を提案する。
実験は、既存の古典的およびディープラーニングベースのスケーラブルコーデックに対するRPNの優位性を示している。
- 参考スコア(独自算出の注目度): 47.96024424475888
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, there are significant advancements in learning-based image
compression methods surpassing traditional coding standards. Most of them
prioritize achieving the best rate-distortion performance for a particular
compression rate, which limits their flexibility and adaptability in various
applications with complex and varying constraints. In this work, we explore the
potential of resolution fields in scalable image compression and propose the
reciprocal pyramid network (RPN) that fulfills the need for more adaptable and
versatile compression. Specifically, RPN first builds a compression pyramid and
generates the resolution fields at different levels in a top-down manner. The
key design lies in the cross-resolution context mining module between adjacent
levels, which performs feature enriching and distillation to mine meaningful
contextualized information and remove unnecessary redundancy, producing
informative resolution fields as residual priors. The scalability is achieved
by progressive bitstream reusing and resolution field incorporation varying at
different levels. Furthermore, between adjacent compression levels, we
explicitly quantify the aleatoric uncertainty from the bottom decoded
representations and develop an uncertainty-guided loss to update the
upper-level compression parameters, forming a reverse pyramid process that
enforces the network to focus on the textured pixels with high variance for
more reliable and accurate reconstruction. Combining resolution field
exploration and uncertainty guidance in a pyramid manner, RPN can effectively
achieve spatial and quality scalable image compression. Experiments show the
superiority of RPN against existing classical and deep learning-based scalable
codecs. Code will be available at https://github.com/JGIroro/RPNSIC.
- Abstract(参考訳): 近年,従来の符号化基準を超える学習ベース画像圧縮手法が大幅に進歩している。
それらの多くは、複雑な制約のある様々なアプリケーションにおいて、柔軟性と適応性を制限し、特定の圧縮率に対して最高のレート歪み性能を達成することを優先している。
本研究では,スケーラブルな画像圧縮における解像度場の可能性について検討し,より適応的で汎用的な圧縮の必要性を満たす相互ピラミッドネットワーク(rpn)を提案する。
具体的には、RPNはまず圧縮ピラミッドを構築し、各レベルの解像度フィールドをトップダウンで生成する。
重要な設計は、隣接するレベル間のクロスレゾリューションコンテキストマイニングモジュールにあり、機能強化と蒸留を行い、有意義なコンテキスト化された情報をマイニングし、不要な冗長性を取り除く。
拡張性は、異なるレベルで異なるプログレッシブビットストリーム再利用と分解能フィールドの導入によって達成される。
さらに,隣り合う圧縮レベル間では,下位復号表現から有意な不確かさを明示的に定量化し,上位レベルの圧縮パラメータを更新するための不確実性誘導損失を発生させ,より信頼性が高く正確な再構成のために高分散のテクスチャ画素にネットワークを集中させる逆ピラミッドプロセスを形成する。
分解能場探索と不確実性ガイダンスをピラミッド方式で組み合わせることで、RPNは空間的および品質の高いスケーラブルな画像圧縮を効果的に実現できる。
実験は、既存の古典的およびディープラーニングベースのスケーラブルコーデックに対するRPNの優位性を示している。
コードはhttps://github.com/JGIroro/RPNSICで入手できる。
関連論文リスト
- Exploiting Inter-Image Similarity Prior for Low-Bitrate Remote Sensing Image Compression [10.427300958330816]
生成された離散コードブックを用いたコードブックベースのRS画像圧縮(Code-RSIC)手法を提案する。
このコードは、知覚品質の観点から、最先端の伝統と学習に基づく画像圧縮アルゴリズムを著しく上回っている。
論文 参考訳(メタデータ) (2024-07-17T03:33:16Z) - Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaption [57.056311855630916]
本稿では,制御可能な生成画像圧縮フレームワークである制御-GICを提案する。
高忠実度および一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。
我々は、歴史的符号化された多粒度表現に遡ることができる条件条件付き条件付けを開発する。
論文 参考訳(メタデータ) (2024-06-02T14:22:09Z) - Extreme Image Compression using Fine-tuned VQGANs [43.43014096929809]
本稿ではベクトル量子化(VQ)に基づく生成モデルを画像圧縮領域に導入する。
VQGANモデルによって学習されたコードブックは、強い表現能力をもたらす。
提案したフレームワークは、知覚的品質指向のメトリクスで最先端のコーデックより優れている。
論文 参考訳(メタデータ) (2023-07-17T06:14:19Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - DeepFGS: Fine-Grained Scalable Coding for Learned Image Compression [22.933872281183497]
最初に学習したきめ細かなスケーラブルな画像圧縮モデル(DeepFGS)を提案する。
本稿では,特徴分離バックボーンを導入し,画像情報を基本的かつスケーラブルな特徴に分割し,情報再構成戦略を通じて特徴チャネルを再分割する。
実験により,私たちのDeepFGSはPSNRおよびMS-SSIMメトリクスにおいて,学習ベースでスケーラブルな画像圧縮モデルや従来型のスケーラブルな画像コーデックよりも優れていることが示された。
論文 参考訳(メタデータ) (2022-01-04T15:03:13Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Variable-Rate Deep Image Compression through Spatially-Adaptive Feature
Transform [58.60004238261117]
空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。
本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮速度をカバーしている。
提案するフレームワークにより,様々なタスクに対してタスク対応の画像圧縮を行うことができる。
論文 参考訳(メタデータ) (2021-08-21T17:30:06Z) - Enhanced Invertible Encoding for Learned Image Compression [40.21904131503064]
本稿では,改良されたインバーチブルを提案する。
非可逆ニューラルネットワーク(INN)によるネットワークは、情報損失問題を大幅に軽減し、圧縮性を向上する。
Kodak, CLIC, Tecnick のデータセットによる実験結果から,本手法は既存の学習画像圧縮法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-08-08T17:32:10Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。