論文の概要: ROI-based Deep Image Compression with Implicit Bit Allocation
- arxiv url: http://arxiv.org/abs/2511.08918v1
- Date: Thu, 13 Nov 2025 01:17:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.300571
- Title: ROI-based Deep Image Compression with Implicit Bit Allocation
- Title(参考訳): 入射ビット配置によるROIに基づく深部画像圧縮
- Authors: Kai Hu, Han Wang, Renhe Liu, Zhilin Li, Shenghui Song, Yu Liu,
- Abstract要約: 関心領域(ROI)に基づく画像圧縮は、重要な領域で高い忠実性を維持する能力によって急速に発展してきた。
既存の圧縮方法は、量子化前に背景情報を抑圧するためにマスクを適用している。
本研究は,暗黙的ビット割り当てを伴うROIに基づく効率的な深部画像圧縮モデルを提案する。
- 参考スコア(独自算出の注目度): 15.62284701009422
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Region of Interest (ROI)-based image compression has rapidly developed due to its ability to maintain high fidelity in important regions while reducing data redundancy. However, existing compression methods primarily apply masks to suppress background information before quantization. This explicit bit allocation strategy, which uses hard gating, significantly impacts the statistical distribution of the entropy model, thereby limiting the coding performance of the compression model. In response, this work proposes an efficient ROI-based deep image compression model with implicit bit allocation. To better utilize ROI masks for implicit bit allocation, this paper proposes a novel Mask-Guided Feature Enhancement (MGFE) module, comprising a Region-Adaptive Attention (RAA) block and a Frequency-Spatial Collaborative Attention (FSCA) block. This module allows for flexible bit allocation across different regions while enhancing global and local features through frequencyspatial domain collaboration. Additionally, we use dual decoders to separately reconstruct foreground and background images, enabling the coding network to optimally balance foreground enhancement and background quality preservation in a datadriven manner. To the best of our knowledge, this is the first work to utilize implicit bit allocation for high-quality regionadaptive coding. Experiments on the COCO2017 dataset show that our implicit-based image compression method significantly outperforms explicit bit allocation approaches in rate-distortion performance, achieving optimal results while maintaining satisfactory visual quality in the reconstructed background regions.
- Abstract(参考訳): 関心領域(ROI)に基づく画像圧縮は、データ冗長性を低減しつつ、重要な領域で高い忠実性を維持する能力によって急速に発展してきた。
しかし、既存の圧縮法は主に量子化前の背景情報を抑制するためにマスクを適用している。
ハードゲーティングを用いたこの明示的なビット割り当て戦略はエントロピーモデルの統計分布に大きな影響を与え、圧縮モデルの符号化性能が制限される。
そこで本研究では,暗黙的ビット割り当てを伴うROIに基づく効率的な深部画像圧縮モデルを提案する。
本稿では、暗黙的なビット割り当てにROIマスクをよりよく活用するために、領域適応型アテンション(RAA)ブロックと周波数空間的コラボレーティブアテンション(FSCA)ブロックからなる新しいマスク誘導機能拡張(MGFE)モジュールを提案する。
このモジュールは、周波数空間のドメインコラボレーションを通じて、グローバルとローカルの機能を拡張しながら、異なるリージョンにまたがる柔軟なビット割り当てを可能にする。
さらに、デュアルデコーダを用いて、フォアグラウンドと背景画像の分離再構成を行い、符号化ネットワークがデータ駆動方式でフォアグラウンドの強化と背景品質の保存を最適にバランスさせることができる。
我々の知る限りでは、これは高品質な領域適応符号化に暗黙のビット割り当てを利用する最初の試みである。
COCO2017データセットの実験により、我々の暗黙的画像圧縮法は、レート歪曲性能において明らかなビット割り当てアプローチを著しく上回り、再構成された背景領域における良好な視覚的品質を維持しながら最適な結果が得られることを示した。
関連論文リスト
- SANR: Scene-Aware Neural Representation for Light Field Image Compression with Rate-Distortion Optimization [54.184486302645716]
エンドツーエンドの速度歪みを最適化した光場画像圧縮のためのScene-Aware Neural Representationフレームワークを提案する。
シーン認識のために,SANRは階層的なシーンモデリングブロックを導入している。
実験の結果,SANRはHEVCに対する65.62%のBD節減率で,変形率に関する最先端技術よりも有意に優れていた。
論文 参考訳(メタデータ) (2025-10-17T16:00:43Z) - Ultra Lowrate Image Compression with Semantic Residual Coding and Compression-aware Diffusion [28.61304513668606]
ResULICは残留誘導型超低レート画像圧縮システムである。
残差信号は意味検索と拡散に基づく生成プロセスの両方に組み込む。
最先端拡散法に比べて客観的・主観的性能に優れる。
論文 参考訳(メタデータ) (2025-05-13T06:51:23Z) - Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaptation [52.82508784748278]
本稿では,制御生成画像圧縮フレームワークである制御-GICを提案する。
制御-GICは、高忠実度と一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。
実験により,制御-GICは高い柔軟かつ制御可能な適応を可能にし,その結果が最近の最先端手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-06-02T14:22:09Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Generalized Octave Convolutions for Learned Multi-Frequency Image
Compression [20.504561050200365]
本稿では,初めて学習されたマルチ周波数画像圧縮とエントロピー符号化手法を提案する。
これは最近開発されたオクターブの畳み込みに基づいて、潜水剤を高周波(高分解能)成分に分解する。
提案した一般化オクターブ畳み込みは、他のオートエンコーダベースのコンピュータビジョンタスクの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-02-24T01:35:29Z) - A GAN-based Tunable Image Compression System [13.76136694287327]
本稿では、GAN(Generative Adversarial Network)を用いてコンテンツベースの圧縮を再考し、重要でない領域を再構築する。
モデルを再トレーニングすることなく、特定の圧縮比に画像を圧縮するチューナブル圧縮スキームも提案する。
論文 参考訳(メタデータ) (2020-01-18T02:40:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。