論文の概要: Continuous Patch Stitching for Block-wise Image Compression
- arxiv url: http://arxiv.org/abs/2502.16795v1
- Date: Mon, 24 Feb 2025 03:11:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:52:37.323537
- Title: Continuous Patch Stitching for Block-wise Image Compression
- Title(参考訳): ブロックワイド画像圧縮のための連続的パッチストッチング
- Authors: Zifu Zhang, Shengxi Li, Henan Liu, Mai Xu, Ce Zhu,
- Abstract要約: ブロックワイド画像圧縮のための新しい連続パッチステッチ(CPS)フレームワークを提案する。
我々のCPSフレームワークは、既存のモデルのコンピューティングリソースの半分以下を必要としながら、既存のベースラインに対して最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 56.97857167461269
- License:
- Abstract: Most recently, learned image compression methods have outpaced traditional hand-crafted standard codecs. However, their inference typically requires to input the whole image at the cost of heavy computing resources, especially for high-resolution image compression; otherwise, the block artefact can exist when compressed by blocks within existing learned image compression methods. To address this issue, we propose a novel continuous patch stitching (CPS) framework for block-wise image compression that is able to achieve seamlessly patch stitching and mathematically eliminate block artefact, thus capable of significantly reducing the required computing resources when compressing images. More specifically, the proposed CPS framework is achieved by padding-free operations throughout, with a newly established parallel overlapping stitching strategy to provide a general upper bound for ensuring the continuity. Upon this, we further propose functional residual blocks with even-sized kernels to achieve down-sampling and up-sampling, together with bottleneck residual blocks retaining feature size to increase network depth. Experimental results demonstrate that our CPS framework achieves the state-of-the-art performance against existing baselines, whilst requiring less than half of computing resources of existing models. Our code shall be released upon acceptance.
- Abstract(参考訳): 最近では、学習した画像圧縮法が従来の手作りの標準コーデックを上回っている。
しかし、それらの推論は一般的に、特に高解像度の画像圧縮のために、重い計算資源のコストで画像全体を入力することを必要とし、そうでなければ、既存の学習された画像圧縮手法のブロックによって圧縮されたブロックアーチファクトが存在する。
この問題に対処するために、ブロックワイズ画像圧縮のための新しい連続的パッチステッチ(CPS)フレームワークを提案し、これによりシームレスにパッチステッチを行い、ブロックアーチファクトを数学的に除去し、画像圧縮時に必要となる計算資源を大幅に削減することができる。
より具体的には、提案したCPSフレームワークは、連続性を保証するための一般的な上界を提供するために、新たに確立された並列重複縫合戦略を用いて、パディングフリーな操作により達成される。
そこで我々は, ネットワーク深度を高めるために, 機能的残差ブロックと, ネットワーク深度を増大させるボトルネック残差ブロックを同時に, ダウンサンプリングとアップサンプリングを実現するために, 偶大カーネルを用いた機能的残差ブロックを提案する。
実験により,我々のCPSフレームワークは,既存モデルの計算資源の半分未満を必要としながら,既存のベースラインに対して最先端の性能を実現することを示した。
我々のコードは受理時に解放される。
関連論文リスト
- UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation [59.3877309501938]
Inlicit Neural Representation (INR) ネットワークは、その柔軟な圧縮比のため、顕著な汎用性を示している。
周波数領域情報を含むコードブックをINRネットワークへの事前入力として導入する。
これにより、INRの表現力が向上し、異なる画像ブロックに対して特異な条件付けが提供される。
論文 参考訳(メタデータ) (2024-05-27T05:52:13Z) - Streaming Lossless Volumetric Compression of Medical Images Using Gated
Recurrent Convolutional Neural Network [0.0]
本稿では,ハードウェアフレンドリーなストリーミングロスレスボリューム圧縮フレームワークを提案する。
本稿では,多種多様な畳み込み構造と融合ゲート機構を組み合わせたゲートリカレント畳み込みニューラルネットワークを提案する。
提案手法は,堅牢な一般化能力と競争圧縮速度を示す。
論文 参考訳(メタデータ) (2023-11-27T07:19:09Z) - Exploring Resolution Fields for Scalable Image Compression with
Uncertainty Guidance [47.96024424475888]
本研究では,スケーラブルな画像圧縮における分解能場の可能性について検討する。
本稿では,より適応的で多目的な圧縮を実現するための相互ピラミッドネットワーク(RPN)を提案する。
実験は、既存の古典的およびディープラーニングベースのスケーラブルコーデックに対するRPNの優位性を示している。
論文 参考訳(メタデータ) (2023-06-15T08:26:24Z) - Random-Access Neural Compression of Material Textures [1.2971248363246106]
材料テクスチャに特化して設計された新しいニューラル圧縮手法を提案する。
我々は低圧縮でさらに2つの詳細レベル、すなわち16倍のテクセルをアンロックする。
本手法では,ランダムアクセスによるオンデマンドリアルタイム圧縮が可能で,ディスクやメモリ上での圧縮が可能となる。
論文 参考訳(メタデータ) (2023-05-26T17:16:22Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - Identity Preserving Loss for Learned Image Compression [0.0]
本研究は,高圧縮率を実現するために,ドメイン固有の特徴を学習するエンドツーエンド画像圧縮フレームワークを提案する。
本稿では,CRF-23 HEVC圧縮の38%と42%のビット・パー・ピクセル(BPP)値が得られる新しいID保存再構成(IPR)ロス関数を提案する。
CRF-23 HEVC圧縮の38%の低いBPP値を保ちながら、未確認の認識モデルを用いてLFWデータセットの at-par 認識性能を示す。
論文 参考訳(メタデータ) (2022-04-22T18:01:01Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Learned Block-based Hybrid Image Compression [33.44942603425436]
学習画像圧縮に関する最近の研究は、完全な解像度で符号化および復号処理を行う。
フルレゾリューション推論は、GPUリソースが限られているメモリ外問題(OOM)を引き起こすことが多い。
本稿では,学習ブロックベースのハイブリッド画像圧縮フレームワークを提供する。
論文 参考訳(メタデータ) (2020-12-17T12:47:39Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。