論文の概要: Explicit Residual-Based Scalable Image Coding for Humans and Machines
- arxiv url: http://arxiv.org/abs/2506.19297v1
- Date: Tue, 24 Jun 2025 04:01:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-25 19:48:23.483968
- Title: Explicit Residual-Based Scalable Image Coding for Humans and Machines
- Title(参考訳): 人間と機械の残差に基づくスケーラブルな画像符号化
- Authors: Yui Tatsumi, Ziyue Zeng, Hiroshi Watanabe,
- Abstract要約: スケーラブルな画像圧縮手法は マシンと人間の視覚の両方に役立ちます
本稿では, 明示的な残差圧縮機構を統合することにより, ICMHフレームワークの符号化効率と解釈可能性を向上させる。
特徴残差ベース残差ベース符号化(FR-ICMH)と画素残差ベース残差ベース残差ベース符号化(PR-ICMH)の2つの補完手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scalable image compression is a technique that progressively reconstructs multiple versions of an image for different requirements. In recent years, images have increasingly been consumed not only by humans but also by image recognition models. This shift has drawn growing attention to scalable image compression methods that serve both machine and human vision (ICMH). Many existing models employ neural network-based codecs, known as learned image compression, and have made significant strides in this field by carefully designing the loss functions. In some cases, however, models are overly reliant on their learning capacity, and their architectural design is not sufficiently considered. In this paper, we enhance the coding efficiency and interpretability of ICMH framework by integrating an explicit residual compression mechanism, which is commonly employed in resolution scalable coding methods such as JPEG2000. Specifically, we propose two complementary methods: Feature Residual-based Scalable Coding (FR-ICMH) and Pixel Residual-based Scalable Coding (PR-ICMH). These proposed methods are applicable to various machine vision tasks. Moreover, they provide flexibility to choose between encoder complexity and compression performance, making it adaptable to diverse application requirements. Experimental results demonstrate the effectiveness of our proposed methods, with PR-ICMH achieving up to 29.57% BD-rate savings over the previous work.
- Abstract(参考訳): スケーラブルな画像圧縮は、要求に応じて画像の複数のバージョンを段階的に再構築する技法である。
近年、画像は人間だけでなく、画像認識モデルも消費している。
このシフトは、機械と人間の視覚(ICMH)の両方に役立つスケーラブルな画像圧縮方法に注目が集まっている。
既存のモデルの多くは、学習画像圧縮として知られるニューラルネットワークベースのコーデックを採用しており、損失関数を慎重に設計することでこの分野に大きな進歩を遂げている。
しかし、いくつかのケースでは、モデルは学習能力に過度に依存しており、そのアーキテクチャ設計は十分に考慮されていない。
本稿では,JPEG2000のような高分解能な符号化手法でよく用いられる明示的残差圧縮機構を統合することにより,ICMHフレームワークの符号化効率と解釈可能性を向上させる。
具体的には,特徴残差ベースのスケーラブル符号化(FR-ICMH)と画素残差ベースのスケーラブル符号化(PR-ICMH)の2つの補完手法を提案する。
提案手法は様々なマシンビジョンタスクに適用可能である。
さらに、エンコーダの複雑さと圧縮性能を選択できる柔軟性を提供し、多様なアプリケーション要件に適応できる。
実験の結果,提案手法の有効性が示され,PR-ICMHは従来よりも29.57%のBD節減を実現した。
関連論文リスト
- Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。
具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。
実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-03-27T09:08:39Z) - MambaIC: State Space Models for High-Performance Learned Image Compression [53.991726013454695]
多数のフィールドをまたいだリアルタイム情報伝送には,高性能な画像圧縮アルゴリズムが不可欠である。
状態空間モデル(SSM)の長距離依存性の捕捉効果に着想を得て,SSMを利用して既存手法の計算不効率に対処する。
そこで本稿では,MambaICと呼ばれる洗練されたコンテキストモデリングによる画像圧縮手法を提案する。
論文 参考訳(メタデータ) (2025-03-16T11:32:34Z) - Scalable Image Coding for Humans and Machines Using Feature Fusion Network [0.0]
本稿では,多数の画像認識モデルと互換性のある人や機械を対象とした,学習に基づくスケーラブルな画像符号化手法を提案する。
提案手法では,パラメータ数を削減しつつ,画像圧縮モデルを効率よく組み合わせることを確認する。
論文 参考訳(メタデータ) (2024-05-15T07:31:48Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。