論文の概要: Explicit Residual-Based Scalable Image Coding for Humans and Machines
- arxiv url: http://arxiv.org/abs/2506.19297v1
- Date: Tue, 24 Jun 2025 04:01:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-25 19:48:23.483968
- Title: Explicit Residual-Based Scalable Image Coding for Humans and Machines
- Title(参考訳): 人間と機械の残差に基づくスケーラブルな画像符号化
- Authors: Yui Tatsumi, Ziyue Zeng, Hiroshi Watanabe,
- Abstract要約: スケーラブルな画像圧縮手法は マシンと人間の視覚の両方に役立ちます
本稿では, 明示的な残差圧縮機構を統合することにより, ICMHフレームワークの符号化効率と解釈可能性を向上させる。
特徴残差ベース残差ベース符号化(FR-ICMH)と画素残差ベース残差ベース残差ベース符号化(PR-ICMH)の2つの補完手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scalable image compression is a technique that progressively reconstructs multiple versions of an image for different requirements. In recent years, images have increasingly been consumed not only by humans but also by image recognition models. This shift has drawn growing attention to scalable image compression methods that serve both machine and human vision (ICMH). Many existing models employ neural network-based codecs, known as learned image compression, and have made significant strides in this field by carefully designing the loss functions. In some cases, however, models are overly reliant on their learning capacity, and their architectural design is not sufficiently considered. In this paper, we enhance the coding efficiency and interpretability of ICMH framework by integrating an explicit residual compression mechanism, which is commonly employed in resolution scalable coding methods such as JPEG2000. Specifically, we propose two complementary methods: Feature Residual-based Scalable Coding (FR-ICMH) and Pixel Residual-based Scalable Coding (PR-ICMH). These proposed methods are applicable to various machine vision tasks. Moreover, they provide flexibility to choose between encoder complexity and compression performance, making it adaptable to diverse application requirements. Experimental results demonstrate the effectiveness of our proposed methods, with PR-ICMH achieving up to 29.57% BD-rate savings over the previous work.
- Abstract(参考訳): スケーラブルな画像圧縮は、要求に応じて画像の複数のバージョンを段階的に再構築する技法である。
近年、画像は人間だけでなく、画像認識モデルも消費している。
このシフトは、機械と人間の視覚(ICMH)の両方に役立つスケーラブルな画像圧縮方法に注目が集まっている。
既存のモデルの多くは、学習画像圧縮として知られるニューラルネットワークベースのコーデックを採用しており、損失関数を慎重に設計することでこの分野に大きな進歩を遂げている。
しかし、いくつかのケースでは、モデルは学習能力に過度に依存しており、そのアーキテクチャ設計は十分に考慮されていない。
本稿では,JPEG2000のような高分解能な符号化手法でよく用いられる明示的残差圧縮機構を統合することにより,ICMHフレームワークの符号化効率と解釈可能性を向上させる。
具体的には,特徴残差ベースのスケーラブル符号化(FR-ICMH)と画素残差ベースのスケーラブル符号化(PR-ICMH)の2つの補完手法を提案する。
提案手法は様々なマシンビジョンタスクに適用可能である。
さらに、エンコーダの複雑さと圧縮性能を選択できる柔軟性を提供し、多様なアプリケーション要件に適応できる。
実験の結果,提案手法の有効性が示され,PR-ICMHは従来よりも29.57%のBD節減を実現した。
関連論文リスト
- Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。
具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。
実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-03-27T09:08:39Z) - MambaIC: State Space Models for High-Performance Learned Image Compression [53.991726013454695]
多数のフィールドをまたいだリアルタイム情報伝送には,高性能な画像圧縮アルゴリズムが不可欠である。
状態空間モデル(SSM)の長距離依存性の捕捉効果に着想を得て,SSMを利用して既存手法の計算不効率に対処する。
そこで本稿では,MambaICと呼ばれる洗練されたコンテキストモデリングによる画像圧縮手法を提案する。
論文 参考訳(メタデータ) (2025-03-16T11:32:34Z) - Compact Latent Representation for Image Compression (CLRIC) [16.428925911432344]
現在の画像圧縮モデルは、各品質レベルごとに別々のモデルを必要とすることが多く、トレーニングとストレージの両方の観点からリソース集約化されている。
本稿では,既存の学習モデルの潜伏変数を知覚画像圧縮に用いる革新的な手法を提案する。
本手法は,モデル非依存と解像度非依存の両面において,最先端の学習画像圧縮モデルに匹敵する知覚品質を実現する。
論文 参考訳(メタデータ) (2025-02-20T13:20:56Z) - Image-GS: Content-Adaptive Image Representation via 2D Gaussians [52.598772767324036]
本稿では,2次元ガウス放射率に基づくコンテンツ適応型画像表現であるImage-GSを紹介する。
リアルタイム使用のためにハードウェアフレンドリーな高速アクセスをサポートし、ピクセルをデコードするためには0.3KのMACしか必要としない。
テクスチャ圧縮、セマンティクス対応圧縮、共同画像圧縮と復元など、いくつかのアプリケーションでその汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-02T00:45:21Z) - Scalable Image Coding for Humans and Machines Using Feature Fusion Network [0.0]
本稿では,多数の画像認識モデルと互換性のある人や機械を対象とした,学習に基づくスケーラブルな画像符号化手法を提案する。
提案手法では,パラメータ数を削減しつつ,画像圧縮モデルを効率よく組み合わせることを確認する。
論文 参考訳(メタデータ) (2024-05-15T07:31:48Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - JND-Based Perceptual Optimization For Learned Image Compression [42.822121565430926]
学習画像圧縮方式におけるJNDに基づく知覚品質損失を提案する。
提案手法は,同じビットレートのベースラインモデルよりも知覚品質が向上したことを示す。
論文 参考訳(メタデータ) (2023-02-25T14:49:09Z) - Asymmetric Learned Image Compression with Multi-Scale Residual Block,
Importance Map, and Post-Quantization Filtering [15.056672221375104]
ディープラーニングに基づく画像圧縮は、最新のH.266/VVCよりも高いレート歪み(R-D)性能を実現している。
多くの先導的な学習スキームは、パフォーマンスと複雑さの間の良いトレードオフを維持することができません。
そこで本研究では,R-D の性能を技術状況よりも低い複雑さで実現した,効率的かつ効果的な画像符号化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-21T09:34:29Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Variable-Rate Deep Image Compression through Spatially-Adaptive Feature
Transform [58.60004238261117]
空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。
本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮速度をカバーしている。
提案するフレームワークにより,様々なタスクに対してタスク対応の画像圧縮を行うことができる。
論文 参考訳(メタデータ) (2021-08-21T17:30:06Z) - Slimmable Compressive Autoencoders for Practical Neural Image
Compression [20.715312224456138]
実画像圧縮のためのスリム圧縮オートエンコーダ(SlimCAEs)を提案する。
SlimCAEは、優れたレート歪み性能、可変率、メモリの動的調整、計算コスト、レイテンシを提供する柔軟性の高いモデルです。
論文 参考訳(メタデータ) (2021-03-29T16:12:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。