論文の概要: Progressive Learned Image Compression for Machine Perception
- arxiv url: http://arxiv.org/abs/2512.20070v1
- Date: Tue, 23 Dec 2025 05:45:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.761665
- Title: Progressive Learned Image Compression for Machine Perception
- Title(参考訳): 機械認識のためのプログレッシブラーニング画像圧縮
- Authors: Jungwoo Kim, Jun-Hyuk Kim, Jong-Seok Lee,
- Abstract要約: 本稿では,三面体符号化に基づく機械認識のための新しいプログレッシブラーニング画像圧縮,PICM-Netを提案する。
提案手法は,下流分類タスクにおいて高い性能を維持しつつ,効率よく適応的なプログレッシブトランスミッションを実現する。
- 参考スコア(独自算出の注目度): 27.208988763458958
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in learned image codecs have been extended from human perception toward machine perception. However, progressive image compression with fine granular scalability (FGS)-which enables decoding a single bitstream at multiple quality levels-remains unexplored for machine-oriented codecs. In this work, we propose a novel progressive learned image compression codec for machine perception, PICM-Net, based on trit-plane coding. By analyzing the difference between human- and machine-oriented rate-distortion priorities, we systematically examine the latent prioritization strategies in terms of machine-oriented codecs. To further enhance real-world adaptability, we design an adaptive decoding controller, which dynamically determines the necessary decoding level during inference time to maintain the desired confidence of downstream machine prediction. Extensive experiments demonstrate that our approach enables efficient and adaptive progressive transmission while maintaining high performance in the downstream classification task, establishing a new paradigm for machine-aware progressive image compression.
- Abstract(参考訳): 学習画像コーデックの最近の進歩は、人間の知覚から機械知覚へと拡張されている。
しかし、複数の品質レベルで単一のビットストリームを復号化することが可能な、微細粒度スケーラビリティ(FGS)によるプログレッシブ画像圧縮は、マシン指向コーデックでは未検討である。
本研究では,三面面符号化に基づく機械認識のための新しいプログレッシブラーニング画像圧縮コーデックPICM-Netを提案する。
ヒトと機械の速度歪みの優先順位の違いを解析することにより、機械指向コーデックの観点で潜在優先度付け戦略を体系的に検討する。
実世界の適応性を更に高めるため、我々は、下流機械予測の望ましい信頼性を維持するために、推論時間中に必要な復号レベルを動的に決定する適応復号制御器を設計する。
大規模な実験により、下流の分類タスクにおいて高い性能を維持しながら効率よく適応的なプログレッシブ・トランスミッションを実現し、マシン対応のプログレッシブ・イメージ・圧縮のための新しいパラダイムを確立した。
関連論文リスト
- Rate-Distortion-Cognition Controllable Versatile Neural Image Compression [47.72668401825835]
速度歪み認識制御可能な多目的画像圧縮法を提案する。
本手法は, 良好なICM性能とフレキシブルレート・ディストーション・コグニテーション制御を実現する。
論文 参考訳(メタデータ) (2024-07-16T13:17:51Z) - Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - Unifying Generation and Compression: Ultra-low bitrate Image Coding Via
Multi-stage Transformer [35.500720262253054]
本稿では,新しい画像生成圧縮(UIGC)パラダイムを導入し,生成と圧縮のプロセスを統合する。
UIGCフレームワークの重要な特徴は、トークン化にベクトル量子化(VQ)イメージモデルを採用することである。
実験では、既存のコーデックよりも知覚品質と人間の知覚において、提案されたUIGCフレームワークが優れていることを示した。
論文 参考訳(メタデータ) (2024-03-06T14:27:02Z) - VVC+M: Plug and Play Scalable Image Coding for Humans and Machines [25.062104976775448]
人間や機械のスケーラブルな符号化では、機械に使用される圧縮表現がさらに活用され、入力再構成が可能となる。
本稿では,VVCなどのビデオコーデックの残差符号化機能を利用して,任意の画像圧縮(ICM)方式からスケーラブルな画像を生成することを提案する。
論文 参考訳(メタデータ) (2023-05-17T00:22:39Z) - Preprocessing Enhanced Image Compression for Machine Vision [14.895698385236937]
本稿では,マシンビジョンタスクのための前処理による画像圧縮手法を提案する。
私たちのフレームワークは従来の非微分コーデックの上に構築されています。
実験の結果,提案手法は,約20%の節約により,ダウンストリームマシンビジョンタスクのコーディングと性能のトレードオフを向上することが示された。
論文 参考訳(メタデータ) (2022-06-12T03:36:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。