論文の概要: Progressive Learned Image Compression for Machine Perception
- arxiv url: http://arxiv.org/abs/2512.20070v1
- Date: Tue, 23 Dec 2025 05:45:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.761665
- Title: Progressive Learned Image Compression for Machine Perception
- Title(参考訳): 機械認識のためのプログレッシブラーニング画像圧縮
- Authors: Jungwoo Kim, Jun-Hyuk Kim, Jong-Seok Lee,
- Abstract要約: 本稿では,三面体符号化に基づく機械認識のための新しいプログレッシブラーニング画像圧縮,PICM-Netを提案する。
提案手法は,下流分類タスクにおいて高い性能を維持しつつ,効率よく適応的なプログレッシブトランスミッションを実現する。
- 参考スコア(独自算出の注目度): 27.208988763458958
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in learned image codecs have been extended from human perception toward machine perception. However, progressive image compression with fine granular scalability (FGS)-which enables decoding a single bitstream at multiple quality levels-remains unexplored for machine-oriented codecs. In this work, we propose a novel progressive learned image compression codec for machine perception, PICM-Net, based on trit-plane coding. By analyzing the difference between human- and machine-oriented rate-distortion priorities, we systematically examine the latent prioritization strategies in terms of machine-oriented codecs. To further enhance real-world adaptability, we design an adaptive decoding controller, which dynamically determines the necessary decoding level during inference time to maintain the desired confidence of downstream machine prediction. Extensive experiments demonstrate that our approach enables efficient and adaptive progressive transmission while maintaining high performance in the downstream classification task, establishing a new paradigm for machine-aware progressive image compression.
- Abstract(参考訳): 学習画像コーデックの最近の進歩は、人間の知覚から機械知覚へと拡張されている。
しかし、複数の品質レベルで単一のビットストリームを復号化することが可能な、微細粒度スケーラビリティ(FGS)によるプログレッシブ画像圧縮は、マシン指向コーデックでは未検討である。
本研究では,三面面符号化に基づく機械認識のための新しいプログレッシブラーニング画像圧縮コーデックPICM-Netを提案する。
ヒトと機械の速度歪みの優先順位の違いを解析することにより、機械指向コーデックの観点で潜在優先度付け戦略を体系的に検討する。
実世界の適応性を更に高めるため、我々は、下流機械予測の望ましい信頼性を維持するために、推論時間中に必要な復号レベルを動的に決定する適応復号制御器を設計する。
大規模な実験により、下流の分類タスクにおいて高い性能を維持しながら効率よく適応的なプログレッシブ・トランスミッションを実現し、マシン対応のプログレッシブ・イメージ・圧縮のための新しいパラダイムを確立した。
関連論文リスト
- A Preprocessing Framework for Video Machine Vision under Compression [26.253209831074184]
本稿では,この課題に対処するために,マシンビジョンタスクに適したビデオ前処理フレームワークを提案する。
提案手法は,後続のタスクにおいて重要な情報を保持するニューラルプリプロセッサを組み込んでおり,その結果,レート精度が向上する。
論文 参考訳(メタデータ) (2025-12-17T11:26:19Z) - Embedding Compression Distortion in Video Coding for Machines [67.97469042910855]
現在、ビデオ伝送は人間の視覚システム(HVS)だけでなく、分析のための機械認識にも役立っている。
本稿では,機械知覚関連歪み表現を抽出し,下流モデルに埋め込む圧縮歪埋め込み(CDRE)フレームワークを提案する。
我々のフレームワークは,実行時間,パラメータ数といったオーバーヘッドを最小限に抑えて,既存のコーデックのレートタスク性能を効果的に向上させることができる。
論文 参考訳(メタデータ) (2025-03-27T13:01:53Z) - Rate-Distortion-Cognition Controllable Versatile Neural Image Compression [47.72668401825835]
速度歪み認識制御可能な多目的画像圧縮法を提案する。
本手法は, 良好なICM性能とフレキシブルレート・ディストーション・コグニテーション制御を実現する。
論文 参考訳(メタデータ) (2024-07-16T13:17:51Z) - Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - Unifying Generation and Compression: Ultra-low bitrate Image Coding Via
Multi-stage Transformer [35.500720262253054]
本稿では,新しい画像生成圧縮(UIGC)パラダイムを導入し,生成と圧縮のプロセスを統合する。
UIGCフレームワークの重要な特徴は、トークン化にベクトル量子化(VQ)イメージモデルを採用することである。
実験では、既存のコーデックよりも知覚品質と人間の知覚において、提案されたUIGCフレームワークが優れていることを示した。
論文 参考訳(メタデータ) (2024-03-06T14:27:02Z) - VNVC: A Versatile Neural Video Coding Framework for Efficient
Human-Machine Vision [59.632286735304156]
コード化された表現をピクセルに復号することなく直接拡張・解析することがより効率的である。
再構成と直接拡張/分析の両方をサポートするために,コンパクト表現の学習を目標とする汎用型ニューラルビデオ符号化(VNVC)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T03:04:57Z) - VVC+M: Plug and Play Scalable Image Coding for Humans and Machines [25.062104976775448]
人間や機械のスケーラブルな符号化では、機械に使用される圧縮表現がさらに活用され、入力再構成が可能となる。
本稿では,VVCなどのビデオコーデックの残差符号化機能を利用して,任意の画像圧縮(ICM)方式からスケーラブルな画像を生成することを提案する。
論文 参考訳(メタデータ) (2023-05-17T00:22:39Z) - Preprocessing Enhanced Image Compression for Machine Vision [14.895698385236937]
本稿では,マシンビジョンタスクのための前処理による画像圧縮手法を提案する。
私たちのフレームワークは従来の非微分コーデックの上に構築されています。
実験の結果,提案手法は,約20%の節約により,ダウンストリームマシンビジョンタスクのコーディングと性能のトレードオフを向上することが示された。
論文 参考訳(メタデータ) (2022-06-12T03:36:38Z) - Video Coding for Machines: A Paradigm of Collaborative Compression and
Intelligent Analytics [127.65410486227007]
フレーム全体を圧縮、再構成することを目的としたビデオ符号化と、最も重要な情報のみを保存し、送信する特徴圧縮は、スケールの2つの端に立つ。
最近のビデオ圧縮の急激なトレンド、例えばディープラーニングベースのコーディングツールやエンドツーエンドの画像/ビデオコーディング、MPEG-7のコンパクトな特徴記述子標準などの取り組みは、持続的かつ迅速な開発を促進する。
本稿では,新たな領域であるVCM(Video Coding for Machines)の探索を行う。
論文 参考訳(メタデータ) (2020-01-10T17:24:13Z) - An Emerging Coding Paradigm VCM: A Scalable Coding Approach Beyond
Feature and Signal [99.49099501559652]
Video Coding for Machine (VCM)は、視覚的特徴圧縮と古典的なビデオ符号化のギャップを埋めることを目的としている。
我々は,学習した動きパターンのガイダンスを用いて,映像フレームを再構成するために条件付き深層生成ネットワークを用いる。
予測モデルを介してスパース動作パターンを抽出することを学ぶことにより、特徴表現をエレガントに活用し、符号化されたフレームの外観を生成する。
論文 参考訳(メタデータ) (2020-01-09T14:18:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。