論文の概要: VVC+M: Plug and Play Scalable Image Coding for Humans and Machines
- arxiv url: http://arxiv.org/abs/2305.10453v1
- Date: Wed, 17 May 2023 00:22:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-19 18:56:50.092376
- Title: VVC+M: Plug and Play Scalable Image Coding for Humans and Machines
- Title(参考訳): VVC+M:人間と機械のためのスケーラブルな画像符号化
- Authors: Alon Harell, Yalda Foroutan, and Ivan V. Bajic
- Abstract要約: 人間や機械のスケーラブルな符号化では、機械に使用される圧縮表現がさらに活用され、入力再構成が可能となる。
本稿では,VVCなどのビデオコーデックの残差符号化機能を利用して,任意の画像圧縮(ICM)方式からスケーラブルな画像を生成することを提案する。
- 参考スコア(独自算出の注目度): 25.062104976775448
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Compression for machines is an emerging field, where inputs are encoded while
optimizing the performance of downstream automated analysis. In scalable coding
for humans and machines, the compressed representation used for machines is
further utilized to enable input reconstruction. Often performed by jointly
optimizing the compression scheme for both machine task and human perception,
this results in sub-optimal rate-distortion (RD) performance for the machine
side. We focus on the case of images, proposing to utilize the pre-existing
residual coding capabilities of video codecs such as VVC to create a scalable
codec from any image compression for machines (ICM) scheme. Using our approach
we improve an existing scalable codec to achieve superior RD performance on the
machine task, while remaining competitive for human perception. Moreover, our
approach can be trained post-hoc for any given ICM scheme, and without creating
a coupling between the quality of the machine analysis and human vision.
- Abstract(参考訳): 機械の圧縮は、下流の自動分析の性能を最適化しながら入力をエンコードする新興分野である。
人間や機械のスケーラブルなコーディングでは、機械の圧縮表現がさらに活用され、入力再構成が可能となる。
機械作業と人間の知覚の両方に圧縮スキームを共同で最適化することにより、機械側ではRD(sub-optimal rate-distortion)の性能が向上する。
我々は、VVCなどのビデオコーデックの残余符号化機能を利用して、画像圧縮(ICM)方式でスケーラブルなコーデックを作成することを目的として、画像の場合に焦点を当てた。
このアプローチを用いることで、既存のスケーラブルなコーデックを改善して、人間の知覚に競争力を維持しながら、マシンタスク上で優れたRDパフォーマンスを実現する。
さらに,任意の icm スキームに対して,機械解析の品質と人間の視覚との結合を生じさせることなく,ポストホックを訓練することができる。
関連論文リスト
- NN-VVC: Versatile Video Coding boosted by self-supervisedly learned
image coding for machines [19.183883119933558]
本稿では, NN-VVC という, E2E 学習画像と CVC の利点を組み合わせて, 画像符号化と映像符号化の両面において高い性能を実現するマシン用ハイブリッドを提案する。
実験の結果,提案システムは画像データとビデオデータのVVCよりも最大で-43.20%,-26.8%のBjontegaard Deltaレート低下を達成した。
論文 参考訳(メタデータ) (2024-01-19T15:33:46Z) - VNVC: A Versatile Neural Video Coding Framework for Efficient
Human-Machine Vision [59.632286735304156]
コード化された表現をピクセルに復号することなく直接拡張・解析することがより効率的である。
再構成と直接拡張/分析の両方をサポートするために,コンパクト表現の学習を目標とする汎用型ニューラルビデオ符号化(VNVC)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T03:04:57Z) - Perceptual Video Coding for Machines via Satisfied Machine Ratio
Modeling [66.56355316611598]
Satisfied Machine Ratio (SMR) は、圧縮された画像やビデオの知覚的品質を評価するメトリクスである。
SMRは機械の知覚的コーディングを可能にし、機械のためのビデオ符号化を特異性から一般性まで推進する。
論文 参考訳(メタデータ) (2022-11-13T03:16:36Z) - Preprocessing Enhanced Image Compression for Machine Vision [14.895698385236937]
本稿では,マシンビジョンタスクのための前処理による画像圧縮手法を提案する。
私たちのフレームワークは従来の非微分コーデックの上に構築されています。
実験の結果,提案手法は,約20%の節約により,ダウンストリームマシンビジョンタスクのコーディングと性能のトレードオフを向上することが示された。
論文 参考訳(メタデータ) (2022-06-12T03:36:38Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - A New Image Codec Paradigm for Human and Machine Uses [53.48873918537017]
本研究では,人間用と機械用の両方にスケーラブルな画像パラダイムを提案する。
高レベルのインスタンスセグメンテーションマップと低レベルの信号特徴をニューラルネットワークで抽出する。
画像は16ビットのグレースケールプロファイルと信号特徴を持つ一般的な画質のイメージ再構成を実現するために設計および訓練される。
論文 参考訳(メタデータ) (2021-12-19T06:17:38Z) - Video Coding for Machines: A Paradigm of Collaborative Compression and
Intelligent Analytics [127.65410486227007]
フレーム全体を圧縮、再構成することを目的としたビデオ符号化と、最も重要な情報のみを保存し、送信する特徴圧縮は、スケールの2つの端に立つ。
最近のビデオ圧縮の急激なトレンド、例えばディープラーニングベースのコーディングツールやエンドツーエンドの画像/ビデオコーディング、MPEG-7のコンパクトな特徴記述子標準などの取り組みは、持続的かつ迅速な開発を促進する。
本稿では,新たな領域であるVCM(Video Coding for Machines)の探索を行う。
論文 参考訳(メタデータ) (2020-01-10T17:24:13Z) - An Emerging Coding Paradigm VCM: A Scalable Coding Approach Beyond
Feature and Signal [99.49099501559652]
Video Coding for Machine (VCM)は、視覚的特徴圧縮と古典的なビデオ符号化のギャップを埋めることを目的としている。
我々は,学習した動きパターンのガイダンスを用いて,映像フレームを再構成するために条件付き深層生成ネットワークを用いる。
予測モデルを介してスパース動作パターンを抽出することを学ぶことにより、特徴表現をエレガントに活用し、符号化されたフレームの外観を生成する。
論文 参考訳(メタデータ) (2020-01-09T14:18:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。