論文の概要: Learning-based Compression for Material and Texture Recognition
- arxiv url: http://arxiv.org/abs/2104.10065v1
- Date: Fri, 16 Apr 2021 23:16:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-24 09:40:02.497236
- Title: Learning-based Compression for Material and Texture Recognition
- Title(参考訳): 学習に基づく教材圧縮とテクスチャ認識
- Authors: Yingpeng Deng and Lina J. Karam
- Abstract要約: 本稿では,圧縮領域表現を用いて,圧縮領域内で直接視覚処理やコンピュータビジョンタスクを行う学習ベース圧縮方式について述べる。
学習ベースのJPEG-AIフレームワークを採用し、バリイングビットレートで圧縮ドメインの潜入表現を使用して材料およびテクスチャ認識を行います。
また, 圧縮領域分類は, より小さな縮小複雑度分類モデルを用いてTop-1とTop-5の精度で競合性能が得られることを示した。
- 参考スコア(独自算出の注目度): 23.668803886355683
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning-based image compression was shown to achieve a competitive
performance with state-of-the-art transform-based codecs. This motivated the
development of new learning-based visual compression standards such as JPEG-AI.
Of particular interest to these emerging standards is the development of
learning-based image compression systems targeting both humans and machines.
This paper is concerned with learning-based compression schemes whose
compressed-domain representations can be utilized to perform visual processing
and computer vision tasks directly in the compressed domain. Such a
characteristic has been incorporated as part of the scope and requirements of
the new emerging JPEG-AI standard. In our work, we adopt the learning-based
JPEG-AI framework for performing material and texture recognition using the
compressed-domain latent representation at varing bit-rates. For comparison,
performance results are presented using compressed but fully decoded images in
the pixel domain as well as original uncompressed images. The obtained
performance results show that even though decoded images can degrade the
classification performance of the model trained with original images,
retraining the model with decoded images will largely reduce the performance
gap for the adopted texture dataset. It is also shown that the
compressed-domain classification can yield a competitive performance in terms
of Top-1 and Top-5 accuracy while using a smaller reduced-complexity
classification model.
- Abstract(参考訳): 学習に基づく画像圧縮は、最先端の変換ベースのコーデックと競合する性能を発揮する。
これはJPEG-AIのような新しい学習ベースのビジュアル圧縮標準の開発を動機づけた。
これらの新しい標準に対する特に関心は、人間と機械の両方をターゲットにした学習ベースの画像圧縮システムの開発である。
本稿では,圧縮領域表現を用いて,圧縮領域内で直接視覚処理やコンピュータビジョンタスクを行う学習ベース圧縮方式について述べる。
このような特徴は、新しいJPEG-AI標準の範囲と要件の一部として組み込まれている。
本研究では,各ビットレートの圧縮ドメイン潜在表現を用いて,材料およびテクスチャ認識を行うための学習ベースのJPEG-AIフレームワークを採用した。
比較のために、画素領域内の圧縮画像と完全復号画像と、元の非圧縮画像とを用いて、性能結果を示す。
得られた結果から,復号化画像は原画像で訓練されたモデルの分類性能を劣化させることができるが,復号化画像でモデルを再訓練することで,採用したテクスチャデータセットのパフォーマンスギャップを大幅に低減できることがわかった。
また, 圧縮領域分類は, より小さな縮小複雑度分類モデルを用いてTop-1とTop-5の精度で競合性能が得られることを示した。
関連論文リスト
- The JPEG Pleno Learning-based Point Cloud Coding Standard: Serving Man and Machine [49.16996486119006]
ディープラーニングは、ポイントクラウドコーディングの強力なツールとして登場した。
JPEGは先日、JPEG Pleno LearningベースのPoint Cloud Coding標準を確定した。
本稿ではJPEG PCC標準の完全な技術的記述を提供する。
論文 参考訳(メタデータ) (2024-09-12T15:20:23Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - DNN-Compressed Domain Visual Recognition with Feature Adaptation [19.79803434998116]
学習に基づく画像圧縮は、最先端の変換ベースのコーデックと競合する性能を発揮することが示されている。
これはJPEG-AIのような新しい学習ベースのビジュアル圧縮標準の開発を動機づけた。
本稿では,圧縮領域表現を用いて,圧縮領域内で直接視覚処理やコンピュータビジョンタスクを行う学習ベース圧縮方式について述べる。
論文 参考訳(メタデータ) (2023-05-13T20:45:17Z) - Learned Lossless Compression for JPEG via Frequency-Domain Prediction [50.20577108662153]
JPEG画像のロスレス圧縮を学習するための新しいフレームワークを提案する。
周波数領域での学習を可能にするために、DCT係数は暗黙の局所冗長性を利用するためにグループに分割される。
グループ化されたDCT係数のエントロピーモデリングを実現するために、重み付きブロックに基づいてオートエンコーダのようなアーキテクチャを設計する。
論文 参考訳(メタデータ) (2023-03-05T13:15:28Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Learned Image Compression for Machine Perception [17.40776913809306]
人間の知覚と機械知覚の両方に適した圧縮フォーマットを生成するフレームワークを開発する。
コアビジョンタスクの圧縮と性能を同時に最適化する表現が学習可能であることを示す。
論文 参考訳(メタデータ) (2021-11-03T14:39:09Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z) - Saliency Driven Perceptual Image Compression [6.201592931432016]
画像圧縮技術の性能評価にはMS-SSIMやPSNRなどの評価指標が不十分であることを示す。
画像圧縮に特有な知覚的類似性データに基づいて学習する新しい指標を提案する。
このモデルは視覚的に優れた画像を生成するだけでなく、その後のコンピュータビジョンタスクに優れた性能を与える。
論文 参考訳(メタデータ) (2020-02-12T13:43:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。