論文の概要: Learned Image Compression for Machine Perception
- arxiv url: http://arxiv.org/abs/2111.02249v1
- Date: Wed, 3 Nov 2021 14:39:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-04 14:06:22.836375
- Title: Learned Image Compression for Machine Perception
- Title(参考訳): 機械知覚のための学習画像圧縮
- Authors: Felipe Codevilla, Jean Gabriel Simard, Ross Goroshin and Chris Pal
- Abstract要約: 人間の知覚と機械知覚の両方に適した圧縮フォーマットを生成するフレームワークを開発する。
コアビジョンタスクの圧縮と性能を同時に最適化する表現が学習可能であることを示す。
- 参考スコア(独自算出の注目度): 17.40776913809306
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent work has shown that learned image compression strategies can
outperform standard hand-crafted compression algorithms that have been
developed over decades of intensive research on the rate-distortion trade-off.
With growing applications of computer vision, high quality image reconstruction
from a compressible representation is often a secondary objective. Compression
that ensures high accuracy on computer vision tasks such as image segmentation,
classification, and detection therefore has the potential for significant
impact across a wide variety of settings. In this work, we develop a framework
that produces a compression format suitable for both human perception and
machine perception. We show that representations can be learned that
simultaneously optimize for compression and performance on core vision tasks.
Our approach allows models to be trained directly from compressed
representations, and this approach yields increased performance on new tasks
and in low-shot learning settings. We present results that improve upon
segmentation and detection performance compared to standard high quality JPGs,
but with representations that are four to ten times smaller in terms of bits
per pixel. Further, unlike naive compression methods, at a level ten times
smaller than standard JEPGs, segmentation and detection models trained from our
format suffer only minor degradation in performance.
- Abstract(参考訳): 近年の研究では、学習した画像圧縮戦略が、速度歪みトレードオフに関する何十年にも渡って開発されてきた標準的な手作り圧縮アルゴリズムより優れていることが示されている。
コンピュータビジョンの応用が増えているため、圧縮性表現からの高品質な画像再構成は、しばしば二次的な目的である。
画像のセグメンテーション、分類、検出などのコンピュータビジョンタスクにおいて高い精度を保証する圧縮は、様々な環境において大きな影響を与える可能性がある。
本研究では,人間の知覚と機械知覚の両方に適した圧縮フォーマットを生成するフレームワークを開発する。
コアビジョンタスクの圧縮と性能を同時に最適化する表現が学習可能であることを示す。
このアプローチでは,圧縮表現からモデルを直接トレーニングすることが可能であり,新しいタスクや低ショット学習環境でのパフォーマンス向上を実現する。
本稿では,標準品質のJPGに比べてセグメント化と検出性能が向上するが,画素あたりのビット数では4倍から10倍の表現が可能であることを示す。
さらに,従来のJEPGの10倍の圧縮手法とは異なり,我々のフォーマットからトレーニングしたセグメンテーションと検出モデルは,性能がわずかに低下するのみである。
関連論文リスト
- Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - HFLIC: Human Friendly Perceptual Learned Image Compression with
Reinforced Transform [16.173583505483272]
現在の学習ベースの画像圧縮法は、人間に優しい圧縮を犠牲にし、長い復号時間を必要とすることが多い。
本稿では、既存の画像圧縮モデルのバックボーンネットワークとロス関数の強化を提案し、人間の知覚と効率の改善に焦点をあてる。
論文 参考訳(メタデータ) (2023-05-12T14:35:27Z) - Machine Perception-Driven Image Compression: A Layered Generative
Approach [32.23554195427311]
階層型生成画像圧縮モデルを提案する。
タスクに依存しない学習に基づく圧縮モデルを提案し、様々な圧縮されたドメインベースの分析タスクを効果的にサポートする。
圧縮比、再構成画像品質、下流知覚性能の最良のバランス点を得るために、共同最適化スケジュールを採用する。
論文 参考訳(メタデータ) (2023-04-14T02:12:38Z) - Crowd Counting on Heavily Compressed Images with Curriculum Pre-Training [90.76576712433595]
ディープニューラルネットワークによって処理された画像に損失圧縮を適用することで、大幅な精度低下につながる可能性がある。
カリキュラム学習のパラダイムに着想を得て,圧縮画像の群集カウントのためのカリキュラム事前学習(CPT)と呼ばれる新しいトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-15T08:43:21Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Learning-based Compression for Material and Texture Recognition [23.668803886355683]
本稿では,圧縮領域表現を用いて,圧縮領域内で直接視覚処理やコンピュータビジョンタスクを行う学習ベース圧縮方式について述べる。
学習ベースのJPEG-AIフレームワークを採用し、バリイングビットレートで圧縮ドメインの潜入表現を使用して材料およびテクスチャ認識を行います。
また, 圧縮領域分類は, より小さな縮小複雑度分類モデルを用いてTop-1とTop-5の精度で競合性能が得られることを示した。
論文 参考訳(メタデータ) (2021-04-16T23:16:26Z) - Analyzing and Mitigating JPEG Compression Defects in Deep Learning [69.04777875711646]
本稿では,JPEG圧縮が共通タスクやデータセットに与える影響を統一的に検討する。
高圧縮の一般的なパフォーマンス指標には大きなペナルティがあることが示される。
論文 参考訳(メタデータ) (2020-11-17T20:32:57Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z) - Saliency Driven Perceptual Image Compression [6.201592931432016]
画像圧縮技術の性能評価にはMS-SSIMやPSNRなどの評価指標が不十分であることを示す。
画像圧縮に特有な知覚的類似性データに基づいて学習する新しい指標を提案する。
このモデルは視覚的に優れた画像を生成するだけでなく、その後のコンピュータビジョンタスクに優れた性能を与える。
論文 参考訳(メタデータ) (2020-02-12T13:43:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。