論文の概要: Saliency Driven Perceptual Image Compression
- arxiv url: http://arxiv.org/abs/2002.04988v2
- Date: Sun, 8 Nov 2020 17:03:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 20:32:36.186548
- Title: Saliency Driven Perceptual Image Compression
- Title(参考訳): サリエンシー駆動の知覚画像圧縮
- Authors: Yash Patel, Srikar Appalaraju, R. Manmatha
- Abstract要約: 画像圧縮技術の性能評価にはMS-SSIMやPSNRなどの評価指標が不十分であることを示す。
画像圧縮に特有な知覚的類似性データに基づいて学習する新しい指標を提案する。
このモデルは視覚的に優れた画像を生成するだけでなく、その後のコンピュータビジョンタスクに優れた性能を与える。
- 参考スコア(独自算出の注目度): 6.201592931432016
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a new end-to-end trainable model for lossy image
compression, which includes several novel components. The method incorporates
1) an adequate perceptual similarity metric; 2) saliency in the images; 3) a
hierarchical auto-regressive model. This paper demonstrates that the popularly
used evaluations metrics such as MS-SSIM and PSNR are inadequate for judging
the performance of image compression techniques as they do not align with the
human perception of similarity. Alternatively, a new metric is proposed, which
is learned on perceptual similarity data specific to image compression. The
proposed compression model incorporates the salient regions and optimizes on
the proposed perceptual similarity metric. The model not only generates images
which are visually better but also gives superior performance for subsequent
computer vision tasks such as object detection and segmentation when compared
to existing engineered or learned compression techniques.
- Abstract(参考訳): 本稿では,ロス画像圧縮のための新しいエンド・ツー・エンド学習モデルを提案する。
この方法には
1) 適切な知覚類似度尺度
2) 画像の正当性
3)階層的自己回帰モデル。
本稿では,ms-ssimやpsnrなどの評価基準が,人間の類似性知覚と一致しない画像圧縮技術の性能を判断するには不十分であることを示す。
あるいは、画像圧縮に特有の知覚的類似性データに基づいて学習する新しい指標を提案する。
提案した圧縮モデルは,有意な領域を包含し,提案した知覚的類似度尺度を最適化する。
このモデルは視覚的に優れた画像を生成するだけでなく、既存のエンジニアや学習した圧縮技術と比較して、オブジェクト検出やセグメンテーションといったその後のコンピュータビジョンタスクに優れたパフォーマンスを与える。
関連論文リスト
- A Rate-Distortion-Classification Approach for Lossy Image Compression [0.0]
損失画像圧縮では、画像を特定のビットレートに圧縮しながら、最小限の信号歪みを実現する。
画像圧縮と視覚解析のギャップを埋めるために、損失画像圧縮のためのRDCモデルを提案する。
論文 参考訳(メタデータ) (2024-05-06T14:11:36Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Learned Image Compression for Machine Perception [17.40776913809306]
人間の知覚と機械知覚の両方に適した圧縮フォーマットを生成するフレームワークを開発する。
コアビジョンタスクの圧縮と性能を同時に最適化する表現が学習可能であることを示す。
論文 参考訳(メタデータ) (2021-11-03T14:39:09Z) - Perceptually Optimizing Deep Image Compression [53.705543593594285]
平均二乗誤差(MSE)と$ell_p$ノルムは、ニューラルネットワークの損失の測定で大きく支配されている。
本稿では,定量的知覚モデルに対して,画像解析ネットワークを最適化するための異なるプロキシ手法を提案する。
論文 参考訳(メタデータ) (2020-07-03T14:33:28Z) - Improving Inference for Neural Image Compression [31.999462074510305]
State-of-the-art method build on Hierarchical variational autoencoders to predict a compressible latent representation of each data point。
従来の手法では性能を制限した3つの近似ギャップを同定する。
本稿では,これら3つの制約のそれぞれについて,反復的推論に関する考え方に基づく対策を提案する。
論文 参考訳(メタデータ) (2020-06-07T19:26:37Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。