論文の概要: Discernible Image Compression
- arxiv url: http://arxiv.org/abs/2002.06810v3
- Date: Tue, 8 Sep 2020 00:44:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-31 12:53:52.108910
- Title: Discernible Image Compression
- Title(参考訳): 識別可能な画像圧縮
- Authors: Zhaohui Yang, Yunhe Wang, Chang Xu, Peng Du, Chao Xu, Chunjing Xu, Qi
Tian
- Abstract要約: 本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
- 参考スコア(独自算出の注目度): 124.08063151879173
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image compression, as one of the fundamental low-level image processing
tasks, is very essential for computer vision. Tremendous computing and storage
resources can be preserved with a trivial amount of visual information.
Conventional image compression methods tend to obtain compressed images by
minimizing their appearance discrepancy with the corresponding original images,
but pay little attention to their efficacy in downstream perception tasks,
e.g., image recognition and object detection. Thus, some of compressed images
could be recognized with bias. In contrast, this paper aims to produce
compressed images by pursuing both appearance and perceptual consistency. Based
on the encoder-decoder framework, we propose using a pre-trained CNN to extract
features of the original and compressed images, and making them similar. Thus
the compressed images are discernible to subsequent tasks, and we name our
method as Discernible Image Compression (DIC). In addition, the maximum mean
discrepancy (MMD) is employed to minimize the difference between feature
distributions. The resulting compression network can generate images with high
image quality and preserve the consistent perception in the feature domain, so
that these images can be well recognized by pre-trained machine learning
models. Experiments on benchmarks demonstrate that images compressed by using
the proposed method can also be well recognized by subsequent visual
recognition and detection models. For instance, the mAP value of compressed
images by DIC is about 0.6% higher than that of using compressed images by
conventional methods.
- Abstract(参考訳): 低レベルの画像処理タスクの1つである画像圧縮は、コンピュータビジョンにとって非常に重要である。
トレメンダスコンピューティングとストレージリソースは、自明な量の視覚情報で保存することができる。
従来の画像圧縮法では、その外観差を対応する原画像と最小化することで圧縮画像を得る傾向にあるが、画像認識や物体検出などの下流認識タスクにおいて、その効果にはほとんど注意を払わない。
したがって、圧縮された画像のいくつかはバイアスで認識できる。
対照的に,本論文は外観と知覚の整合性の両方を追求し,圧縮画像を作成することを目的としている。
エンコーダ・デコーダ・フレームワークに基づき、プリトレーニングされたcnnを用いて、オリジナル画像と圧縮画像の特徴を抽出し、類似させる。
したがって、圧縮された画像はその後のタスクに識別可能であり、本手法を識別可能画像圧縮(DIC)と呼ぶ。
さらに,特徴分布の差を最小限に抑えるために,最大平均誤差(MMD)を用いる。
得られた圧縮ネットワークは、画像品質の高い画像を生成し、特徴領域における一貫した認識を保ち、これらの画像が事前訓練された機械学習モデルで十分に認識できるようにする。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,後続の視覚認識・検出モデルでもよく認識できることを示した。
例えば、DICによる圧縮画像のmAP値は、従来の方法で圧縮画像を使用するものよりも約0.6%高い。
関連論文リスト
- Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Crowd Counting on Heavily Compressed Images with Curriculum Pre-Training [90.76576712433595]
ディープニューラルネットワークによって処理された画像に損失圧縮を適用することで、大幅な精度低下につながる可能性がある。
カリキュラム学習のパラダイムに着想を得て,圧縮画像の群集カウントのためのカリキュラム事前学習(CPT)と呼ばれる新しいトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-15T08:43:21Z) - Perceptual Quality Assessment for Fine-Grained Compressed Images [38.615746092795625]
そこで本研究では,精細レベルの圧縮画像に対するフル参照画像品質評価(FR-IQA)手法を提案する。
提案手法は,FGIQAデータベース上での圧縮画像品質評価(FGIQA)により検証される。
論文 参考訳(メタデータ) (2022-06-08T12:56:45Z) - SwinIQA: Learned Swin Distance for Compressed Image Quality Assessment [23.87848736166893]
我々は,スウィン距離空間における圧縮画像の知覚的品質を測定するために,フル参照画像品質評価尺度SwinIQAを設計する。
実験の結果,提案手法は従来のCLICデータセットの手法と学習に基づく手法と比較して,人間の知覚的判断との整合性が高いことがわかった。
論文 参考訳(メタデータ) (2022-05-09T13:31:27Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Metric Learning for Anti-Compression Facial Forgery Detection [32.33501564446107]
新規な抗圧縮顔面フォージェリー検出フレームワークを提案する。
オリジナル版と圧縮版の両方を使って、圧縮に敏感な埋め込み機能空間を学習する。
論文 参考訳(メタデータ) (2021-03-15T14:11:14Z) - Early Exit or Not: Resource-Efficient Blind Quality Enhancement for
Compressed Images [54.40852143927333]
ロスシー画像圧縮は、通信帯域を節約するために広範に行われ、望ましくない圧縮アーティファクトをもたらす。
圧縮画像に対する資源効率の高いブラインド品質向上手法(RBQE)を提案する。
提案手法は, 評価された画像の品質に応じて, 自動的にエンハンスメントを終了するか, 継続するかを決定することができる。
論文 参考訳(メタデータ) (2020-06-30T07:38:47Z) - What's in the Image? Explorable Decoding of Compressed Images [45.22726784749359]
ユビキタスJPEG標準のための新しいデコーダアーキテクチャを開発し、圧縮された画像の集合をトラバースする。
我々は、グラフィカル、医学的、法医学的なユースケースに関する我々のフレームワークを例示し、その幅広い潜在的な応用を実証する。
論文 参考訳(メタデータ) (2020-06-16T17:15:44Z) - Saliency Driven Perceptual Image Compression [6.201592931432016]
画像圧縮技術の性能評価にはMS-SSIMやPSNRなどの評価指標が不十分であることを示す。
画像圧縮に特有な知覚的類似性データに基づいて学習する新しい指標を提案する。
このモデルは視覚的に優れた画像を生成するだけでなく、その後のコンピュータビジョンタスクに優れた性能を与える。
論文 参考訳(メタデータ) (2020-02-12T13:43:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。