論文の概要: SwinIQA: Learned Swin Distance for Compressed Image Quality Assessment
- arxiv url: http://arxiv.org/abs/2205.04264v1
- Date: Mon, 9 May 2022 13:31:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-10 17:53:05.869511
- Title: SwinIQA: Learned Swin Distance for Compressed Image Quality Assessment
- Title(参考訳): SwinIQA:圧縮画像品質評価のためのスウィン距離学習
- Authors: Jianzhao Liu, Xin Li, Yanding Peng, Tao Yu, Zhibo Chen
- Abstract要約: 我々は,スウィン距離空間における圧縮画像の知覚的品質を測定するために,フル参照画像品質評価尺度SwinIQAを設計する。
実験の結果,提案手法は従来のCLICデータセットの手法と学習に基づく手法と比較して,人間の知覚的判断との整合性が高いことがわかった。
- 参考スコア(独自算出の注目度): 23.87848736166893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image compression has raised widespread interest recently due to its
significant importance for multimedia storage and transmission. Meanwhile, a
reliable image quality assessment (IQA) for compressed images can not only help
to verify the performance of various compression algorithms but also help to
guide the compression optimization in turn. In this paper, we design a
full-reference image quality assessment metric SwinIQA to measure the
perceptual quality of compressed images in a learned Swin distance space. It is
known that the compression artifacts are usually non-uniformly distributed with
diverse distortion types and degrees. To warp the compressed images into the
shared representation space while maintaining the complex distortion
information, we extract the hierarchical feature representations from each
stage of the Swin Transformer. Besides, we utilize cross attention operation to
map the extracted feature representations into a learned Swin distance space.
Experimental results show that the proposed metric achieves higher consistency
with human's perceptual judgment compared with both traditional methods and
learning-based methods on CLIC datasets.
- Abstract(参考訳): 画像圧縮は最近、マルチメディアストレージと伝送において重要な重要性のために広く関心を集めている。
一方、圧縮画像に対する信頼性画像品質評価(IQA)は、様々な圧縮アルゴリズムの性能を検証するだけでなく、圧縮最適化の導出にも役立てることができる。
本論文では,スウィン距離空間における圧縮画像の知覚的品質を測定するために,フル参照画像品質評価尺度SwinIQAを設計する。
圧縮アーティファクトは、通常、様々な歪みタイプと度合いで一様ではないことが知られている。
複雑な歪み情報を維持しながら圧縮された画像を共有表現空間にワープするために,スウィン変換器の各段から階層的特徴表現を抽出する。
また,抽出した特徴表現をスウィン距離空間にマップするためにクロスアテンション操作を利用する。
実験の結果,提案手法は従来のCLICデータセットの手法と学習に基づく手法と比較して,人間の知覚的判断との整合性が高いことがわかった。
関連論文リスト
- Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - Machine Perception-Driven Image Compression: A Layered Generative
Approach [32.23554195427311]
階層型生成画像圧縮モデルを提案する。
タスクに依存しない学習に基づく圧縮モデルを提案し、様々な圧縮されたドメインベースの分析タスクを効果的にサポートする。
圧縮比、再構成画像品質、下流知覚性能の最良のバランス点を得るために、共同最適化スケジュールを採用する。
論文 参考訳(メタデータ) (2023-04-14T02:12:38Z) - Crowd Counting on Heavily Compressed Images with Curriculum Pre-Training [90.76576712433595]
ディープニューラルネットワークによって処理された画像に損失圧縮を適用することで、大幅な精度低下につながる可能性がある。
カリキュラム学習のパラダイムに着想を得て,圧縮画像の群集カウントのためのカリキュラム事前学習(CPT)と呼ばれる新しいトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-15T08:43:21Z) - Analysis of the Effect of Low-Overhead Lossy Image Compression on the
Performance of Visual Crowd Counting for Smart City Applications [78.55896581882595]
画像圧縮技術は画像の品質を低下させ、精度を低下させる。
本稿では,低オーバヘッド損失画像圧縮法の適用が視覚的群集カウントの精度に与える影響を解析する。
論文 参考訳(メタデータ) (2022-07-20T19:20:03Z) - Perceptual Quality Assessment for Fine-Grained Compressed Images [38.615746092795625]
そこで本研究では,精細レベルの圧縮画像に対するフル参照画像品質評価(FR-IQA)手法を提案する。
提案手法は,FGIQAデータベース上での圧縮画像品質評価(FGIQA)により検証される。
論文 参考訳(メタデータ) (2022-06-08T12:56:45Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Metric Learning for Anti-Compression Facial Forgery Detection [32.33501564446107]
新規な抗圧縮顔面フォージェリー検出フレームワークを提案する。
オリジナル版と圧縮版の両方を使って、圧縮に敏感な埋め込み機能空間を学習する。
論文 参考訳(メタデータ) (2021-03-15T14:11:14Z) - Deep Perceptual Image Quality Assessment for Compression [12.868773445948507]
人間の好みに合わせて、これまでで最大の画像圧縮品質データセットを提案します。
新しいデータセットで利用可能な数千の例から,提案モデルが効果的に学習できることを実証する。
論文 参考訳(メタデータ) (2021-03-01T16:31:10Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。