論文の概要: DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator
- arxiv url: http://arxiv.org/abs/2211.04927v2
- Date: Fri, 24 Nov 2023 12:59:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-28 04:53:33.560460
- Title: DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator
- Title(参考訳): DeepDC:画像品質評価装置としての深部距離相関
- Authors: Hanwei Zhu, Baoliang Chen, Lingyu Zhu, Shiqi Wang, and Weisi Lin
- Abstract要約: ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
- 参考スコア(独自算出の注目度): 53.57431705309919
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: ImageNet pre-trained deep neural networks (DNNs) show notable transferability
for building effective image quality assessment (IQA) models. Such a remarkable
byproduct has often been identified as an emergent property in previous
studies. In this work, we attribute such capability to the intrinsic
texture-sensitive characteristic that classifies images using texture features.
We fully exploit this characteristic to develop a novel full-reference IQA
(FR-IQA) model based exclusively on pre-trained DNN features. Specifically, we
compute the distance correlation, a highly promising yet relatively
under-investigated statistic, between reference and distorted images in the
deep feature domain. In addition, the distance correlation quantifies both
linear and nonlinear feature relationships, which is far beyond the widely used
first-order and second-order statistics in the feature space. We conduct
comprehensive experiments to demonstrate the superiority of the proposed
quality model on five standard IQA datasets, one perceptual similarity dataset,
two texture similarity datasets, and one geometric transformation dataset.
Moreover, we optimize the proposed model to generate a broad spectrum of
texture patterns, by treating the model as the style loss function for neural
style transfer (NST). Extensive experiments demonstrate that the proposed
texture synthesis and NST methods achieve the best quantitative and qualitative
results. We release our code at https://github.com/h4nwei/DeepDC.
- Abstract(参考訳): ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
このような顕著な副産物は、しばしば以前の研究において創発的性質として認識されている。
本研究では,テクスチャ特徴を用いた画像の分類を行う本質的なテクスチャ感特性を特徴とする。
この特徴をフル活用して、事前学習したDNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発する。
具体的には, 深部特徴領域における参照画像と歪画像間の距離相関を, 比較的有望な統計量として計算する。
さらに、距離相関は線形特徴関係と非線形特徴関係の両方を定量化し、これは特徴空間で広く使われる一階および二階統計をはるかに超える。
5つの標準IQAデータセット,1つの知覚的類似性データセット,2つのテクスチャ類似性データセット,および1つの幾何学的変換データセットにおいて,提案した品質モデルの優位性を示す包括的な実験を行った。
さらに,ニューラル・スタイル・トランスファー(nst)のスタイル損失関数として扱うことにより,提案モデルを最適化し,テクスチャ・パターンのスペクトルを広範に生成する。
大規模な実験により, 提案したテクスチャ合成法とNST法が, 最良の定量および定性的結果をもたらすことが示された。
コードをhttps://github.com/h4nwei/DeepDCでリリースしています。
関連論文リスト
- Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - CONVIQT: Contrastive Video Quality Estimator [63.749184706461826]
知覚ビデオ品質評価(VQA)は、多くのストリーミングおよびビデオ共有プラットフォームにおいて不可欠な要素である。
本稿では,視覚的に関連のある映像品質表現を自己指導的に学習する問題について考察する。
本研究は, 自己教師型学習を用いて, 知覚力による説得力のある表現が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T15:22:01Z) - Attentions Help CNNs See Better: Attention-based Hybrid Image Quality
Assessment Network [20.835800149919145]
画像品質評価(IQA)アルゴリズムは、画像品質に対する人間の認識を定量化することを目的としている。
GAN(Generative Adversarial Network)によって生成された歪み画像を、一見現実的なテクスチャで評価する際の性能低下がある。
本稿では,AHIQ(Hybrid Image Quality Assessment Network)を提案する。
論文 参考訳(メタデータ) (2022-04-22T03:59:18Z) - Dynamically-Scaled Deep Canonical Correlation Analysis [77.34726150561087]
カノニカル相関解析 (CCA) は, 2つのビューの特徴抽出手法である。
本稿では,入力依存の正準相関モデルをトレーニングするための新しい動的スケーリング手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T12:52:49Z) - Generalized Rectifier Wavelet Covariance Models For Texture Synthesis [2.585403833659771]
畳み込みニューラルネットワーク(CNN)で定義された画像表現に依存する統計からテクスチャ合成のための最先端の最大エントロピーモデルを構築する。
我々は,非線形ウェーブレットに基づく表現に基づく統計学のファミリを提案し,これを一般化された非線形性を用いて一層CNNの特定の例と見なすことができる。
これらの統計は、従来のウェーブレットベースのモデルの視覚的品質を大幅に改善し、グレースケールとカラーテクスチャの両方で、最先端のモデルと類似した品質の合成を作成できる。
論文 参考訳(メタデータ) (2022-03-14T17:07:40Z) - Probabilistic Tracking with Deep Factors [8.030212474745879]
因子グラフに基づく確率的追跡フレームワークにおける特徴量に対する生成密度と組み合わせたディープ・フィーチャー・エンコーディングの使い方を示す。
本稿では,学習した特徴エンコーダと生成密度を組み合わせる可能性モデルを提案する。
論文 参考訳(メタデータ) (2021-12-02T21:31:51Z) - Learning Transformer Features for Image Quality Assessment [53.51379676690971]
本稿では,CNNバックボーンとトランスフォーマーエンコーダを用いて特徴抽出を行うIQAフレームワークを提案する。
提案するフレームワークはFRモードとNRモードの両方と互換性があり、共同トレーニング方式が可能である。
論文 参考訳(メタデータ) (2021-12-01T13:23:00Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Consumer Image Quality Prediction using Recurrent Neural Networks for
Spatial Pooling [13.750624267664156]
本稿では、リカレントニューラルネットワーク(RNN)を用いて、人間の視覚系(HVS)の注意機構を模倣する画像品質モデルを提案する。
最近発表された2つの画像品質データセットの解像度の異なる画像を用いて行った実験により、提案手法の品質予測精度は、最先端技術を表すベンチマークモデルと競合することを示した。
論文 参考訳(メタデータ) (2021-06-02T03:31:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。