論文の概要: Deep Ensembling for Perceptual Image Quality Assessment
- arxiv url: http://arxiv.org/abs/2305.09141v1
- Date: Tue, 16 May 2023 03:45:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-17 16:23:00.251781
- Title: Deep Ensembling for Perceptual Image Quality Assessment
- Title(参考訳): 知覚画像品質評価のための深部センシング
- Authors: Nisar Ahmed, H. M. Shahzad Asif, Abdul Rauf Bhatti, and Atif Khan
- Abstract要約: 我々は2つのCNNアーキテクチャをサブユニットとして含むディープアーキテクチャを設計した。
自然歪みを有する12,000枚の画像を用いた自己収集画像データベースBIQ2021を提案する。
合成歪みを伴う1875万の画像からなる大規模なデータベースを用いて、モデルを事前トレーニングし、評価のためにベンチマークデータベースで再トレーニングする。
- 参考スコア(独自算出の注目度): 0.9424650988057943
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Blind image quality assessment is a challenging task particularly due to the
unavailability of reference information. Training a deep neural network
requires a large amount of training data which is not readily available for
image quality. Transfer learning is usually opted to overcome this limitation
and different deep architectures are used for this purpose as they learn
features differently. After extensive experiments, we have designed a deep
architecture containing two CNN architectures as its sub-units. Moreover, a
self-collected image database BIQ2021 is proposed with 12,000 images having
natural distortions. The self-collected database is subjectively scored and is
used for model training and validation. It is demonstrated that synthetic
distortion databases cannot provide generalization beyond the distortion types
used in the database and they are not ideal candidates for general-purpose
image quality assessment. Moreover, a large-scale database of 18.75 million
images with synthetic distortions is used to pretrain the model and then
retrain it on benchmark databases for evaluation. Experiments are conducted on
six benchmark databases three of which are synthetic distortion databases
(LIVE, CSIQ and TID2013) and three are natural distortion databases (LIVE
Challenge Database, CID2013 and KonIQ-10 k). The proposed approach has provided
a Pearson correlation coefficient of 0.8992, 0.8472 and 0.9452 subsequently and
Spearman correlation coefficient of 0.8863, 0.8408 and 0.9421. Moreover, the
performance is demonstrated using perceptually weighted rank correlation to
indicate the perceptual superiority of the proposed approach. Multiple
experiments are conducted to validate the generalization performance of the
proposed model by training on different subsets of the databases and validating
on the test subset of BIQ2021 database.
- Abstract(参考訳): ブラインド画像の品質評価は,特に参照情報の有効性の欠如による課題である。
ディープニューラルネットワークのトレーニングには、画像の品質のために簡単には利用できない大量のトレーニングデータが必要である。
転送学習は、通常、この制限を克服するために選択され、異なるディープアーキテクチャは、特徴を異なる方法で学習するため、この目的のために使用される。
大規模な実験の後、2つのCNNアーキテクチャをサブユニットとして含むディープアーキテクチャを設計した。
さらに,自然歪みの12,000枚の画像を用いた自己収集画像データベースBIQ2021を提案する。
自己収集データベースは主観的に評価され、モデルのトレーニングと検証に使用される。
合成歪みデータベースは, データベースで使用される歪み型以上の一般化はできず, 汎用画像品質評価の理想的候補ではないことが実証された。
さらに、合成歪みを伴う1875万画像の大規模データベースを用いて、モデルを事前トレーニングし、評価のためにベンチマークデータベースで再トレーニングする。
実験は6つのベンチマークデータベース上で行われ、3つは合成歪みデータベース(LIVE, CSIQ, TID2013)、3つは自然歪みデータベース(LIVE Challenge Database, CID2013, KonIQ-10k)である。
提案手法は, パーソン相関係数0.8992, 0.8472, 0.9452, そしてスピアマン相関係数0.8863, 0.8408, 0.9421を与える。
さらに,提案手法の知覚的優越性を示すために,知覚重み付きランク相関を用いて性能を示す。
BIQ2021データベースの各種サブセットをトレーニングし,BIQ2021データベースのテストサブセットを検証することにより,提案モデルの一般化性能を検証するために,複数の実験を行った。
関連論文リスト
- Opinion-Unaware Blind Image Quality Assessment using Multi-Scale Deep Feature Statistics [54.08757792080732]
我々は,事前学習された視覚モデルからの深い特徴を統計的解析モデルと統合して,意見認識のないBIQA(OU-BIQA)を実現することを提案する。
提案モデルは,最先端のBIQAモデルと比較して,人間の視覚的知覚との整合性に優れる。
論文 参考訳(メタデータ) (2024-05-29T06:09:34Z) - AIGIQA-20K: A Large Database for AI-Generated Image Quality Assessment [54.93996119324928]
AIGIQA-20Kとして知られる2万のAIGIと420,000の主観評価を備えた、これまでで最大のAIGI主観的品質データベースを作成します。
このデータベース上でベンチマーク実験を行い、16の主流AIGI品質モデルと人間の知覚との対応性を評価する。
論文 参考訳(メタデータ) (2024-04-04T12:12:24Z) - AIGCIQA2023: A Large-scale Image Quality Assessment Database for AI
Generated Images: from the Perspectives of Quality, Authenticity and
Correspondence [42.85549933048976]
100プロンプトを用いて6つの最先端テキスト画像生成モデルに基づいて2000以上の画像を生成する。
これらの画像に基づいて、各画像に対する人間の視覚的嗜好を3つの視点から評価する主観的な実験を行った。
構築したデータベース上で,いくつかの最先端IQAメトリクスの性能を評価するためのベンチマーク実験を行った。
論文 参考訳(メタデータ) (2023-07-01T03:30:31Z) - A ResNet is All You Need? Modeling A Strong Baseline for Detecting
Referable Diabetic Retinopathy in Fundus Images [0.0]
我々は、シンプルな標準のResNet-18アーキテクチャに基づいて、このタスクの強力なベースラインをモデル化する。
我々のモデルは、異なる公開データセットから得られた61007個のテスト画像の組み合わせで、AUC = 0.955を達成した。
論文 参考訳(メタデータ) (2022-10-06T19:40:56Z) - CONVIQT: Contrastive Video Quality Estimator [63.749184706461826]
知覚ビデオ品質評価(VQA)は、多くのストリーミングおよびビデオ共有プラットフォームにおいて不可欠な要素である。
本稿では,視覚的に関連のある映像品質表現を自己指導的に学習する問題について考察する。
本研究は, 自己教師型学習を用いて, 知覚力による説得力のある表現が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T15:22:01Z) - Conformer and Blind Noisy Students for Improved Image Quality Assessment [80.57006406834466]
知覚品質評価(IQA)のための学習ベースアプローチは、通常、知覚品質を正確に測定するために歪んだ画像と参照画像の両方を必要とする。
本研究では,変換器を用いた全参照IQAモデルの性能について検討する。
また,全教師モデルから盲人学生モデルへの半教師付き知識蒸留に基づくIQAの手法を提案する。
論文 参考訳(メタデータ) (2022-04-27T10:21:08Z) - BIQ2021: A Large-Scale Blind Image Quality Assessment Database [1.3670071336891754]
本稿ではBlind Image Quality Assessment Database, BIQ2021を紹介する。
データセットは、画像品質評価に使用する意図のないもの、意図的に導入した自然な歪みで撮影したもの、オープンソースの画像共有プラットフォームから撮影したもの、の3つのセットで構成されている。
データベースは、主観的スコアリング、人体統計、および各画像の標準偏差に関する情報を含む。
論文 参考訳(メタデータ) (2022-02-08T14:07:38Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Comprehensive evaluation of no-reference image quality assessment
algorithms on KADID-10k database [0.0]
目的画像品質評価アルゴリズムの評価は, 公開されているベンチマークデータベースを用いて行った実験に基づいている。
平均PLCC, SROCC, KROCCを100回以上の無作為列車試験分割で測定した。
この結果は, 最先端の非参照画像品質評価手法の現状について, 明確な理解を得る上で有用である。
論文 参考訳(メタデータ) (2020-10-19T12:23:06Z) - Uncertainty-Aware Blind Image Quality Assessment in the Laboratory and
Wild [98.48284827503409]
我々は,テキスト化BIQAモデルを開発し,それを合成的および現実的歪みの両方で訓練するアプローチを提案する。
我々は、多数の画像ペアに対してBIQAのためのディープニューラルネットワークを最適化するために、忠実度損失を用いる。
6つのIQAデータベースの実験は、実験室と野生動物における画像品質を盲目的に評価する学習手法の可能性を示唆している。
論文 参考訳(メタデータ) (2020-05-28T13:35:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。