論文の概要: Pixel-by-pixel Mean Opinion Score (pMOS) for No-Reference Image Quality
Assessment
- arxiv url: http://arxiv.org/abs/2206.06541v1
- Date: Tue, 14 Jun 2022 01:24:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-15 15:31:08.934210
- Title: Pixel-by-pixel Mean Opinion Score (pMOS) for No-Reference Image Quality
Assessment
- Title(参考訳): 非参照画像品質評価のための画素単位平均オピニオンスコア(pMOS)
- Authors: Wook-Hyung Kim, Cheul-hee Hahm, Anant Baijal, Namuk Kim, Ilhyun Cho
and Jayoon Koo
- Abstract要約: 本稿では,画像レベルのMOSに加えて,画素レベルの平均オピニオンスコア(MOS)を測定するIQAアルゴリズムを提案する。
提案アルゴリズムは,各画素のMOSを表すpMOS,領域の相対的重要性を示すROIからの重み,画像レベルのMOSの3つの出力を出力する。
- 参考スコア(独自算出の注目度): 0.8824332494301738
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep-learning based techniques have contributed to the remarkable progress in
the field of automatic image quality assessment (IQA). Existing IQA methods are
designed to measure the quality of an image in terms of Mean Opinion Score
(MOS) at the image-level (i.e. the whole image) or at the patch-level (dividing
the image into multiple units and measuring quality of each patch). Some
applications may require assessing the quality at the pixel-level (i.e. MOS
value for each pixel), however, this is not possible in case of existing
techniques as the spatial information is lost owing to their network
structures. This paper proposes an IQA algorithm that can measure the MOS at
the pixel-level, in addition to the image-level MOS. The proposed algorithm
consists of three core parts, namely: i) Local IQA; ii) Region of Interest
(ROI) prediction; iii) High-level feature embedding. The Local IQA part outputs
the MOS at the pixel-level, or pixel-by-pixel MOS - we term it 'pMOS'. The ROI
prediction part outputs weights that characterize the relative importance of
region when calculating the image-level IQA. The high-level feature embedding
part extracts high-level image features which are then embedded into the Local
IQA part. In other words, the proposed algorithm yields three outputs: the pMOS
which represents MOS for each pixel, the weights from the ROI indicating the
relative importance of region, and finally the image-level MOS that is obtained
by the weighted sum of pMOS and ROI values. The image-level MOS thus obtained
by utilizing pMOS and ROI weights shows superior performance compared to the
existing popular IQA techniques. In addition, visualization results indicate
that predicted pMOS and ROI outputs are reasonably aligned with the general
principles of the human visual system (HVS).
- Abstract(参考訳): ディープラーニングに基づく手法は、自動画像品質評価(IQA)分野における顕著な進歩に寄与している。
既存のIQA法は、画像レベル(画像全体)またはパッチレベル(イメージを複数のユニットに分割し、各パッチの品質を測定する)における平均オピニオンスコア(MOS)の観点から、画像の品質を測定するように設計されている。
一部のアプリケーションはピクセルレベルでの品質(すなわち各ピクセルのMOS値)を評価する必要があるが、既存の技術ではネットワーク構造のために空間情報が失われているため、これは不可能である。
本稿では,画像レベルのMOSに加えて,画素レベルのMOSを測定するIQAアルゴリズムを提案する。
提案アルゴリズムは,3つのコア部分から構成される。
i) 現地のica
二 利子(ROI)の予測領域
iii) ハイレベルな特徴埋め込み。
Local IQA 部はピクセルレベルで MOS を出力し、ピクセル単位の MOS を 'pMOS' と呼ぶ。
ROI予測部は、画像レベルIQAを算出する際に、領域の相対的重要性を特徴付ける重みを出力する。
高レベル特徴埋め込み部は、次にローカルIQA部に埋め込まれた高レベル画像特徴を抽出する。
言い換えると、提案アルゴリズムは、各画素のMOSを表すpMOS、領域の相対的重要性を示すROIからの重み、最後に、pMOSとROIの重み付け和によって得られる画像レベルMOSの3つの出力を生成する。
pMOSおよびROI重みを利用して得られた画像レベルのMOSは、既存のIQA技術と比較して優れた性能を示す。
さらに、予測されたpmosとroi出力は、ヒト視覚システム(hvs)の一般原則と合理的に一致していることを示している。
関連論文リスト
- ADDP: Learning General Representations for Image Recognition and
Generation with Alternating Denoising Diffusion Process [65.61896995046227]
本稿では,2つの空間を1つの表現学習フレームワークに統合した交互デノナイジング拡散プロセス(ADDP)を提案する。
復号化の各ステップでは、まず以前のVQトークンから画素をデコードし、次にデコードされたピクセルから新しいVQトークンを生成する。
学習した表現は、多彩な高忠実度画像の生成や、認識タスクにおける優れた転送性能を示すために使用することができる。
論文 参考訳(メタデータ) (2023-06-08T17:59:32Z) - Assessor360: Multi-sequence Network for Blind Omnidirectional Image
Quality Assessment [50.82681686110528]
Blind Omnidirectional Image Quality Assessment (BOIQA)は、全方位画像(ODI)の人間の知覚品質を客観的に評価することを目的としている。
ODIの品質評価は、既存のBOIQAパイプラインがオブザーバのブラウジングプロセスのモデリングを欠いているという事実によって著しく妨げられている。
Assessor360と呼ばれるBOIQAのための新しいマルチシーケンスネットワークを提案する。
論文 参考訳(メタデータ) (2023-05-18T13:55:28Z) - Investigating Content-Aware Neural Text-To-Speech MOS Prediction Using
Prosodic and Linguistic Features [54.48824266041105]
MOS予測ニューラルモデルに基づく自動合成音声評価の最先端手法について検討した。
MOS予測システムに付加的な入力として韻律的特徴と言語的特徴を含めることを提案する。
すべてのMOS予測システムは、クラウドソースされた自然性MOS評価を備えた、TSSのみのニューラルネットワークであるSOMOSでトレーニングされている。
論文 参考訳(メタデータ) (2022-11-01T09:18:50Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Confusing Image Quality Assessment: Towards Better Augmented Reality
Experience [96.29124666702566]
我々はAR技術を仮想シーンと実シーンの重ね合わせとみなし、視覚的混乱を基本的な理論として紹介する。
ConFusing Image Quality Assessment (CFIQA)データベースが構築され、600個の参照画像と300個の歪画像とをペアに混合して生成する。
また、難解な画像品質をよりよく評価するために、CFIQAと呼ばれる客観的な計量も提案されている。
論文 参考訳(メタデータ) (2022-04-11T07:03:06Z) - Multi-level Second-order Few-shot Learning [111.0648869396828]
教師付きまたは教師なしの少数ショット画像分類と少数ショット動作認識のためのマルチレベル2次数列学習ネットワーク(MlSo)を提案する。
我々は、パワーノーマライズされた二階学習者ストリームと、複数のレベルの視覚的抽象化を表現する機能を組み合わせた、いわゆる2階学習者ストリームを活用している。
我々は,Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, CUB Birds, Stanford Dogs, Cars, HMDB51, UCF101, mini-MITなどのアクション認識データセットなどの標準データセットに対して,優れた結果を示す。
論文 参考訳(メタデータ) (2022-01-15T19:49:00Z) - Pixel-Level Face Image Quality Assessment for Explainable Face
Recognition [5.858033242850427]
認識のための顔画像における画素の有効性を決定する画素レベルの顔画像品質の概念を導入する。
本研究では,任意の顔認識ネットワークが与えられた場合,顔画像の画素レベルの品質を評価するためのトレーニング不要なアプローチを提案する。
論文 参考訳(メタデータ) (2021-10-21T09:12:17Z) - Quantum Face Recognition Protocol with Ghost Imaging [1.4856165761750735]
量子主成分分析(QPCA)に基づくパターン認識のための量子機械学習アルゴリズムを提案する。
また,行列(画像)のトレースと計算の行列式に基づく顔の相似性を求める新しい量子アルゴリズムを提案する。
量子アルゴリズムと量子入力を備えた完全量子パターン認識システムでは、画像の取得と識別が大幅に改善される。
論文 参考訳(メタデータ) (2021-10-19T16:31:46Z) - Deep Superpixel-based Network for Blind Image Quality Assessment [4.079861933099766]
ブラインド画像品質評価(BIQA)モデルの目標は、人間の目で画像を評価する過程をシミュレートすることである。
マルチスケールおよびスーパーピクセルセグメンテーションに基づいて画像の画質を評価するために, DSN-IQA という深層適応型スーパーピクセルベースネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-13T08:26:58Z) - A Shift-insensitive Full Reference Image Quality Assessment Model Based
on Quadratic Sum of Gradient Magnitude and LOG signals [7.0736273644584715]
本研究では,GMとLOG信号の2次和を用いたFR-IQAモデルを提案する。
実験の結果,提案モデルは3つの大規模主観的IQAデータベース上で堅牢に動作することがわかった。
論文 参考訳(メタデータ) (2020-12-21T17:41:07Z) - Multi-pooled Inception features for no-reference image quality
assessment [0.0]
畳み込みニューラルネットワーク(CNN)を用いた画像品質評価の新しい手法を提案する。
従来の手法とは対照的に、入力画像からパッチを取らない。代わりに、入力画像は全体として処理され、事前訓練されたCNN本体を通して実行され、解像度に依存しない多段階の深い特徴を抽出する。
我々は、MultiGAP-NRIQAと呼ばれるベストな提案が、3つのベンチマークIQAデータベースに対して最先端の結果を提供することができることを実証した。
論文 参考訳(メタデータ) (2020-11-10T15:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。