Fugu-MT 論文翻訳(概要): Pixel-by-pixel Mean Opinion Score (pMOS) for No-Reference Image Quality Assessment

論文の概要: Pixel-by-pixel Mean Opinion Score (pMOS) for No-Reference Image Quality Assessment

arxiv url: http://arxiv.org/abs/2206.06541v1
Date: Tue, 14 Jun 2022 01:24:25 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-15 15:31:08.934210
Title: Pixel-by-pixel Mean Opinion Score (pMOS) for No-Reference Image Quality Assessment
Title（参考訳）: 非参照画像品質評価のための画素単位平均オピニオンスコア(pMOS)
Authors: Wook-Hyung Kim, Cheul-hee Hahm, Anant Baijal, Namuk Kim, Ilhyun Cho and Jayoon Koo
Abstract要約: 本稿では,画像レベルのMOSに加えて,画素レベルの平均オピニオンスコア(MOS)を測定するIQAアルゴリズムを提案する。提案アルゴリズムは,各画素のMOSを表すpMOS,領域の相対的重要性を示すROIからの重み,画像レベルのMOSの3つの出力を出力する。
参考スコア（独自算出の注目度）: 0.8824332494301738
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep-learning based techniques have contributed to the remarkable progress in the field of automatic image quality assessment (IQA). Existing IQA methods are designed to measure the quality of an image in terms of Mean Opinion Score (MOS) at the image-level (i.e. the whole image) or at the patch-level (dividing the image into multiple units and measuring quality of each patch). Some applications may require assessing the quality at the pixel-level (i.e. MOS value for each pixel), however, this is not possible in case of existing techniques as the spatial information is lost owing to their network structures. This paper proposes an IQA algorithm that can measure the MOS at the pixel-level, in addition to the image-level MOS. The proposed algorithm consists of three core parts, namely: i) Local IQA; ii) Region of Interest (ROI) prediction; iii) High-level feature embedding. The Local IQA part outputs the MOS at the pixel-level, or pixel-by-pixel MOS - we term it 'pMOS'. The ROI prediction part outputs weights that characterize the relative importance of region when calculating the image-level IQA. The high-level feature embedding part extracts high-level image features which are then embedded into the Local IQA part. In other words, the proposed algorithm yields three outputs: the pMOS which represents MOS for each pixel, the weights from the ROI indicating the relative importance of region, and finally the image-level MOS that is obtained by the weighted sum of pMOS and ROI values. The image-level MOS thus obtained by utilizing pMOS and ROI weights shows superior performance compared to the existing popular IQA techniques. In addition, visualization results indicate that predicted pMOS and ROI outputs are reasonably aligned with the general principles of the human visual system (HVS).
Abstract（参考訳）: ディープラーニングに基づく手法は、自動画像品質評価(IQA)分野における顕著な進歩に寄与している。既存のIQA法は、画像レベル(画像全体)またはパッチレベル(イメージを複数のユニットに分割し、各パッチの品質を測定する)における平均オピニオンスコア(MOS)の観点から、画像の品質を測定するように設計されている。一部のアプリケーションはピクセルレベルでの品質(すなわち各ピクセルのMOS値)を評価する必要があるが、既存の技術ではネットワーク構造のために空間情報が失われているため、これは不可能である。本稿では,画像レベルのMOSに加えて,画素レベルのMOSを測定するIQAアルゴリズムを提案する。提案アルゴリズムは,3つのコア部分から構成される。 i) 現地のica 二利子(ROI)の予測領域 iii) ハイレベルな特徴埋め込み。 Local IQA 部はピクセルレベルで MOS を出力し、ピクセル単位の MOS を 'pMOS' と呼ぶ。 ROI予測部は、画像レベルIQAを算出する際に、領域の相対的重要性を特徴付ける重みを出力する。高レベル特徴埋め込み部は、次にローカルIQA部に埋め込まれた高レベル画像特徴を抽出する。言い換えると、提案アルゴリズムは、各画素のMOSを表すpMOS、領域の相対的重要性を示すROIからの重み、最後に、pMOSとROIの重み付け和によって得られる画像レベルMOSの3つの出力を生成する。 pMOSおよびROI重みを利用して得られた画像レベルのMOSは、既存のIQA技術と比較して優れた性能を示す。さらに、予測されたpmosとroi出力は、ヒト視覚システム(hvs)の一般原則と合理的に一致していることを示している。

関連論文リスト

Towards Explainable Partial-AIGC Image Quality Assessment [51.42831861127991]
AI生成画像(AGI)に対する画像品質評価(IQA)に関する広範な研究にもかかわらず、ほとんどの研究は完全なAI生成出力に焦点を当てている。我々は、説明可能な部分AIGC画像品質評価(EPAIQA)を目的とした、最初の大規模PAIデータセットを構築した。我々の研究は、総合的なPAI品質評価のためのIQA分野における先駆的な取り組みである。
論文参考訳（メタデータ） (2025-04-12T17:27:50Z)
M3-AGIQA: Multimodal, Multi-Round, Multi-Aspect AI-Generated Image Quality Assessment [65.3860007085689]
M3-AGIQAは、AGIの品質評価のための包括的なフレームワークである。中間画像記述を生成する構造付きマルチラウンド評価機構を含む。複数のベンチマークデータセットで実施された実験は、M3-AGIQAが最先端のパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (2025-02-21T03:05:45Z)
Exploring Rich Subjective Quality Information for Image Quality Assessment in the Wild [66.40314964321557]
我々は,リッチIQAという新しいIQA手法を提案し,MOSを超えるリッチな主観的評価情報を探索し,野生における画像品質を予測する。コンボリューショナル・ビジョン・トランスフォーマー(CvT)の強力な特徴表現能力を活用し、人間の脳の短期記憶機構と長期記憶機構を模倣する3段階画像品質予測ネットワークである。 RichIQAは、リッチな主観的評価ラベルを持つ複数の大規模IQAデータベースにおいて、最先端の競合より優れている。
論文参考訳（メタデータ） (2024-09-09T12:00:17Z)
ESIQA: Perceptual Quality Assessment of Vision-Pro-based Egocentric Spatial Images [70.68629648595677]
エゴセントリックな画像やビデオは、立体視のXRコンテンツの魅力的な形態として現れつつある。自我中心空間画像に対する画像品質評価(IQA)研究はいまだに欠落している。本稿では,エゴセントリック空間画像品質評価データベース (ESQAD) を構築し,エゴセントリック空間画像を対象とした最初のIQAデータベースである。
論文参考訳（メタデータ） (2024-07-31T06:20:21Z)
Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。 PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-06-06T17:59:10Z)
Reference-Free Image Quality Metric for Degradation and Reconstruction Artifacts [2.5282283486446753]
品質要因予測器(QF)と呼ばれる基準のない品質評価ネットワークを開発する。我々のQF予測器は7層からなる軽量で完全な畳み込みネットワークである。 JPEG圧縮画像パッチを入力としてランダムQFを受信し、対応するQFを正確に予測するように訓練する。
論文参考訳（メタデータ） (2024-05-01T22:28:18Z)
Perceptual Constancy Constrained Single Opinion Score Calibration for Image Quality Assessment [2.290956583394892]
画像の平均世論スコア(MOS)を1つの世論スコア(SOS)から推定する高効率な手法を提案する。実験の結果,提案手法は偏りのあるSOSの校正に有効であり,SOSのみが利用できる場合のIQAモデル学習を大幅に改善することがわかった。
論文参考訳（メタデータ） (2024-04-30T14:42:55Z)
Large Multi-modality Model Assisted AI-Generated Image Quality Assessment [53.182136445844904]
本稿では,AI生成画像品質評価モデル(MA-AGIQA)を提案する。セマンティックインフォームドガイダンスを使用して意味情報を感知し、慎重に設計されたテキストプロンプトを通してセマンティックベクターを抽出する。最先端のパフォーマンスを実現し、AI生成画像の品質を評価する上で優れた一般化能力を示す。
論文参考訳（メタデータ） (2024-04-27T02:40:36Z)
AIGCOIQA2024: Perceptual Quality Assessment of AI Generated Omnidirectional Images [70.42666704072964]
我々はAI生成の全方位画像IQAデータベースAIIGCOIQA2024を構築した。 3つの視点から人間の視覚的嗜好を評価するために、主観的IQA実験を行った。我々は,データベース上での最先端IQAモデルの性能を評価するためのベンチマーク実験を行った。
論文参考訳（メタデータ） (2024-04-01T10:08:23Z)
Confusing Image Quality Assessment: Towards Better Augmented Reality Experience [96.29124666702566]
我々はAR技術を仮想シーンと実シーンの重ね合わせとみなし、視覚的混乱を基本的な理論として紹介する。 ConFusing Image Quality Assessment (CFIQA)データベースが構築され、600個の参照画像と300個の歪画像とをペアに混合して生成する。また、難解な画像品質をよりよく評価するために、CFIQAと呼ばれる客観的な計量も提案されている。
論文参考訳（メタデータ） (2022-04-11T07:03:06Z)
Pixel Distillation: A New Knowledge Distillation Scheme for Low-Resolution Image Recognition [124.80263629921498]
アーキテクチャ制約を同時に破りながら知識蒸留を入力レベルまで拡張するPixel Distillationを提案する。このようなスキームは、ネットワークアーキテクチャと画像品質の両方をリソースの全体的な要求に応じて調整できるため、展開のための柔軟なコスト制御を実現することができる。
論文参考訳（メタデータ） (2021-12-17T14:31:40Z)
Pixel-Level Face Image Quality Assessment for Explainable Face Recognition [5.858033242850427]
認識のための顔画像における画素の有効性を決定する画素レベルの顔画像品質の概念を導入する。本研究では,任意の顔認識ネットワークが与えられた場合,顔画像の画素レベルの品質を評価するためのトレーニング不要なアプローチを提案する。
論文参考訳（メタデータ） (2021-10-21T09:12:17Z)
A Shift-insensitive Full Reference Image Quality Assessment Model Based on Quadratic Sum of Gradient Magnitude and LOG signals [7.0736273644584715]
本研究では,GMとLOG信号の2次和を用いたFR-IQAモデルを提案する。実験の結果,提案モデルは3つの大規模主観的IQAデータベース上で堅牢に動作することがわかった。
論文参考訳（メタデータ） (2020-12-21T17:41:07Z)
Multi-pooled Inception features for no-reference image quality assessment [0.0]
畳み込みニューラルネットワーク(CNN)を用いた画像品質評価の新しい手法を提案する。従来の手法とは対照的に、入力画像からパッチを取らない。代わりに、入力画像は全体として処理され、事前訓練されたCNN本体を通して実行され、解像度に依存しない多段階の深い特徴を抽出する。我々は、MultiGAP-NRIQAと呼ばれるベストな提案が、3つのベンチマークIQAデータベースに対して最先端の結果を提供することができることを実証した。
論文参考訳（メタデータ） (2020-11-10T15:09:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。