論文の概要: MDIQA: Unified Image Quality Assessment for Multi-dimensional Evaluation and Restoration
- arxiv url: http://arxiv.org/abs/2508.16887v1
- Date: Sat, 23 Aug 2025 03:17:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.237519
- Title: MDIQA: Unified Image Quality Assessment for Multi-dimensional Evaluation and Restoration
- Title(参考訳): MDIQA:多次元評価と復元のための統一画像品質評価
- Authors: Shunyu Yao, Ming Liu, Zhilu Zhang, Zhaolin Wan, Zhilong Ji, Jinfeng Bai, Wangmeng Zuo,
- Abstract要約: 本稿では,多次元画像品質評価(MDIQA)フレームワークを提案する。
我々は,5つの技術次元と4つの審美次元を含む,様々な知覚次元にわたる画像品質をモデル化する。
MDIQAモデルの準備が整うと、画像復元(IR)モデルの柔軟なトレーニングのためにデプロイできる。
- 参考スコア(独自算出の注目度): 76.94293572477379
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advancements in image quality assessment (IQA), driven by sophisticated deep neural network designs, have significantly improved the ability to approach human perceptions. However, most existing methods are obsessed with fitting the overall score, neglecting the fact that humans typically evaluate image quality from different dimensions before arriving at an overall quality assessment. To overcome this problem, we propose a multi-dimensional image quality assessment (MDIQA) framework. Specifically, we model image quality across various perceptual dimensions, including five technical and four aesthetic dimensions, to capture the multifaceted nature of human visual perception within distinct branches. Each branch of our MDIQA is initially trained under the guidance of a separate dimension, and the respective features are then amalgamated to generate the final IQA score. Additionally, when the MDIQA model is ready, we can deploy it for a flexible training of image restoration (IR) models, enabling the restoration results to better align with varying user preferences through the adjustment of perceptual dimension weights. Extensive experiments demonstrate that our MDIQA achieves superior performance and can be effectively and flexibly applied to image restoration tasks. The code is available: https://github.com/YaoShunyu19/MDIQA.
- Abstract(参考訳): 最近の画像品質評価(IQA)は、高度なディープニューラルネットワーク設計によって、人間の知覚にアプローチする能力を大幅に改善した。
しかしながら、既存のほとんどの手法は全体的なスコアの適合に執着しており、人間が通常、全体的な品質評価に到達する前に異なる次元から画像品質を評価するという事実を無視している。
この問題を解決するために,多次元画像品質評価(MDIQA)フレームワークを提案する。
具体的には、5つの技術次元と4つの美的次元を含む様々な知覚次元にわたる画像品質をモデル化し、異なる枝内の人間の視覚知覚の多面的な性質を捉える。
MDIQAの各ブランチは、最初は別次元の指導の下で訓練され、それぞれの特徴はアマルガム化され、最終的なIQAスコアが生成される。
さらに,MDIQAモデルの準備が整うと,画像復元モデル(IR)モデルのフレキシブルなトレーニングにデプロイし,知覚次元の重みの調整により,復元結果が様々なユーザの好みに適合するようにすることができる。
MDIQAは優れた性能を示し,画像復元作業に効果的かつ柔軟に適用できることを示した。
コードはhttps://github.com/YaoShunyu19/MDIQA.comで入手できる。
関連論文リスト
- Scene Perceived Image Perceptual Score (SPIPS): combining global and local perception for image quality assessment [0.0]
深層学習と人間の知覚のギャップを埋める新しいIQA手法を提案する。
我々のモデルは、深い特徴を高レベルの意味情報と低レベルの知覚の詳細に分解し、それぞれのストリームを別々に扱う。
このハイブリッド設計により、グローバルコンテキストと複雑な画像の詳細の両方を評価し、人間の視覚過程をより良く反映することができる。
論文 参考訳(メタデータ) (2025-04-24T04:06:07Z) - Sliced Maximal Information Coefficient: A Training-Free Approach for Image Quality Assessment Enhancement [12.628718661568048]
我々は,人間の品質評価の過程を模倣する,一般化された視覚的注意度推定戦略を検討することを目的とする。
特に、劣化画像と参照画像の統計的依存性を測定することによって、人間の注意生成をモデル化する。
既存のIQAモデルのアテンションモジュールを組み込んだ場合、既存のIQAモデルの性能を一貫して改善できることを示す実験結果が得られた。
論文 参考訳(メタデータ) (2024-08-19T11:55:32Z) - DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild [73.6767681305851]
野生のブラインド画像品質評価(IQA)は重大な課題を呈している。
大規模なトレーニングデータの収集が困難であることを考えると、厳密な一般化モデルを開発するために限られたデータを活用することは、未解決の問題である。
事前訓練されたテキスト・ツー・イメージ(T2I)拡散モデルの堅牢な画像認識能力により,新しいIQA法,拡散先行に基づくIQAを提案する。
論文 参考訳(メタデータ) (2024-05-30T12:32:35Z) - Opinion-Unaware Blind Image Quality Assessment using Multi-Scale Deep Feature Statistics [54.08757792080732]
我々は,事前学習された視覚モデルからの深い特徴を統計的解析モデルと統合して,意見認識のないBIQA(OU-BIQA)を実現することを提案する。
提案モデルは,最先端のBIQAモデルと比較して,人間の視覚的知覚との整合性に優れる。
論文 参考訳(メタデータ) (2024-05-29T06:09:34Z) - Image Quality Assessment With Compressed Sampling [5.76395285614395]
圧縮サンプリングを用いたNR-IQA(CL-IQAとCS-IQA)の2つのネットワークを提案する。
1)イメージをサンプリングする圧縮サンプリングモジュール(CSM) (2)高レベルの特徴を抽出する適応埋め込みモジュール(AEM)。
実験により,提案手法は,データ使用量が少ない様々なデータセットにおいて,他の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-04-26T05:51:57Z) - Blind Multimodal Quality Assessment: A Brief Survey and A Case Study of
Low-light Images [73.27643795557778]
ブラインド画像品質評価(BIQA)は、視覚信号の客観的スコアを自動的に正確に予測することを目的としている。
この分野での最近の発展は、ヒトの主観的評価パターンと矛盾しない一助的解によって支配されている。
主観的評価から客観的スコアへの低照度画像の一意なブラインドマルチモーダル品質評価(BMQA)を提案する。
論文 参考訳(メタデータ) (2023-03-18T09:04:55Z) - MUSIQ: Multi-scale Image Quality Transformer [22.908901641767688]
現在のIQA法は畳み込みニューラルネットワーク(CNN)に基づいている
マルチスケール画像品質変換器(MUSIQ)を設計し,サイズやアスペクト比の異なるネイティブ解像度画像を処理する。
提案手法は,マルチスケールの画像表現により,様々な粒度で画像品質を捉えることができる。
論文 参考訳(メタデータ) (2021-08-12T23:36:22Z) - Deep Multi-Scale Features Learning for Distorted Image Quality
Assessment [20.7146855562825]
既存のディープニューラルネットワーク(DNN)はIQA問題に対処する上で大きな効果を示している。
画像品質予測のための階層的マルチスケール特徴を持つDNNを構築するためにピラミッド特徴学習を提案する。
提案するネットワークは、エンド・ツー・エンドの監視方法に最適化されている。
論文 参考訳(メタデータ) (2020-12-01T23:39:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。