論文の概要: Content-Distortion High-Order Interaction for Blind Image Quality Assessment
- arxiv url: http://arxiv.org/abs/2504.05076v1
- Date: Mon, 07 Apr 2025 13:44:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-08 14:11:02.525020
- Title: Content-Distortion High-Order Interaction for Blind Image Quality Assessment
- Title(参考訳): ブラインド画像品質評価のためのコンテンツ歪み高次インタラクション
- Authors: Shuai Liu, Qingyu Mao, Chao Li, Jiacong Chen, Fanyang Meng, Yonghong Tian, Yongsheng Liang,
- Abstract要約: 内容と歪みは、画像の視覚的品質に影響を与える2つの主要な要因として広く認識されている。
既存のNo-Reference Image Quality Assessment (NR-IQA) 法では、コンテンツと歪みの間の複雑な相互作用を捉えることができない。
我々は,階層的相互作用フレームワーク内で局所歪みとグローバルなコンテンツ特徴を集約する,CoDI-IQAと呼ばれる堅牢なNR-IQAアプローチを提案する。
- 参考スコア(独自算出の注目度): 30.320196879451036
- License:
- Abstract: The content and distortion are widely recognized as the two primary factors affecting the visual quality of an image. While existing No-Reference Image Quality Assessment (NR-IQA) methods have modeled these factors, they fail to capture the complex interactions between content and distortions. This shortfall impairs their ability to accurately perceive quality. To confront this, we analyze the key properties required for interaction modeling and propose a robust NR-IQA approach termed CoDI-IQA (Content-Distortion high-order Interaction for NR-IQA), which aggregates local distortion and global content features within a hierarchical interaction framework. Specifically, a Progressive Perception Interaction Module (PPIM) is proposed to explicitly simulate how content and distortions independently and jointly influence image quality. By integrating internal interaction, coarse interaction, and fine interaction, it achieves high-order interaction modeling that allows the model to properly represent the underlying interaction patterns. To ensure sufficient interaction, multiple PPIMs are employed to hierarchically fuse multi-level content and distortion features at different granularities. We also tailor a training strategy suited for CoDI-IQA to maintain interaction stability. Extensive experiments demonstrate that the proposed method notably outperforms the state-of-the-art methods in terms of prediction accuracy, data efficiency, and generalization ability.
- Abstract(参考訳): 内容と歪みは、画像の視覚的品質に影響を与える2つの主要な要因として広く認識されている。
既存のNo-Reference Image Quality Assessment (NR-IQA) 法はこれらの因子をモデル化しているが、内容と歪みの間の複雑な相互作用を捉えられなかった。
この不足は、品質を正確に知覚する能力を損なう。
そこで我々は,インタラクションモデリングに必要な重要な特性を分析し,階層的なインタラクションフレームワーク内で局所歪みやグローバルコンテンツの特徴を集約する,CoDI-IQA(Content-Distortion High-order Interaction for NR-IQA)と呼ばれる堅牢なNR-IQAアプローチを提案する。
具体的には,プログレッシブ・パーセプション・インタラクション・モジュール (PPIM) を提案する。
内部相互作用、粗い相互作用、きめ細かい相互作用を統合することで、モデルが基礎となる相互作用パターンを適切に表現できる高次相互作用モデリングを実現する。
適切な相互作用を確保するため、複数のPPIMを用いて階層的に多レベルコンテンツと歪み特性を異なる粒度で融合する。
また、相互作用安定性を維持するため、CoDI-IQAに適したトレーニング戦略を調整します。
大規模な実験により,提案手法は予測精度,データ効率,一般化能力において最先端の手法よりも優れていた。
関連論文リスト
- Image Quality Assessment: Investigating Causal Perceptual Effects with Abductive Counterfactual Inference [22.65765161695905]
既存のフルリファレンス画像品質評価法(FR-IQA)は、画像歪みに対する人間の知覚応答を弱める複雑な因果メカニズムを捉えるのに失敗することが多い。
本稿では,深いネットワーク特徴と知覚歪みの因果関係を明らかにするために,帰納的反事実推論に基づくFR-IQA法を提案する。
論文 参考訳(メタデータ) (2024-12-22T09:17:57Z) - Scale Contrastive Learning with Selective Attentions for Blind Image Quality Assessment [15.235786583920062]
ブラインド画像品質評価(BIQA)はコンピュータビジョンの基本課題であるが、人間の主観的知覚と一貫して一致しないことが多い。
近年の進歩は、人間の視覚の階層構造を再現できるため、マルチスケール評価戦略が有望であることを示している。
本稿では,異なるスケールにわたる情報の顕著な冗長性と,これらのスケールの特徴を組み合わせることで生じる混乱という,2つの主要な課題に対処する。
論文 参考訳(メタデータ) (2024-11-13T20:17:30Z) - Multi-Modal Prompt Learning on Blind Image Quality Assessment [65.0676908930946]
画像品質評価(IQA)モデルは意味情報から大きな恩恵を受け、異なる種類のオブジェクトを明瞭に扱うことができる。
十分な注釈付きデータが不足している従来の手法では、セマンティックな認識を得るために、CLIPイメージテキスト事前学習モデルをバックボーンとして使用していた。
近年のアプローチでは、このミスマッチに即時技術を使って対処する試みがあるが、これらの解決策には欠点がある。
本稿では、IQAのための革新的なマルチモーダルプロンプトベースの手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:45:32Z) - Pairwise Comparisons Are All You Need [22.798716660911833]
ブラインド画像品質評価(BIQA)アプローチは、様々な画像に一様に適用される一般的な品質基準に依存しているため、現実のシナリオでは不足することが多い。
本稿では、従来のBIQAの制限を回避すべく設計されたペアワイズ比較フレームワークであるPICNIQを紹介する。
PICNIQは、サイコメトリックスケーリングアルゴリズムを用いることで、対比較をジャストオブジェクタブルディファレンス(JOD)の品質スコアに変換し、画像品質の粒度と解釈可能な指標を提供する。
論文 参考訳(メタデータ) (2024-03-13T23:43:36Z) - HiCD: Change Detection in Quality-Varied Images via Hierarchical
Correlation Distillation [40.03785896317387]
知識蒸留を基礎とした革新的な教育戦略を導入する。
中心となるアイデアは、高品質なイメージペアから取得したタスク知識を活用して、モデルの学習をガイドすることにある。
我々は階層的相関蒸留法(自己相関、相互相関、大域相関を含む)を開発する。
論文 参考訳(メタデータ) (2024-01-19T15:21:51Z) - Adaptive Feature Selection for No-Reference Image Quality Assessment by Mitigating Semantic Noise Sensitivity [55.399230250413986]
上流タスクから有害なセマンティックノイズを除去するためのQFM-IQM(Quality-Aware Feature Matching IQA Metric)を提案する。
提案手法は,8つの標準IQAデータセット上での最先端NR-IQA法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2023-12-11T06:50:27Z) - Learning Transformer Features for Image Quality Assessment [53.51379676690971]
本稿では,CNNバックボーンとトランスフォーマーエンコーダを用いて特徴抽出を行うIQAフレームワークを提案する。
提案するフレームワークはFRモードとNRモードの両方と互換性があり、共同トレーニング方式が可能である。
論文 参考訳(メタデータ) (2021-12-01T13:23:00Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - No-Reference Image Quality Assessment via Transformers, Relative
Ranking, and Self-Consistency [38.88541492121366]
No-Reference Image Quality Assessment (NR-IQA) の目的は、主観的評価に応じて知覚的画質を推定することである。
本稿では、変圧器における畳み込みニューラルネットワーク(CNN)と自己保持機構の利点を生かしたハイブリッドアプローチを利用して、NR-IQAタスクに対処する新しいモデルを提案する。
論文 参考訳(メタデータ) (2021-08-16T02:07:08Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。