論文の概要: HiRQA: Hierarchical Ranking and Quality Alignment for Opinion-Unaware Image Quality Assessment
- arxiv url: http://arxiv.org/abs/2508.15130v1
- Date: Wed, 20 Aug 2025 23:48:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.129674
- Title: HiRQA: Hierarchical Ranking and Quality Alignment for Opinion-Unaware Image Quality Assessment
- Title(参考訳): HiRQA: 画像品質評価のための階層的ランク付けと品質アライメント
- Authors: Vaishnav Ramesh, Haining Wang, Md Jahidul Islam,
- Abstract要約: HiRQAは自己管理型の意見認識フレームワークで、ランキングと対照的な学習の組み合わせによって、階層的で品質を意識した埋め込みを提供する。
リアルタイムデプロイメントでは,画像当たり3.5ミリ秒の推論時間を持つ軽量版である textbfHiRQA-S を導入する。
- 参考スコア(独自算出の注目度): 10.761579471650771
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite significant progress in no-reference image quality assessment (NR-IQA), dataset biases and reliance on subjective labels continue to hinder their generalization performance. We propose HiRQA, Hierarchical Ranking and Quality Alignment), a self-supervised, opinion-unaware framework that offers a hierarchical, quality-aware embedding through a combination of ranking and contrastive learning. Unlike prior approaches that depend on pristine references or auxiliary modalities at inference time, HiRQA predicts quality scores using only the input image. We introduce a novel higher-order ranking loss that supervises quality predictions through relational ordering across distortion pairs, along with an embedding distance loss that enforces consistency between feature distances and perceptual differences. A training-time contrastive alignment loss, guided by structured textual prompts, further enhances the learned representation. Trained only on synthetic distortions, HiRQA generalizes effectively to authentic degradations, as demonstrated through evaluation on various distortions such as lens flare, haze, motion blur, and low-light conditions. For real-time deployment, we introduce \textbf{HiRQA-S}, a lightweight variant with an inference time of only 3.5 ms per image. Extensive experiments across synthetic and authentic benchmarks validate HiRQA's state-of-the-art (SOTA) performance, strong generalization ability, and scalability.
- Abstract(参考訳): 非参照画像品質評価(NR-IQA)の大幅な進歩にもかかわらず、データセットバイアスと主観的ラベルへの依存は、その一般化性能を妨げ続けている。
ランク付けとコントラスト学習を組み合わせることで、階層的で品質に配慮した埋め込みを提供する自己監督型意見認識フレームワークであるHiRQAを提案する。
推論時のプリスタン参照や補助モダリティに依存する従来のアプローチとは異なり、HiRQAは入力画像のみを使用して品質スコアを予測する。
本稿では,歪みペア間の関係順序による品質予測を監督し,特徴距離と知覚的差異の一致を強制する埋め込み距離損失を新たに導入する。
構造化されたテキストプロンプトによって導かれる訓練時間のコントラストアライメント損失は、学習された表現をさらに強化する。
合成歪みのみに基づいて訓練されたHiRQAは、レンズフレア、ヘイズ、動きのぼかし、低照度条件などの様々な歪みの評価を通じて、真の劣化を効果的に一般化する。
リアルタイムデプロイメントには,画像当たり3.5ミリ秒の推論時間を持つ軽量な変種である \textbf{HiRQA-S} を導入する。
HiRQAの最先端(SOTA)性能、強力な一般化能力、スケーラビリティを検証する。
関連論文リスト
- Perceptual Quality Optimization of Image Super-Resolution [31.948003749760105]
シングルイメージ超解像(SR)は深層学習において顕著な進歩を遂げているが、ほとんどのアプローチは歪み指向の損失や知覚的先行に頼っている。
そこで本稿では,SRを人間の嗜好的品質に明示的に最適化する,テキスト有効知覚双方向注意ネットワーク(Efficient Perceptual Bi-directional Attention Network, EPBAN)を提案する。
論文 参考訳(メタデータ) (2026-02-25T01:17:24Z) - Q-Hawkeye: Reliable Visual Policy Optimization for Image Quality Assessment [25.916354359994624]
本稿では,RLに基づく信頼性の高い視覚ポリシー最適化フレームワークであるQ-Hawkeyeを提案する。
Q-Hawkeyeは、複数のロールアウトにまたがる予測スコアのばらつきを用いて予測の不確実性を推定する。
本稿では,実際の視覚的証拠に品質判断を根拠として,モデルに制約を与えるインプシット知覚損失を導入する。
論文 参考訳(メタデータ) (2026-01-30T12:42:32Z) - PreResQ-R1: Towards Fine-Grained Rank-and-Score Reinforcement Learning for Visual Quality Assessment via Preference-Response Disentangled Policy Optimization [12.993619998545633]
PreResQ-R1はPreference-Response Disentangled Reinforcement Learningフレームワークである。
1つの推論駆動最適化スキームにおいて絶対スコア回帰と相対ランク一貫性を統一する。
10 IQA と 5 VQA のベンチマークにおいて、SRCC と PLCC のメトリクスで最先端の結果を得る。
論文 参考訳(メタデータ) (2025-11-07T16:19:50Z) - Continual Action Quality Assessment via Adaptive Manifold-Aligned Graph Regularization [53.82400605816587]
アクション品質アセスメント(AQA)は、ビデオにおける人間の行動を定量化し、スポーツスコアリング、リハビリテーション、スキル評価の応用を支援する。
大きな課題は、現実世界のシナリオにおける品質分布の非定常的な性質にある。
本稿では,進化する分布を扱うための連続学習機能を備えた連続AQA(Continuous AQA)を紹介する。
論文 参考訳(メタデータ) (2025-10-08T10:09:47Z) - Q-Insight: Understanding Image Quality via Visual Reinforcement Learning [27.26829134776367]
画像品質評価(IQA)は、画像の知覚的視覚的品質に焦点を当て、画像再構成、圧縮、生成などの下流タスクにおいて重要な役割を果たす。
グループ相対ポリシー最適化(GRPO)に基づく強化学習に基づくモデルQ-Insightを提案する。
評価結果から,Q-Insightは,評価結果の回帰と劣化知覚の両面において,既存の最先端手法を大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2025-03-28T17:59:54Z) - IQPFR: An Image Quality Prior for Blind Face Restoration and Beyond [56.99331967165238]
Blind Face Restoration (BFR)は、劣化した低品質(LQ)の顔画像を高品質(HQ)の出力に再構成する課題に対処する。
本研究では,非参照画像品質評価(NR-IQA)モデルから得られた画像品質優先(IQP)を組み込んだ新しいフレームワークを提案する。
提案手法は,複数のベンチマークにおいて最先端技術より優れている。
論文 参考訳(メタデータ) (2025-03-12T11:39:51Z) - DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild [73.6767681305851]
野生のブラインド画像品質評価(IQA)は重大な課題を呈している。
大規模なトレーニングデータの収集が困難であることを考えると、厳密な一般化モデルを開発するために限られたデータを活用することは、未解決の問題である。
事前訓練されたテキスト・ツー・イメージ(T2I)拡散モデルの堅牢な画像認識能力により,新しいIQA法,拡散先行に基づくIQAを提案する。
論文 参考訳(メタデータ) (2024-05-30T12:32:35Z) - Multi-Modal Prompt Learning on Blind Image Quality Assessment [65.0676908930946]
画像品質評価(IQA)モデルは意味情報から大きな恩恵を受け、異なる種類のオブジェクトを明瞭に扱うことができる。
十分な注釈付きデータが不足している従来の手法では、セマンティックな認識を得るために、CLIPイメージテキスト事前学習モデルをバックボーンとして使用していた。
近年のアプローチでは、このミスマッチに即時技術を使って対処する試みがあるが、これらの解決策には欠点がある。
本稿では、IQAのための革新的なマルチモーダルプロンプトベースの手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:45:32Z) - Pairwise Comparisons Are All You Need [22.798716660911833]
ブラインド画像品質評価(BIQA)アプローチは、様々な画像に一様に適用される一般的な品質基準に依存しているため、現実のシナリオでは不足することが多い。
本稿では、従来のBIQAの制限を回避すべく設計されたペアワイズ比較フレームワークであるPICNIQを紹介する。
PICNIQは、サイコメトリックスケーリングアルゴリズムを用いることで、対比較をジャストオブジェクタブルディファレンス(JOD)の品質スコアに変換し、画像品質の粒度と解釈可能な指標を提供する。
論文 参考訳(メタデータ) (2024-03-13T23:43:36Z) - Action Quality Assessment with Temporal Parsing Transformer [84.1272079121699]
行動品質評価(AQA)は、作業の理解と解決に重要である。
本稿では,時間的部分表現に包括的特徴を分解する時間的パーシング変換器を提案する。
提案手法は,3つの公開AQAベンチマークにおける先行研究よりもかなりのマージンで優れていた。
論文 参考訳(メタデータ) (2022-07-19T13:29:05Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Learning Conditional Knowledge Distillation for Degraded-Reference Image
Quality Assessment [157.1292674649519]
劣化参照IQA(DR-IQA)という実用的な解を提案する。
DR-IQAはIRモデルの入力、劣化したイメージを参照として利用する。
私たちの結果は、フル参照設定のパフォーマンスに近いものもあります。
論文 参考訳(メタデータ) (2021-08-18T02:35:08Z) - No-Reference Image Quality Assessment by Hallucinating Pristine Features [24.35220427707458]
本稿では,特徴レベルの擬似参照(PR)幻覚を用いた非参照画像品質評価(IQA)手法を提案する。
提案手法の有効性を4つのIQAデータベースで実証した。
論文 参考訳(メタデータ) (2021-08-09T16:48:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。