論文の概要: DR.Experts: Differential Refinement of Distortion-Aware Experts for Blind Image Quality Assessment
- arxiv url: http://arxiv.org/abs/2602.09531v1
- Date: Tue, 10 Feb 2026 08:41:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-11 20:17:43.455062
- Title: DR.Experts: Differential Refinement of Distortion-Aware Experts for Blind Image Quality Assessment
- Title(参考訳): DR.Experts:Blind Image Quality Assessmentのための歪み認識エキスパートの識別的リファインメント
- Authors: Bohan Fu, Guanyi Qin, Fazhan Zhang, Zihao Huang, Mingxuan Li, Runze Hu,
- Abstract要約: 我々は、歪み事前を明示的に組み込むように設計された、新しい事前駆動型BIQAフレームワークであるDR.Expertsを紹介する。
DR.Expertsは、劣化認識型視覚言語モデルを利用して歪み特異的な先行情報を取得することから始まる。
洗練された事前表現とセマンティクスとブリッジ表現は、提案されたミックス・オブ・エキスパート・スタイルのモジュールによって融合される。
このメカニズムは、それぞれの歪み特有の特徴を知覚的影響に従って重み付け、最終的な品質予測が人間の知覚と一致することを保証する。
- 参考スコア(独自算出の注目度): 9.682871853344226
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Blind Image Quality Assessment, aiming to replicate human perception of visual quality without reference, plays a key role in vision tasks, yet existing models often fail to effectively capture subtle distortion cues, leading to a misalignment with human subjective judgments. We identify that the root cause of this limitation lies in the lack of reliable distortion priors, as methods typically learn shallow relationships between unified image features and quality scores, resulting in their insensitive nature to distortions and thus limiting their performance. To address this, we introduce DR.Experts, a novel prior-driven BIQA framework designed to explicitly incorporate distortion priors, enabling a reliable quality assessment. DR.Experts begins by leveraging a degradation-aware vision-language model to obtain distortion-specific priors, which are further refined and enhanced by the proposed Distortion-Saliency Differential Module through distinguishing them from semantic attentions, thereby ensuring the genuine representations of distortions. The refined priors, along with semantics and bridging representation, are then fused by a proposed mixture-of-experts style module named the Dynamic Distortion Weighting Module. This mechanism weights each distortion-specific feature as per its perceptual impact, ensuring that the final quality prediction aligns with human perception. Extensive experiments conducted on five challenging BIQA benchmarks demonstrate the superiority of DR.Experts over current methods and showcase its excellence in terms of generalization and data efficiency.
- Abstract(参考訳): 視覚的品質の人間の知覚を参照なしで再現することを目的としたブラインド画像品質評価は、視覚タスクにおいて重要な役割を果たすが、既存のモデルは、しばしば微妙な歪みの手がかりを効果的に捉えることができず、人間の主観的判断と不一致をもたらす。
この制限の根本原因は、一般に画像の特徴と品質スコアの浅い関係を学習し、結果として歪みに敏感になり、性能が制限されるため、信頼性の高い歪み事前の欠如にある。
DR.Expertsは,歪み事前を明示的に組み込むことにより,信頼性の高い品質評価を可能にする,新しい事前駆動型BIQAフレームワークである。
DR.Expertsは、劣化認識型視覚言語モデルを活用して、歪みの真の表現を保証することから始まる。
洗練された事前処理とセマンティクスとブリッジ表現は、Dynamic Distortion Weighting Module(動的歪み重み付けモジュール)と呼ばれる仕様のミックス・オブ・エキスパート・スタイルのモジュールによって融合される。
このメカニズムは、それぞれの歪み特有の特徴を知覚的影響に従って重み付け、最終的な品質予測が人間の知覚と一致することを保証する。
5つの挑戦的BIQAベンチマークで実施された大規模な実験は、DR.Expertsが現在の方法よりも優れていることを示し、一般化とデータ効率の点でその卓越していることを示す。
関連論文リスト
- Q-Hawkeye: Reliable Visual Policy Optimization for Image Quality Assessment [25.916354359994624]
本稿では,RLに基づく信頼性の高い視覚ポリシー最適化フレームワークであるQ-Hawkeyeを提案する。
Q-Hawkeyeは、複数のロールアウトにまたがる予測スコアのばらつきを用いて予測の不確実性を推定する。
本稿では,実際の視覚的証拠に品質判断を根拠として,モデルに制約を与えるインプシット知覚損失を導入する。
論文 参考訳(メタデータ) (2026-01-30T12:42:32Z) - Noise Consistency Regularization for Improved Subject-Driven Image Synthesis [55.75426086791612]
微調整安定拡散は、モデルを適用して特定の対象を含む画像を生成することによって、被写体駆動画像合成を可能にする。
既存の微調整手法は、モデルが確実に被写体を捕捉できない不適合と、被写体イメージを記憶し、背景の多様性を減少させる過適合の2つの主要な問題に悩まされる。
拡散微調整のための2つの補助的整合性損失を提案する。第1に、事前(非対象)画像に対する予測拡散雑音が事前訓練されたモデルと一致し、忠実度が向上する。
論文 参考訳(メタデータ) (2025-06-06T19:17:37Z) - From Images to Point Clouds: An Efficient Solution for Cross-media Blind Quality Assessment without Annotated Training [35.45364402708792]
アノテーションを使用せずに新たなシーンから点雲の知覚的品質を予測できる新しい品質評価手法を提案する。
メディアの種類に関わらず,人間の視覚システム(HVS)を品質評価の意思決定者と認識することで,ニューラルネットワークによる人間の知覚評価基準をエミュレートすることができる。
本稿では,既存/推定歪み分布を逆DAフレームワークに統合する歪み誘導型特徴アライメントを提案する。
論文 参考訳(メタデータ) (2025-01-23T05:15:10Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - ExIQA: Explainable Image Quality Assessment Using Distortion Attributes [0.3683202928838613]
本稿では属性学習に基づく歪み同定のための説明可能なアプローチを提案する。
効率的なトレーニングのために,10万の画像からなるデータセットを生成する。
提案手法はPLCCとSRCCの両方で複数のデータセットにまたがるSOTA(State-of-the-art)性能を実現する。
論文 参考訳(メタデータ) (2024-09-10T20:28:14Z) - DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild [73.6767681305851]
野生のブラインド画像品質評価(IQA)は重大な課題を呈している。
大規模なトレーニングデータの収集が困難であることを考えると、厳密な一般化モデルを開発するために限られたデータを活用することは、未解決の問題である。
事前訓練されたテキスト・ツー・イメージ(T2I)拡散モデルの堅牢な画像認識能力により,新しいIQA法,拡散先行に基づくIQAを提案する。
論文 参考訳(メタデータ) (2024-05-30T12:32:35Z) - Bridging the Synthetic-to-Authentic Gap: Distortion-Guided Unsupervised Domain Adaptation for Blind Image Quality Assessment [46.64517740627379]
合成データのトレーニングは有用であることが期待されているが、合成訓練されたモデルはドメインギャップのため、実際のドメインでの一般化に苦しむことが多い。
本研究では,合成データセットにより多くの歪み型を導入することは,画像品質評価の一般化に悪影響を及ぼさないか,あるいは有害である可能性があることを重要視する。
本稿では、歪みからの事前知識を介して適応的な多領域選択を利用する新しいフレームワークであるBIQA(DGQA)の歪み誘導型非教師付きドメイン適応を提案する。
論文 参考訳(メタデータ) (2024-05-07T10:07:33Z) - High Perceptual Quality Image Denoising with a Posterior Sampling CGAN [31.42883613312055]
条件付き生成逆数ネットワーク(CGAN)を用いた画像認識の新しい手法を提案する。
私たちの目標は、許容できる歪みで高い知覚品質を達成することです。
提案手法は, 改質消音目標を達成し, 不動騒音レベルで鮮やかで多様な結果を生み出す, 斬新な消音アーキテクチャで紹介する。
論文 参考訳(メタデータ) (2021-03-06T20:18:45Z) - A Deep Ordinal Distortion Estimation Approach for Distortion Rectification [62.72089758481803]
より高精度なパラメータを効率良く得る新しい歪み補正手法を提案する。
本研究では, 局所言語関連推定ネットワークを設計し, 順序歪みを学習し, 現実的な歪み分布を近似する。
歪み情報の冗長性を考慮すると,本手法では歪み画像の一部のみを用いて順序方向の歪み推定を行う。
論文 参考訳(メタデータ) (2020-07-21T10:03:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。