論文の概要: Perceptual Quality Optimization of Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2602.21482v1
- Date: Wed, 25 Feb 2026 01:17:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.665833
- Title: Perceptual Quality Optimization of Image Super-Resolution
- Title(参考訳): 画像超解像の知覚的品質最適化
- Authors: Wei Zhou, Yixiao Li, Hadi Amirpour, Xiaoshuai Hao, Jiang Liu, Peng Wang, Hantao Liu,
- Abstract要約: シングルイメージ超解像(SR)は深層学習において顕著な進歩を遂げているが、ほとんどのアプローチは歪み指向の損失や知覚的先行に頼っている。
そこで本稿では,SRを人間の嗜好的品質に明示的に最適化する,テキスト有効知覚双方向注意ネットワーク(Efficient Perceptual Bi-directional Attention Network, EPBAN)を提案する。
- 参考スコア(独自算出の注目度): 31.948003749760105
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-image super-resolution (SR) has achieved remarkable progress with deep learning, yet most approaches rely on distortion-oriented losses or heuristic perceptual priors, which often lead to a trade-off between fidelity and visual quality. To address this issue, we propose an \textit{Efficient Perceptual Bi-directional Attention Network (Efficient-PBAN)} that explicitly optimizes SR towards human-preferred quality. Unlike patch-based quality models, Efficient-PBAN avoids extensive patch sampling and enables efficient image-level perception. The proposed framework is trained on our self-constructed SR quality dataset that covers a wide range of state-of-the-art SR methods with corresponding human opinion scores. Using this dataset, Efficient-PBAN learns to predict perceptual quality in a way that correlates strongly with subjective judgments. The learned metric is further integrated into SR training as a differentiable perceptual loss, enabling closed-loop alignment between reconstruction and perceptual assessment. Extensive experiments demonstrate that our approach delivers superior perceptual quality. Code is publicly available at https://github.com/Lighting-YXLI/Efficient-PBAN.
- Abstract(参考訳): シングルイメージ・スーパーレゾリューション(SR)は深層学習において顕著な進歩を遂げているが、ほとんどのアプローチは歪み指向の損失やヒューリスティックな知覚の先行に頼っており、しばしば忠実さと視覚的品質のトレードオフにつながる。
この問題に対処するために,SR を人間の好む品質に明示的に最適化する <textit{Efficient Perceptual Bi-directional Attention Network (Efficient-PBAN) を提案する。
パッチベースの品質モデルとは異なり、Efficient-PBANは広範なパッチサンプリングを避け、効率的な画像レベルの認識を可能にする。
提案するフレームワークは,我々の自己構築型SR品質データセットに基づいて,ヒトの意見スコアを用いた多種多様な最先端SR手法を訓練する。
このデータセットを用いて、効率の良いPBANは、主観的判断と強く相関する方法で知覚品質を予測することを学ぶ。
学習指標はSRトレーニングにさらに統合され、知覚的損失を識別可能とし、再建と知覚的評価の間の閉ループアライメントを可能にする。
大規模な実験により、我々のアプローチは知覚品質に優れた結果をもたらすことが示された。
コードはhttps://github.com/Lighting-YXLI/Efficient-PBANで公開されている。
関連論文リスト
- Implicit Neural Representation-Based Continuous Single Image Super Resolution: An Empirical Study [50.15623093332659]
入射神経表現(INR)は任意のスケール画像超解像(ASSR)の標準的アプローチとなっている
既存の手法を多様な設定で比較し、複数の画像品質指標に対して集計結果を示す。
トレーニング中, エッジ, テクスチャ, 細部を保存しながら, 強度変化をペナライズする新たな損失関数について検討した。
論文 参考訳(メタデータ) (2026-01-25T07:09:20Z) - Perception-oriented Bidirectional Attention Network for Image Super-resolution Quality Assessment [61.27648290203618]
画像SR FR-IQAのための知覚指向双方向注意ネットワーク(PBAN)を提案する。
PBANは、イメージエンコーダモジュール、知覚指向双方向アテンション(PBA)モジュール、品質予測モジュールの3つのモジュールで構成されている。
提案するPBANは,最先端の品質評価方法より優れている。
論文 参考訳(メタデータ) (2025-09-08T08:39:45Z) - Leveraging Vision-Language Models to Select Trustworthy Super-Resolution Samples Generated by Diffusion Models [0.026861992804651083]
本稿では拡散生成集合から最も信頼できるSRサンプルを特定するための堅牢なフレームワークを提案する。
本稿では,意味的類似性に基づいてSR信頼性を定量化するハイブリッド尺度TWSを提案する。
アウトプットを人間の期待と意味的正しさに合わせることで、この研究は生成的SRにおける信頼性の新たなベンチマークを定めている。
論文 参考訳(メタデータ) (2025-06-25T21:00:44Z) - One-Step Diffusion-based Real-World Image Super-Resolution with Visual Perception Distillation [53.24542646616045]
画像超解像(SR)生成に特化して設計された新しい視覚知覚拡散蒸留フレームワークであるVPD-SRを提案する。
VPD-SRは2つのコンポーネントから構成される: 明示的セマンティック・アウェア・スーパービジョン(ESS)と高周波知覚(HFP)損失。
提案したVPD-SRは,従来の最先端手法と教師モデルの両方と比較して,たった1ステップのサンプリングで優れた性能が得られる。
論文 参考訳(メタデータ) (2025-06-03T08:28:13Z) - Augmenting Perceptual Super-Resolution via Image Quality Predictors [10.586351810396645]
超解像 (SR) は本質的に不備であり、全ての入力に対して可解解の分布を誘導する。
本研究では、SRコンテキストにおける強力な非参照画像品質評価(NR-IQA)モデルを活用する方法を検討する。
本研究は,非知覚的画素方向の歪みに焦点をあてるよりも,知覚的忠実度と人為的NR-IQA測定とのバランスを改善することを目的とした,より人間中心の知覚歪みのトレードオフを示すものである。
論文 参考訳(メタデータ) (2025-04-25T17:47:38Z) - Learning from Multi-Perception Features for Real-Word Image
Super-resolution [87.71135803794519]
入力画像の複数の知覚的特徴を利用する新しいSR手法MPF-Netを提案する。
本稿では,MPFEモジュールを組み込んで,多様な知覚情報を抽出する手法を提案する。
また、モデルの学習能力を向上する対照的な正規化項(CR)も導入する。
論文 参考訳(メタデータ) (2023-05-26T07:35:49Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Textural-Structural Joint Learning for No-Reference Super-Resolution
Image Quality Assessment [59.91741119995321]
我々は、TSNetと呼ばれる品質予測のためのテキスト情報と構造情報を共同で探索するデュアルストリームネットワークを開発した。
画像の重要な領域に注意を払っている人間の視覚システム(HVS)を模倣することにより、視覚に敏感な領域をより区別しやすくするための空間的注意機構を開発する。
実験の結果,提案したTSNetは現状のIQA法よりも視覚的品質を正確に予測し,人間の視点との整合性を示した。
論文 参考訳(メタデータ) (2022-05-27T09:20:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。