論文の概要: Evaluating and Preserving High-level Fidelity in Super-Resolution
- arxiv url: http://arxiv.org/abs/2512.07037v2
- Date: Tue, 09 Dec 2025 10:10:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 14:12:23.01143
- Title: Evaluating and Preserving High-level Fidelity in Super-Resolution
- Title(参考訳): 超解像における高次忠実度評価と保存
- Authors: Josep M. Rocafort, Shaolin Su, Alexandra Gomez-Villa, Javier Vazquez-Corral,
- Abstract要約: 超解像モデル(SR)は、細部を再構築し、快適な視覚出力を提供することで印象的な効果を達成している。
しかし、過剰な生成能力は時として幻覚を起こし、画像の内容を変えることがある。
この種のハイレベルな変化は、人間によって容易に識別できるが、既存の低レベルの画像品質指標では十分に研究されていない。
- 参考スコア(独自算出の注目度): 50.65679806442527
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent image Super-Resolution (SR) models are achieving impressive effects in reconstructing details and delivering visually pleasant outputs. However, the overpowering generative ability can sometimes hallucinate and thus change the image content despite gaining high visual quality. This type of high-level change can be easily identified by humans yet not well-studied in existing low-level image quality metrics. In this paper, we establish the importance of measuring high-level fidelity for SR models as a complementary criterion to reveal the reliability of generative SR models. We construct the first annotated dataset with fidelity scores from different SR models, and evaluate how state-of-the-art (SOTA) SR models actually perform in preserving high-level fidelity. Based on the dataset, we then analyze how existing image quality metrics correlate with fidelity measurement, and further show that this high-level task can be better addressed by foundation models. Finally, by fine-tuning SR models based on our fidelity feedback, we show that both semantic fidelity and perceptual quality can be improved, demonstrating the potential value of our proposed criteria, both in model evaluation and optimization. We will release the dataset, code, and models upon acceptance.
- Abstract(参考訳): 最近の画像超解法(SR)モデルは、細部を再構築し、視覚的に快適な出力を提供することで印象的な効果を発揮している。
しかし、過剰な生成能力は、高画質化にもかかわらず、時に幻覚を生じさせ、画像内容を変化させる可能性がある。
この種のハイレベルな変化は、人間によって容易に識別できるが、既存の低レベルの画像品質指標では十分に研究されていない。
本稿では,生成SRモデルの信頼性を明らかにするための補完的基準として,SRモデルの高レベル忠実度を測定することの重要性を確立する。
我々は、異なるSRモデルからの忠実度スコアを付した最初の注釈付きデータセットを構築し、高レベルの忠実度を保存するために、最先端(SOTA)SRモデルがどのように実際に機能するかを評価する。
データセットに基づいて、既存の画像品質指標が忠実度測定とどのように相関しているかを分析し、さらに、このハイレベルなタスクが基礎モデルによってよりうまく対処できることを示す。
最後に、我々の忠実度フィードバックに基づいてSRモデルを微調整することにより、意味的忠実度と知覚的品質の両方を改善できることを示し、モデル評価と最適化の両方において提案した基準の潜在的価値を示す。
受け入れ次第、データセット、コード、モデルをリリースします。
関連論文リスト
- Q-REAL: Towards Realism and Plausibility Evaluation for AI-Generated Content [71.46991494014382]
本稿では,AI生成画像におけるリアリズムと妥当性の詳細な評価のための新しいデータセットであるQ-Realを紹介する。
Q-Realは、人気のあるテキスト・ツー・イメージ・モデルによって生成される3,088のイメージで構成されている。
そこで本研究では,Q-Real Benchを2つの課題,すなわち判断と推論による根拠付けに基づいて評価する。
論文 参考訳(メタデータ) (2025-11-21T02:43:17Z) - IQPFR: An Image Quality Prior for Blind Face Restoration and Beyond [56.99331967165238]
Blind Face Restoration (BFR)は、劣化した低品質(LQ)の顔画像を高品質(HQ)の出力に再構成する課題に対処する。
本研究では,非参照画像品質評価(NR-IQA)モデルから得られた画像品質優先(IQP)を組み込んだ新しいフレームワークを提案する。
提案手法は,複数のベンチマークにおいて最先端技術より優れている。
論文 参考訳(メタデータ) (2025-03-12T11:39:51Z) - IQA-Adapter: Exploring Knowledge Transfer from Image Quality Assessment to Diffusion-based Generative Models [0.5356944479760104]
画像品質評価(IQA)モデルを拡散型ジェネレータに統合する手法を提案する。
拡散モデルはIQAモデルの出力と内部アクティベーションの両方から複雑な定性的関係を学習できることを示す。
IQA-Adapterは,画像と品質スコアの暗黙的関係を学習することで,目標品質レベルの生成を条件付ける新しいフレームワークである。
論文 参考訳(メタデータ) (2024-12-02T18:40:19Z) - When No-Reference Image Quality Models Meet MAP Estimation in Diffusion Latents [92.45867913876691]
非参照画像品質評価(NR-IQA)モデルは、知覚された画像品質を効果的に定量化することができる。
NR-IQAモデルは、画像強調のための最大後部推定(MAP)フレームワークにプラグイン可能であることを示す。
論文 参考訳(メタデータ) (2024-03-11T03:35:41Z) - Diffusion Model Based Visual Compensation Guidance and Visual Difference Analysis for No-Reference Image Quality Assessment [78.21609845377644]
本稿では, 複雑な関係をモデル化する能力を示す, 最先端(SOTA)生成モデルを提案する。
生成した拡張画像とノイズを含む画像を利用する新しい拡散復元ネットワークを考案する。
2つの視覚評価枝は、得られた高レベル特徴情報を包括的に解析するように設計されている。
論文 参考訳(メタデータ) (2024-02-22T09:39:46Z) - A comparative analysis of SRGAN models [0.0]
実世界の画像のベンチマークデータセットを用いて,SRGAN(Super Resolution Generative Adversarial Network)モデル,ESRGAN,Real-ESRGAN,EDSRの性能評価を行った。
いくつかのモデルは、視覚的品質を維持しながら入力画像の解像度を著しく向上させるように見えるが、これはTesseract OCRエンジンを用いて評価される。
論文 参考訳(メタデータ) (2023-07-18T17:35:45Z) - Towards True Detail Restoration for Super-Resolution: A Benchmark and a
Quality Metric [0.0]
超高解像度(SR)法は、画像と映像の画質を向上し、コンテンツ分析の新しい可能性を生み出す。
しかし、SRの主流は、主に結果の画像の自然性を高めることに焦点を当てている。
論文 参考訳(メタデータ) (2022-03-16T20:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。