論文の概要: How far have we gone in Generative Image Restoration? A study on its capability, limitations and evaluation practices
- arxiv url: http://arxiv.org/abs/2603.05010v1
- Date: Thu, 05 Mar 2026 09:57:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:11.177178
- Title: How far have we gone in Generative Image Restoration? A study on its capability, limitations and evaluation practices
- Title(参考訳): 生成的イメージ復元はどこまで進んだか?その能力、限界、評価実践に関する研究
- Authors: Xiang Yin, Jinfan Hu, Zhiyuan You, Kainan Yan, Yu Tang, Chao Dong, Jinjin Gu,
- Abstract要約: 生成的画像復元(GIR)は印象的な知覚的リアリズムを達成したが、その実用能力はこれまでの方法と比べてどこまで進歩しているのだろうか?
本稿では,モデルの詳細,シャープさ,意味的正確性,全体的な品質を評価できる多次元評価パイプラインを提案する。
- 参考スコア(独自算出の注目度): 31.845000971936923
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative Image Restoration (GIR) has achieved impressive perceptual realism, but how far have its practical capabilities truly advanced compared with previous methods? To answer this, we present a large-scale study grounded in a new multi-dimensional evaluation pipeline that assesses models on detail, sharpness, semantic correctness, and overall quality. Our analysis covers diverse architectures, including diffusion-based, GAN-based, PSNR-oriented, and general-purpose generation models, revealing critical performance disparities. Furthermore, our analysis uncovers a key evolution in failure modes that signifies a paradigm shift for the perception-oriented low-level vision field. The central challenge is evolving from the previous problem of detail scarcity (under-generation) to the new frontier of detail quality and semantic control (preventing over-generation). We also leverage our benchmark to train a new IQA model that better aligns with human perceptual judgments. Ultimately, this work provides a systematic study of modern generative image restoration models, offering crucial insights that redefine our understanding of their true state and chart a course for future development.
- Abstract(参考訳): 生成的画像復元(GIR)は印象的な知覚的リアリズムを達成したが、その実用能力はこれまでの方法と比べてどこまで進歩しているのだろうか?
そこで本研究では,モデルの詳細,シャープさ,意味的正確性,全体的な品質を評価できる多次元評価パイプラインを提案する。
本分析では,拡散ベース,GANベース,PSNR指向,汎用生成モデルなど多種多様なアーキテクチャを網羅し,重要な性能格差を明らかにした。
さらに,本研究では,認識指向低レベル視野のパラダイムシフトを示す障害モードの重要な進化を明らかにした。
中心的な課題は、詳細不足(世代内)の以前の問題から、詳細品質と意味制御(過剰な世代を避ける)の新たなフロンティアへと進化している。
また、我々のベンチマークを利用して、人間の知覚的判断に合わせた新しいIQAモデルをトレーニングします。
最終的に、この研究は、現代の画像復元モデルの体系的な研究を提供し、彼らの真の状態に対する理解を再定義し、将来の発展のためのコースをチャート化するための重要な洞察を提供する。
関連論文リスト
- Understanding Degradation with Vision Language Model [56.09241449206817]
視覚的劣化を理解することは、コンピュータビジョンにおいて重要な問題であるが、難しい問題である。
本稿では,教師付き微調整と強化学習を併用したマルチモーダル・チェーン・オブ・ソート・モデルであるDU-VLMを紹介する。
また,110,000個のクリーン劣化ペアと接地された物理アノテーションからなる大規模データセットである textbfDU-110k も導入した。
論文 参考訳(メタデータ) (2026-02-04T13:51:15Z) - Implicit Neural Representation-Based Continuous Single Image Super Resolution: An Empirical Study [50.15623093332659]
入射神経表現(INR)は任意のスケール画像超解像(ASSR)の標準的アプローチとなっている
既存の手法を多様な設定で比較し、複数の画像品質指標に対して集計結果を示す。
トレーニング中, エッジ, テクスチャ, 細部を保存しながら, 強度変化をペナライズする新たな損失関数について検討した。
論文 参考訳(メタデータ) (2026-01-25T07:09:20Z) - Understand Before You Generate: Self-Guided Training for Autoregressive Image Generation [110.03631978640298]
本稿では,視覚領域に次世代の予測パラダイムを適用するメカニズムについて,初めて体系的に検討する。
高レベルの視覚的意味論の学習を妨げる3つの重要な特性を同定する。
これらの課題は、訓練中に自己指導的目的を導入することで効果的に対処できることが示される。
論文 参考訳(メタデータ) (2025-09-18T17:47:40Z) - A Survey on All-in-One Image Restoration: Taxonomy, Evaluation and Future Trends [67.43992456058541]
画像復元(IR)は、ノイズ、ぼかし、圧縮、悪天候など幅広い要因によって生じる劣化した観察から高品質な画像の復元を目指している。
従来のIR法は、個々の劣化タイプを対象とすることで顕著な進歩を遂げてきたが、それらの特殊化は、しばしば一般化のコストがかかる。
オールインワンのイメージ復元パラダイムが最近登場し、複数の劣化タイプに順応的に対処する統一されたフレームワークを提供している。
論文 参考訳(メタデータ) (2024-10-19T11:11:09Z) - Assessing Open-world Forgetting in Generative Image Model Customization [18.246389150176665]
我々は、意図しない変更の広大な範囲を特徴付けるために、オープンワールドの忘れという概念を導入する。
モデル適応であっても,新たに導入された概念をはるかに超越した領域において,意味的ドリフトが著しく影響されることが示唆された。
本稿では,新しい概念を取り入れつつ,本来の能力を効果的に維持する機能正規化戦略を提案する。
論文 参考訳(メタデータ) (2024-10-18T03:58:29Z) - Advancing Brain Imaging Analysis Step-by-step via Progressive Self-paced Learning [0.5840945370755134]
適応型・進行型ペーシング・蒸留機構を応用したPSPD(Progressive Self-Paced Distillation)フレームワークを提案する。
我々は、アルツハイマー病神経画像イニシアチブ(ADNI)データセットを用いて、様々な畳み込みニューラルネットワークにおけるPSPDの有効性と適応性を検証する。
論文 参考訳(メタデータ) (2024-07-23T02:26:04Z) - Diffusion Models for Image Restoration and Enhancement: A Comprehensive Survey [73.86861112002593]
本稿では,近年の拡散モデルに基づく画像復元手法について概観する。
我々は、赤外線とブラインド/現実世界の両方で拡散モデルを用いて、革新的なデザインを分類し、強調する。
本稿では,拡散モデルに基づくIRの今後の研究に向けた5つの可能性と課題を提案する。
論文 参考訳(メタデータ) (2023-08-18T08:40:38Z) - Image Quality Assessment in the Modern Age [53.19271326110551]
本チュートリアルは、画像品質評価(IQA)の基礎的理論、方法論、現状の進歩を聴衆に提供する。
まず,視覚刺激を適切に選択する方法に着目し,主観的品質評価手法を再考する。
手書きのエンジニアリングと(深い)学習ベースの手法の両方をカバーします。
論文 参考訳(メタデータ) (2021-10-19T02:38:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。