論文の概要: Bidirectional Reward-Guided Diffusion for Real-World Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2602.07069v1
- Date: Thu, 05 Feb 2026 19:21:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.419567
- Title: Bidirectional Reward-Guided Diffusion for Real-World Image Super-Resolution
- Title(参考訳): 実世界の超解像のための双方向リワード誘導拡散
- Authors: Zihao Fan, Xin Lu, Yidi Liu, Jie Huang, Dong Li, Xueyang Fu, Zheng-Jun Zha,
- Abstract要約: 拡散に基づく超解像は、豊富な詳細を合成することができるが、合成ペアデータで訓練されたモデルは、現実世界のLR画像では失敗することが多い。
我々は,超解像を軌道レベルの優先最適化として定式化する報奨誘導拡散フレームワークであるBird-SRを提案する。
実世界のSRベンチマークの実験では、Bird-SRは知覚品質において最先端の手法を一貫して上回っている。
- 参考スコア(独自算出の注目度): 79.35296000454694
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion-based super-resolution can synthesize rich details, but models trained on synthetic paired data often fail on real-world LR images due to distribution shifts. We propose Bird-SR, a bidirectional reward-guided diffusion framework that formulates super-resolution as trajectory-level preference optimization via reward feedback learning (ReFL), jointly leveraging synthetic LR-HR pairs and real-world LR images. For structural fidelity easily affected in ReFL, the model is directly optimized on synthetic pairs at early diffusion steps, which also facilitates structure preservation for real-world inputs under smaller distribution gap in structure levels. For perceptual enhancement, quality-guided rewards are applied at later sampling steps to both synthetic and real LR images. To mitigate reward hacking, the rewards for synthetic results are formulated in a relative advantage space bounded by their clean counterparts, while real-world optimization is regularized via a semantic alignment constraint. Furthermore, to balance structural and perceptual learning, we adopt a dynamic fidelity-perception weighting strategy that emphasizes structure preservation at early stages and progressively shifts focus toward perceptual optimization at later diffusion steps. Extensive experiments on real-world SR benchmarks demonstrate that Bird-SR consistently outperforms state-of-the-art methods in perceptual quality while preserving structural consistency, validating its effectiveness for real-world super-resolution.
- Abstract(参考訳): 拡散に基づく超解像は、豊富な詳細を合成することができるが、合成ペアデータで訓練されたモデルは、分散シフトのために現実世界のLR画像では失敗することが多い。
本稿では,合成LR-HR対と実世界のLR画像の併用により,報酬フィードバック学習(ReFL)による超高分解能レベルの優先最適化を定式化した双方向報酬誘導拡散フレームワークであるBird-SRを提案する。
ReFLで容易に影響を受ける構造的忠実性については、モデルが初期拡散段階の合成対に直接最適化され、構造レベルの分散ギャップが小さい実世界の入力に対する構造保存が容易になる。
知覚的エンハンスメントのために、後続のサンプリングステップにおいて、合成LR画像と実LR画像の両方に品質誘導報酬を適用した。
報酬ハッキングを緩和するために、合成結果に対する報酬は、そのクリーンな操作によって拘束された相対的な優位空間で定式化され、現実の最適化はセマンティックアライメント制約によって正規化される。
さらに, 構造的・知覚的学習のバランスをとるために, 初期構造保存を重視し, 後続の拡散段階における知覚的最適化に着目する動的フィデリティ・知覚重み付け戦略を採用する。
実世界のSRベンチマークに関する大規模な実験により、Bird-SRは構造的整合性を維持しながら知覚的品質の最先端の手法を一貫して上回り、実世界の超解像に対するその有効性を検証している。
関連論文リスト
- Dual-domain Adaptation Networks for Realistic Image Super-resolution [81.34345637776408]
現実画像超解像(SR)は、現実世界の低解像度(LR)画像を高解像度(HR)画像に変換することに焦点を当てている。
現在の手法は、限られた現実世界のLR-HRデータと競合し、基本的な画像特徴の学習に影響を及ぼす。
我々は、シミュレーションされた画像SRモデルを実世界のデータセットに効率よく適応できる新しいアプローチを提案する。
論文 参考訳(メタデータ) (2025-11-21T12:57:23Z) - Mixture of Ranks with Degradation-Aware Routing for One-Step Real-World Image Super-Resolution [76.66229730098759]
実世界の画像超解像(Real-ISR)では、既存のアプローチは主に微調整された事前学習拡散モデルに依存している。
単一ステップ画像超解像のためのMixture-of-Ranks (MoR)アーキテクチャを提案する。
LoRAの各ランクを独立した専門家として扱う、きめ細かい専門家分割戦略を導入する。
論文 参考訳(メタデータ) (2025-11-20T04:11:44Z) - Unsupervised Real-World Super-Resolution via Rectified Flow Degradation Modelling [16.485914675883972]
教師なしの現実世界の超解像(SR)は、複雑な未知の劣化分布のために重要な課題に直面している。
既存の手法では、合成低分解能(LR)と高分解能(HR)画像対から実世界のデータへの一般化に苦慮している。
実世界の劣化を効果的に捉え,モデル化するために,整流に基づく教師なし実世界のSR手法を提案する。
論文 参考訳(メタデータ) (2025-08-10T07:27:28Z) - Unsupervised Image Super-Resolution Reconstruction Based on Real-World Degradation Patterns [4.977925450373957]
超解像再構成モデルのトレーニングのための新しいTripleGANフレームワークを提案する。
このフレームワークは、LR観測から実世界の劣化パターンを学習し、対応する劣化特性を持つデータセットを合成する。
本手法は, 過スムーズなアーティファクトを伴わずに, 鋭い復元を維持しながら, 定量的な測定値に明らかな利点を示す。
論文 参考訳(メタデータ) (2025-06-20T14:24:48Z) - AdaptSR: Low-Rank Adaptation for Efficient and Scalable Real-World Super-Resolution [50.584551250242235]
AdaptSRは、現実世界のタスクにバイキュービックトレーニングされたSRモデルを効率的に再利用する低ランク適応フレームワークである。
実験の結果,AdaptSRはPSNRで最大4dB,実際のSRベンチマークで2%,GAN法と拡散型SR法より優れていた。
論文 参考訳(メタデータ) (2025-03-10T18:03:18Z) - Co-learning Single-Step Diffusion Upsampler and Downsampler with Two Discriminators and Distillation [28.174638880324014]
超解像度(SR)は、高解像度(HR)画像を低解像度(LR)画像から再構成することを目的としている。
単段階拡散に基づくアップサンプラーと学習可能なダウンサンプラーを協調的に最適化するコラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-10T07:12:46Z) - ICF-SRSR: Invertible scale-Conditional Function for Self-Supervised
Real-world Single Image Super-Resolution [60.90817228730133]
単一画像超解像(SISR)は、与えられた低解像度(LR)画像を高解像度(HR)にアップサンプリングすることを目的とした課題である。
近年のアプローチは、単純化されたダウンサンプリング演算子によって劣化したシミュレーションLR画像に基づいて訓練されている。
Invertible Scale-Conditional Function (ICF) を提案する。これは入力画像をスケールし、異なるスケール条件で元の入力を復元する。
論文 参考訳(メタデータ) (2023-07-24T12:42:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。