論文の概要: LucidNFT: LR-Anchored Multi-Reward Preference Optimization for Generative Real-World Super-Resolution
- arxiv url: http://arxiv.org/abs/2603.05947v1
- Date: Fri, 06 Mar 2026 06:30:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:45.184441
- Title: LucidNFT: LR-Anchored Multi-Reward Preference Optimization for Generative Real-World Super-Resolution
- Title(参考訳): LucidNFT: LR-Anchored Multi-Reward Preference Optimization for Generative Real-World Super-Resolution
- Authors: Song Fei, Tian Ye, Sixiang Chen, Zhaohu Xing, Jianyu Lai, Lei Zhu,
- Abstract要約: 優先度に基づく強化学習(RL)は、各LR入力が比較対象のロールアウトグループを生成するため、自然な適合である。
我々は、フローマッチングリアルタイムISRのためのマルチリワードRLフレームワークLucidNFTを提案する。
LucidNFTはフローベースのReal-ISRベースラインを一貫して改善している。
- 参考スコア(独自算出の注目度): 21.290660354883595
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Generative real-world image super-resolution (Real-ISR) can synthesize visually convincing details from severely degraded low-resolution (LR) inputs, yet its stochastic sampling makes a critical failure mode hard to avoid: outputs may look sharp but be unfaithful to the LR evidence (semantic and structural hallucination), while such LR-anchored faithfulness is difficult to assess without HR ground truth. Preference-based reinforcement learning (RL) is a natural fit because each LR input yields a rollout group of candidates to compare. However, effective alignment in Real-ISR is hindered by (i) the lack of a degradation-robust LR-referenced faithfulness signal, and (ii) a rollout-group optimization bottleneck where naive multi-reward scalarization followed by normalization compresses objective-wise contrasts, causing advantage collapse and weakening the reward-weighted updates in DiffusionNFT-style forward fine-tuning. Moreover, (iii) limited coverage of real degradations restricts rollout diversity and preference signal quality. We propose LucidNFT, a multi-reward RL framework for flow-matching Real-ISR. LucidNFT introduces LucidConsistency, a degradation-robust semantic evaluator that makes LR-anchored faithfulness measurable and optimizable; a decoupled advantage normalization strategy that preserves objective-wise contrasts within each LR-conditioned rollout group before fusion, preventing advantage collapse; and LucidLR, a large-scale collection of real-world degraded images to support robust RL fine-tuning. Experiments show that LucidNFT consistently improves strong flow-based Real-ISR baselines, achieving better perceptual-faithfulness trade-offs with stable optimization dynamics across diverse real-world scenarios.
- Abstract(参考訳): 生成現実画像超解像(Real-ISR)は、高度に劣化した低分解能(LR)入力から視覚的に説得力のある詳細を合成することができるが、その確率的サンプリングは、出力はシャープに見えるがLR証拠(意味的および構造的幻覚)には不信である一方、そのようなLRアンコール的忠実さはHRの真実なしに評価することは困難である。
優先度に基づく強化学習(RL)は、各LR入力が比較対象のロールアウトグループを生成するため、自然な適合である。
しかし、Real-ISRの効果的なアライメントは妨げられる
(i)劣化分解性LR関連忠実度信号の欠如、及び
(II)DiffusionNFT-style forward fine-tuningにおいて,主観的マルチリワードスカラー化と正規化を伴うロールアウトグループ最適化のボトルネックが客観的コントラストを圧縮し,アドバンストの崩壊を招き,報奨重み付き更新を弱める。
さらに
三 実際の劣化の限られた範囲は、ロールアウトの多様性及び選好信号の品質を制限する。
我々は、フローマッチングリアルタイムISRのためのマルチリワードRLフレームワークLucidNFTを提案する。
LucidNFT は、LR-anchored faithfulness を測定可能かつ最適化可能な分解ロバストなセマンティック評価器である LucidConsistency を導入し、融合前に各LR条件付きロールアウトグループ内で客観的にコントラストを保ち、有利な崩壊を防止している LucidLR と、堅牢な RL の微調整をサポートするための大規模な劣化イメージのコレクションである LucidLR を導入した。
実験により、LucidNFTはフローベースの強力なReal-ISRベースラインを一貫して改善し、さまざまな現実のシナリオで安定した最適化のダイナミクスで、知覚と信条のトレードオフを改善できることが示されている。
関連論文リスト
- Bidirectional Reward-Guided Diffusion for Real-World Image Super-Resolution [79.35296000454694]
拡散に基づく超解像は、豊富な詳細を合成することができるが、合成ペアデータで訓練されたモデルは、現実世界のLR画像では失敗することが多い。
我々は,超解像を軌道レベルの優先最適化として定式化する報奨誘導拡散フレームワークであるBird-SRを提案する。
実世界のSRベンチマークの実験では、Bird-SRは知覚品質において最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2026-02-05T19:21:45Z) - Robust-R1: Degradation-Aware Reasoning for Robust Visual Understanding [54.05243949024302]
既存の堅牢なMLLMは、視覚エンコーダの一般化にのみ焦点をあてた暗黙のトレーニング/適応に依存している。
本稿では,構造的推論連鎖による視覚的劣化を明示的にモデル化する新しいフレームワークであるRobust-R1を提案する。
提案手法は, (i) 劣化を考慮した推論基盤の微調整, (ii) 劣化パラメータを正確に知覚するための報酬駆動アライメント, (iii) 劣化強度に適応した動的推論深度スケーリングの2つを統合した。
論文 参考訳(メタデータ) (2025-12-19T12:56:17Z) - ControlSR: Taming Diffusion Models for Consistent Real-World Image Super Resolution [68.72454974431749]
我々は、一貫した実世界の画像超解像(Real-ISR)に対して拡散モデルをテーム化する新しい方法であるControlSRを提案する。
提案モデルでは,複数のテストセット上で複数の測定値にまたがる性能が向上し,既存の手法よりもLR画像でより一貫したSR結果が得られる。
論文 参考訳(メタデータ) (2024-10-18T08:35:57Z) - Co-learning Single-Step Diffusion Upsampler and Downsampler with Two Discriminators and Distillation [28.174638880324014]
超解像度(SR)は、高解像度(HR)画像を低解像度(LR)画像から再構成することを目的としている。
単段階拡散に基づくアップサンプラーと学習可能なダウンサンプラーを協調的に最適化するコラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-10T07:12:46Z) - ICF-SRSR: Invertible scale-Conditional Function for Self-Supervised
Real-world Single Image Super-Resolution [60.90817228730133]
単一画像超解像(SISR)は、与えられた低解像度(LR)画像を高解像度(HR)にアップサンプリングすることを目的とした課題である。
近年のアプローチは、単純化されたダウンサンプリング演算子によって劣化したシミュレーションLR画像に基づいて訓練されている。
Invertible Scale-Conditional Function (ICF) を提案する。これは入力画像をスケールし、異なるスケール条件で元の入力を復元する。
論文 参考訳(メタデータ) (2023-07-24T12:42:45Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。