論文の概要: Bridging Restoration and Generation Manifolds in One-Step Diffusion for Real-World Super-Resolution
- arxiv url: http://arxiv.org/abs/2604.24136v1
- Date: Mon, 27 Apr 2026 07:43:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.79378
- Title: Bridging Restoration and Generation Manifolds in One-Step Diffusion for Real-World Super-Resolution
- Title(参考訳): リアルタイム超解像のための1ステップ拡散におけるブリッジ再生と生成マニフォールド
- Authors: Shyang-En Weng, Yi-Cheng Liao, Yu-Syuan Xu, Wei-Chen Chiu, Ching-Chun Huang,
- Abstract要約: 最近の単一段階蒸留は推論を加速するが、認識歪んだトレードオフに直面している。
実時間ISR(IDaS-SR)の適応的インバージョンと劣化認識サンプリングを提案する。
IDaS-SRは決定論的復元と生成のボトルネックを埋める一段階のフレームワークである。
- 参考スコア(独自算出の注目度): 22.963799508399365
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pretrained diffusion models have revolutionized real-world image super-resolution (Real-ISR) but suffer from computational bottlenecks due to iterative sampling. Recent single-step distillation accelerates inference but faces a stark perception-distortion trade-off due to rigid timestep initialization, distributional trajectory mismatches, and fragile stochastic modulation. To address this, we present Adaptive Inversion and Degradation-aware Sampling for Real-ISR (IDaS-SR), a one-step framework bridging the deterministic restoration and stochastic generation manifolds. At its core, the Manifold Inversion Noise Estimator (MINE) resolves these initialization and trajectory mismatches by predicting a severity-aware timestep and inversion noise, precisely anchoring low-quality latents onto the diffusion trajectory. Furthermore, to mitigate fragile stochastic modulation, we propose CHARIOT, a continuous generative steering mechanism. By rescheduling trajectories and interpolating noise, it enables explicit navigation of the perception-distortion boundary without compromising structural priors. Extensive experiments demonstrate that IDaS-SR outperforms state-of-the-art methods, seamlessly transitioning from a rigorous structural restorer to a sophisticated texture hallucinator in a single inference step.
- Abstract(参考訳): 事前訓練された拡散モデルは、実世界の超解像(Real-ISR)に革命をもたらしたが、反復サンプリングによる計算ボトルネックに悩まされている。
最近の単一段階蒸留は推論を加速するが、剛性時間の初期化、分布軌跡のミスマッチ、脆弱な確率変調により、強い知覚歪のトレードオフに直面している。
そこで本研究では,実ISR(Adaptive Inversion and Degradation-aware Sampling for Real-ISR:IDaS-SR)について述べる。
Manifold Inversion Noise Estimator (MINE) は、これらの初期化と軌道ミスマッチを、重度対応の時間ステップと反転ノイズを予測し、低品質の潜水剤を拡散軌道に正確に固定することで解決する。
さらに, 不安定な確率変調を緩和するために, CHARIOT, CHARIOTを提案する。
軌跡の再スケジューリングと補間ノイズにより、構造的先行性を損なうことなく、知覚歪曲境界の明示的なナビゲーションを可能にする。
大規模な実験により、IDaS-SRは最先端の手法よりも優れており、厳密な構造復元器から高度なテクスチャ幻覚器へシームレスに1回の推論ステップで移行する。
関連論文リスト
- Allo{SR}$^2$: Rectifying One-Step Super-Resolution to Stay Real via Allomorphic Generative Flows [32.29950358173077]
大規模拡散モデルとフローベースモデルの強力な生成先行モデルを活用することで、実世界の超解像(Real-SR)が革新された。
AlloSR$2$は、高忠実な生成リアリズムを維持するために同型生成フローを介して一段階のSR軌道を補正する新しいフレームワークである。
論文 参考訳(メタデータ) (2026-04-21T08:44:40Z) - Better with Less: Tackling Heterogeneous Multi-Modal Image Joint Pretraining via Conditioned and Degraded Masked Autoencoder [34.73963627819185]
高分解能光合成開口レーダ(SAR)プレトレーニングは、単一ソース表現を相互に強化するために、モダリティの相乗効果を求める。
我々は、アライメントの少ないテキスト・ベッター・シナジーの先駆者であるCoDe-MAEを提案する。
CoDe-MAEは、表現の劣化を防ぎ、多様な単一および双方向の下流タスクにまたがる新しい最先端のパフォーマンスを確立する。
論文 参考訳(メタデータ) (2026-04-18T10:23:00Z) - CASR: A Robust Cyclic Framework for Arbitrary Large-Scale Super-Resolution with Distribution Alignment and Self-Similarity Awareness [14.01813573738112]
CASRは単純だが高効率な環状SRフレームワークであり、超磁化を非分布スケール遷移の列として再構成する。
この設計は、任意のスケールで安定な推論を保証し、単一のモデルしか必要としない。
単一モデルのみを用いながら, 分布のドリフトを著しく低減し, 長距離テクスチャの整合性を保ち, 極端倍率でも優れた一般化を実現する。
論文 参考訳(メタデータ) (2026-02-25T18:05:51Z) - Diffusion-Based Limited-Angle CT Reconstruction under Noisy Conditions [10.287171164361608]
角投影の欠如は、再構成された画像の不完全なシノグラムやアーティファクトに繋がる。
本稿では, 平均回帰微分方程式(MR-SDE)を用いて, 角ビューの欠落を解消する拡散型フレームワークを提案する。
現実的な雑音下でのロバスト性を改善するために,推論時間不確実性を明示的にモデル化する新しいノイズ認識機構を提案する。
論文 参考訳(メタデータ) (2025-07-08T03:58:52Z) - ResPF: Residual Poisson Flow for Efficient and Physically Consistent Sparse-View CT Reconstruction [7.644299873269135]
スパース・ビュー・コンピュート・トモグラフィー(CT)は、放射線線量を減らすための実用的な方法であるが、結果として生じる逆問題により、正確な画像再構成に重大な課題が生じる。
生成モデリングの最近の進歩、特にポアソンフロー生成モデル(PFGM)は、高忠実度画像合成を可能にする。
本稿では, 残余ポアソンフロー(ResPF)生成モデルを提案する。
論文 参考訳(メタデータ) (2025-06-06T01:43:35Z) - Restoration Score Distillation: From Corrupted Diffusion Pretraining to One-Step High-Quality Generation [82.39763984380625]
Score Distillation (DSD) の原理的一般化である textitRestoration Score Distillation (RSD) を提案する。
RSDは、ぼやけた画像、不完全画像、低解像度画像など、広範囲の汚職タイプに対応している。
自然と科学の両方のデータセットの様々な復元作業において、教師モデルを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-19T17:21:03Z) - SinSR: Diffusion-Based Image Super-Resolution in a Single Step [119.18813219518042]
拡散モデルに基づく超解像(SR)法は有望な結果を示す。
しかし、それらの実践的応用は、必要な推論ステップのかなりの数によって妨げられている。
本稿では,SinSRという単一ステップのSR生成を実現するための,シンプルで効果的な手法を提案する。
論文 参考訳(メタデータ) (2023-11-23T16:21:29Z) - DiffusionAD: Norm-guided One-step Denoising Diffusion for Anomaly Detection [80.20339155618612]
DiffusionADは、再構成サブネットワークとセグメンテーションサブネットワークからなる、新しい異常検出パイプラインである。
高速なワンステップデノゲーションパラダイムは、同等の再現品質を維持しながら、数百倍の加速を達成する。
異常の出現の多様性を考慮し、複数のノイズスケールの利点を統合するためのノルム誘導パラダイムを提案する。
論文 参考訳(メタデータ) (2023-03-15T16:14:06Z) - Toward Certified Robustness Against Real-World Distribution Shifts [65.66374339500025]
我々は、データから摂動を学ぶために生成モデルを訓練し、学習したモデルの出力に関して仕様を定義する。
この設定から生じるユニークな挑戦は、既存の検証者がシグモイドの活性化を厳密に近似できないことである。
本稿では,古典的な反例誘導的抽象的洗練の概念を活用するシグモイドアクティベーションを扱うための一般的なメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-08T04:09:13Z) - Towards performant and reliable undersampled MR reconstruction via
diffusion model sampling [67.73698021297022]
DiffuseReconは拡散モデルに基づく新しいMR再構成法である。
観測された信号に基づいて生成過程を導出する。
特定の加速因子に関する追加の訓練は必要としない。
論文 参考訳(メタデータ) (2022-03-08T02:25:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。