論文の概要: Spectral and Trajectory Regularization for Diffusion Transformer Super-Resolution
- arxiv url: http://arxiv.org/abs/2603.06275v1
- Date: Fri, 06 Mar 2026 13:33:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:45.800393
- Title: Spectral and Trajectory Regularization for Diffusion Transformer Super-Resolution
- Title(参考訳): 拡散変圧器超解法におけるスペクトルおよび軌道規則化
- Authors: Jingkai Wang, Yixin Tang, Jue Gong, Jiatong Li, Shu Li, Libo Liu, Jianliang Lan, Yutong Liu, Yulun Zhang,
- Abstract要約: StrSRはスペクトルおよび軌道正則化を特徴とする一段階の逆蒸留フレームワークである。
定量的メトリクスと視覚的知覚の両方にわたって、Real-ISRで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 29.01282205331164
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion transformer (DiT) architectures show great potential for real-world image super-resolution (Real-ISR). However, their computationally expensive iterative sampling necessitates one-step distillation. Existing one-step distillation methods struggle with Real-ISR on DiT. They suffer from fundamental trajectory mismatch and generate severe grid-like periodic artifacts. To tackle these challenges, we propose StrSR, a novel one-step adversarial distillation framework featuring spectral and trajectory regularization. Specifically, we propose an asymmetric discriminative distillation architecture to bridge the trajectory gap. Additionally, we design a frequency distribution matching strategy to effectively suppress DiT-specific periodic artifacts caused by high-frequency spectral leakage. Extensive experiments demonstrate that StrSR achieves state-of-the-art performance in Real-ISR, across both quantitative metrics and visual perception. The code and models will be released at https://github.com/jkwang28/StrSR .
- Abstract(参考訳): 拡散変換器(DiT)アーキテクチャは,実世界の超解像(Real-ISR)に大きな可能性を示す。
しかし、計算的に高価な反復サンプリングは1段階の蒸留を必要とする。
既存の1段階蒸留法は、DiT上のReal-ISRと競合する。
基本的な軌道ミスマッチに悩まされ、重度の格子状の周期的なアーティファクトを生成する。
これらの課題に対処するために、スペクトルおよび軌道正則化を特徴とする新しい一段階逆蒸留フレームワークであるStrSRを提案する。
具体的には, トラジェクティブギャップを橋渡しする非対称な識別蒸留アーキテクチャを提案する。
さらに、高周波スペクトルリークによるDiT固有の周期的アーティファクトを効果的に抑制するための周波数分布マッチング戦略を設計する。
大規模な実験により、StrSRは量的メトリクスと視覚的知覚の両方にわたって、Real-ISRで最先端のパフォーマンスを達成することが示された。
コードとモデルはhttps://github.com/jkwang28/StrSR でリリースされる。
関連論文リスト
- SR$^{2}$-Net: A General Plug-and-Play Model for Spectral Refinement in Hyperspectral Image Super-Resolution [3.4888894498274747]
HSI-SRは、スペクトル的に忠実で物理的に妥当な特性を維持しながら、空間分解能を高めることを目的としている。
これらの方法はしばしばバンド間のスペクトルの一貫性を無視し、刺激的な振動と物理的に不可解な人工物をもたらす。
本稿では,この問題に対処するための軽量なプラグ・アンド・プレイ方式であるSpectral Rectification Super-Resolution Network (SR$2$-Net)を提案する。
論文 参考訳(メタデータ) (2026-01-29T07:00:00Z) - Diffusion Transformer meets Multi-level Wavelet Spectrum for Single Image Super-Resolution [15.056888813012451]
SR(DTWSR)のための画像ウェーブレットスペクトルに基づく拡散変換器モデルを提案する。
DTWSRは拡散モデルと変圧器の優位性を取り入れ、マルチスケール周波数サブバンド間の相互関係を捉える。
デュアルデコーダは、画像生成におけるアライメントを省略することなく、低周波サブバンドと高周波サブバンドの異なるばらつきを扱うよう精巧に設計されている。
論文 参考訳(メタデータ) (2025-11-03T02:56:58Z) - TIR-Diffusion: Diffusion-based Thermal Infrared Image Denoising via Latent and Wavelet Domain Optimization [11.970228442183476]
本稿では拡散型TIR画像復調フレームワークを提案する。
提案手法は、遅延空間と離散ウェーブレット変換(DWT)/二重ツリー複合ウェーブレット変換(DTCWT)の損失を組み合わせた新しい損失関数を用いてモデルを微調整する。
ベンチマークデータセットの実験は、最先端のデノナイジング手法と比較して、我々のアプローチの優れた性能を示している。
論文 参考訳(メタデータ) (2025-07-30T06:27:32Z) - JDATT: A Joint Distillation Framework for Atmospheric Turbulence Mitigation and Target Detection [4.233977712300247]
大気の乱流(AT)は、リップリング、ぼかし、強度変動などの深刻な劣化をもたらす。
最近のディープラーニングベースのアプローチでは、トランスフォーマーとMambaアーキテクチャを使用したAT緩和が進んでいる。
大気乱流緩和とターゲット検出のための統合蒸留フレームワークであるJDATTを提案する。
論文 参考訳(メタデータ) (2025-07-26T04:06:48Z) - Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.40450475728792]
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。
本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。
様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-25T12:23:10Z) - One Diffusion Step to Real-World Super-Resolution via Flow Trajectory Distillation [60.54811860967658]
FluxSRはフローマッチングモデルに基づく新しい一段階拡散リアルISRである。
まず,フロートラジェクトリ蒸留(FTD)を導入し,多段階のフローマッチングモデルを1段階のリアルISRに蒸留する。
第2に、画像リアリズムを改善し、生成画像の高周波アーティファクト問題に対処するために、テレビLPIPSを知覚的損失として提案する。
論文 参考訳(メタデータ) (2025-02-04T04:11:29Z) - FreqINR: Frequency Consistency for Implicit Neural Representation with Adaptive DCT Frequency Loss [5.349799154834945]
本稿では、新しい任意スケール超解像法であるFreqINR(FreqINR)について述べる。
トレーニングでは,適応離散コサイン変換周波数損失(adaptive Discrete Cosine Transform Frequency Loss,ADFL)を用いて,HR画像と地絡画像の周波数ギャップを最小化する。
推論の際には,低分解能(LR)画像と地軸画像のスペクトルコヒーレンスを維持するために受容場を拡張した。
論文 参考訳(メタデータ) (2024-08-25T03:53:17Z) - One Step Diffusion-based Super-Resolution with Time-Aware Distillation [60.262651082672235]
拡散に基づく画像超解像(SR)法は,低解像度画像から細部まで細部まで,高解像度画像の再構成に有望であることを示す。
近年,拡散型SRモデルの知識蒸留によるサンプリング効率の向上が試みられている。
我々は,効率的な画像超解像を実現するため,TAD-SRというタイムアウェア拡散蒸留法を提案する。
論文 参考訳(メタデータ) (2024-08-14T11:47:22Z) - Distilling Diffusion Models into Conditional GANs [90.76040478677609]
複雑な多段階拡散モデルを1段階条件付きGAN学生モデルに蒸留する。
E-LatentLPIPSは,拡散モデルの潜在空間で直接動作する知覚的損失である。
我々は, 最先端の1ステップ拡散蒸留モデルよりも優れた1ステップ発生器を実証した。
論文 参考訳(メタデータ) (2024-05-09T17:59:40Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。