論文の概要: LinearSR: Unlocking Linear Attention for Stable and Efficient Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2510.08771v1
- Date: Thu, 09 Oct 2025 19:41:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:47.68551
- Title: LinearSR: Unlocking Linear Attention for Stable and Efficient Image Super-Resolution
- Title(参考訳): リニアSR: 安定的で効率的な画像スーパーリゾリューションのためのリニアアテンションをアンロック
- Authors: Xiaohui Li, Shaobin Zhuang, Shuo Cao, Yang Yang, Yuandong Pu, Qi Qin, Siqi Luo, Bin Fu, Yihao Liu,
- Abstract要約: 画像超解法(SR)の生成モデルはますます強力になるが、自己アテンションの二次複雑性(O(N2))に依存しているため、大きな計算ボトルネックが生じる。
線形注意(Linear Attention)はO(N)ソリューションを提供するが、フォトリアリスティックSRに対するその約束は、ほとんど未解決のままである。
本稿では、これらの重要なハードルを体系的に克服する全体論的なフレームワークであるLinearSRを紹介する。
- 参考スコア(独自算出の注目度): 24.44080642253128
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative models for Image Super-Resolution (SR) are increasingly powerful, yet their reliance on self-attention's quadratic complexity (O(N^2)) creates a major computational bottleneck. Linear Attention offers an O(N) solution, but its promise for photorealistic SR has remained largely untapped, historically hindered by a cascade of interrelated and previously unsolved challenges. This paper introduces LinearSR, a holistic framework that, for the first time, systematically overcomes these critical hurdles. Specifically, we resolve a fundamental, training instability that causes catastrophic model divergence using our novel "knee point"-based Early-Stopping Guided Fine-tuning (ESGF) strategy. Furthermore, we mitigate the classic perception-distortion trade-off with a dedicated SNR-based Mixture of Experts (MoE) architecture. Finally, we establish an effective and lightweight guidance paradigm, TAG, derived from our "precision-over-volume" principle. Our resulting LinearSR model simultaneously delivers state-of-the-art perceptual quality with exceptional efficiency. Its core diffusion forward pass (1-NFE) achieves SOTA-level speed, while its overall multi-step inference time remains highly competitive. This work provides the first robust methodology for applying Linear Attention in the photorealistic SR domain, establishing a foundational paradigm for future research in efficient generative super-resolution.
- Abstract(参考訳): 画像超解法(SR)の生成モデルはますます強力になるが、自己アテンションの二次複雑性(O(N^2))に依存しているため、大きな計算ボトルネックが生じる。
線形注意(Linear Attention)は、O(N) 解を提供するが、光現実主義 SR に対するその約束は、歴史的には、関連性のある、未解決の課題のカスケードによって妨げられ、ほとんど未解決のままである。
本稿では、これらの重要なハードルを体系的に克服する全体論的なフレームワークであるLinearSRを紹介する。
具体的には、我々は、新しい「ニーポイント」ベースのアーリーストッピングガイドファインタニング(ESGF)戦略を用いて、破滅的なモデル分岐を引き起こす基本的な訓練不安定性を解決する。
さらに、SNRベースのMixture of Experts (MoE)アーキテクチャにより、従来の知覚歪みトレードオフを緩和する。
最後に,我々の「精度・過量」原理から導いた,効果的で軽量なガイダンスパラダイムであるTAGを確立する。
結果として得られたLinearSRモデルは、異常な効率で最先端の知覚品質を同時に提供します。
コア拡散フォワードパス(1-NFE)はSOTAレベルの速度を達成するが、全体的なマルチステップ推論時間は競争力が高い。
この研究は、フォトリアリスティックSR領域に線形注意を適用するための最初の堅牢な方法論を提供し、効率的な生成超解法の研究のための基礎パラダイムを確立する。
関連論文リスト
- Consistency Trajectory Matching for One-Step Generative Super-Resolution [19.08324232157866]
現在の拡散に基づく超解像法は、高い推論オーバーヘッドを犠牲にして可換性を実現する。
超解法のための一貫性トラジェクトリマッチング (CTMSR) を提案する。これは蒸留不要戦略であり、フォトリアリスティックSRを1ステップで生成できる。
提案手法は, 合成データセットと実データセットの両方において, 同等あるいはそれ以上の能力が得られることを示す。
論文 参考訳(メタデータ) (2025-03-26T09:20:42Z) - Degradation-Guided One-Step Image Super-Resolution with Diffusion Priors [75.24313405671433]
拡散に基づく画像超解像法 (SR) は、事前訓練された大規模なテキスト・画像拡散モデルを先行として活用することにより、顕著な成功を収めた。
本稿では,拡散型SR手法の効率問題に対処する新しい一段階SRモデルを提案する。
既存の微調整戦略とは異なり、SR専用の劣化誘導低ランク適応 (LoRA) モジュールを設計した。
論文 参考訳(メタデータ) (2024-09-25T16:15:21Z) - RBSR: Efficient and Flexible Recurrent Network for Burst
Super-Resolution [57.98314517861539]
バースト超解像(BurstSR)は、高解像度(HR)画像を低解像度(LR)画像と雑音画像から再構成することを目的としている。
本稿では,効率よくフレキシブルなリカレントネットワークでフレーム単位のキューを融合させることを提案する。
論文 参考訳(メタデータ) (2023-06-30T12:14:13Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - DeepRLS: A Recurrent Network Architecture with Least Squares Implicit
Layers for Non-blind Image Deconvolution [15.986942312624]
非盲点画像デコンボリューションの問題について検討する。
本稿では,画像品質の非常に競争力のある復元結果をもたらす新しい再帰的ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-10T13:16:51Z) - Characteristic Regularisation for Super-Resolving Face Images [81.84939112201377]
既存の顔画像超解像法(SR)は、主に人工的にダウンサンプリングされた低解像度(LR)画像の改善に焦点を当てている。
従来の非教師なしドメイン適応(UDA)手法は、未ペアの真のLRとHRデータを用いてモデルをトレーニングすることでこの問題に対処する。
これにより、視覚的特徴を構成することと、画像の解像度を高めることの2つのタスクで、モデルをオーバーストレッチする。
従来のSRモデルとUDAモデルの利点を結合する手法を定式化する。
論文 参考訳(メタデータ) (2019-12-30T16:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。