論文の概要: StructSR: Refuse Spurious Details in Real-World Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2501.05777v1
- Date: Fri, 10 Jan 2025 08:18:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-13 15:27:28.764893
- Title: StructSR: Refuse Spurious Details in Real-World Image Super-Resolution
- Title(参考訳): StructSR: 現実世界の超解像の鮮明な詳細を否定する
- Authors: Yachao Li, Dong Liang, Tianyu Ding, Sheng-Jun Huang,
- Abstract要約: StructSRは、構造的忠実性を高め、拡散に基づくReal-ISRの急激な詳細を抑制する、シンプルで効果的で、プラグアンドプレイの手法である。
中心となるのがStructure-Aware Screeningメカニズムで、初期の推論段階での低解像度(LR)入力と最も構造的に類似したイメージを識別する。
実験の結果,StructSRは構造とテクスチャの忠実度を著しく改善し,PSNRおよびSSIMの指標を合成データセット(DIV2K-Val)で平均5.27%,9.36%,2で4.13%,8.64%改善した。
- 参考スコア(独自算出の注目度): 35.1930212334597
- License:
- Abstract: Diffusion-based models have shown great promise in real-world image super-resolution (Real-ISR), but often generate content with structural errors and spurious texture details due to the empirical priors and illusions of these models. To address this issue, we introduce StructSR, a simple, effective, and plug-and-play method that enhances structural fidelity and suppresses spurious details for diffusion-based Real-ISR. StructSR operates without the need for additional fine-tuning, external model priors, or high-level semantic knowledge. At its core is the Structure-Aware Screening (SAS) mechanism, which identifies the image with the highest structural similarity to the low-resolution (LR) input in the early inference stage, allowing us to leverage it as a historical structure knowledge to suppress the generation of spurious details. By intervening in the diffusion inference process, StructSR seamlessly integrates with existing diffusion-based Real-ISR models. Our experimental results demonstrate that StructSR significantly improves the fidelity of structure and texture, improving the PSNR and SSIM metrics by an average of 5.27% and 9.36% on a synthetic dataset (DIV2K-Val) and 4.13% and 8.64% on two real-world datasets (RealSR and DRealSR) when integrated with four state-of-the-art diffusion-based Real-ISR methods.
- Abstract(参考訳): 拡散ベースのモデルは、実世界の超解像(Real-ISR)において非常に有望であるが、しばしば、これらのモデルの経験的な先行と錯覚のために、構造的誤りと刺激的なテクスチャの詳細を持つコンテンツを生成する。
この問題に対処するために,構造的忠実度を高め,拡散に基づくReal-ISRの急激な詳細性を抑える,シンプルで効果的かつプラグアンドプレイなStructSRを提案する。
StructSRは、追加の微調整、外部モデル事前、高レベルのセマンティック知識を必要としない。
その中核となるSAS(Structure-Aware Screening)メカニズムは、初期推論段階での低分解能(LR)入力に最も近い構造的類似性を持つ画像を識別し、歴史的構造知識として活用することで、突発的な細部の生成を抑える。
拡散推論プロセスに介入することにより、StructSRは既存の拡散ベースのReal-ISRモデルとシームレスに統合される。
実験の結果、StructSRは構造とテクスチャの忠実度を著しく改善し、PSNRとSSIMのメトリクスを合成データセット(DIV2K-Val)で平均5.27%と9.36%改善し、実世界の2つのデータセット(RealSRとDRealSR)で4つの状態拡散ベースのReal-ISR法と統合した場合に4.13%と8.64%改善した。
関連論文リスト
- One Model for Two Tasks: Cooperatively Recognizing and Recovering Low-Resolution Scene Text Images by Iterative Mutual Guidance [32.88048472109016]
高分解能(HR)画像からのシーンテキスト認識(STR)は著しく成功したが、低分解能(LR)画像でのテキスト読取は依然として困難である。
近年,多くのシーンテキスト画像超解像(STISR)モデルがLR画像の超解像(SR)画像を生成するために提案され,SR画像上でSTRが実行されることにより認識性能が向上した。
本稿では,LRシーンのテキスト画像の同時認識と復元を効果的に行う,画像と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-22T15:05:25Z) - Towards Realistic Data Generation for Real-World Super-Resolution [58.88039242455039]
RealDGenは、現実世界の超解像のために設計された教師なし学習データ生成フレームワークである。
我々は,コンテンツ分解脱結合拡散モデルに統合されたコンテンツと劣化抽出戦略を開発する。
実験により、RealDGenは、現実世界の劣化を反映する大規模で高品質なペアデータを生成するのに優れていることが示された。
論文 参考訳(メタデータ) (2024-06-11T13:34:57Z) - Diffusion Models Without Attention [110.5623058129782]
Diffusion State Space Model (DiffuSSM) は、よりスケーラブルな状態空間モデルバックボーンで注目メカニズムを置き換えるアーキテクチャである。
拡散訓練におけるFLOP効率の高いアーキテクチャへの注力は、大きな前進となる。
論文 参考訳(メタデータ) (2023-11-30T05:15:35Z) - DiffSCI: Zero-Shot Snapshot Compressive Imaging via Iterative Spectral
Diffusion Model [18.25548360119976]
マルチスペクトル画像(MSI)におけるスナップショット圧縮画像(SCI)再構成の精度向上を目指した。
DiffSCIと呼ばれる新しいゼロショット拡散モデルを提案する。
我々は,DiffSCIが自己監督的,ゼロショット的アプローチよりも顕著な性能向上を示すことを示すため,広範囲な試験を行った。
論文 参考訳(メタデータ) (2023-11-19T20:27:14Z) - RBSR: Efficient and Flexible Recurrent Network for Burst
Super-Resolution [57.98314517861539]
バースト超解像(BurstSR)は、高解像度(HR)画像を低解像度(LR)画像と雑音画像から再構成することを目的としている。
本稿では,効率よくフレキシブルなリカレントネットワークでフレーム単位のキューを融合させることを提案する。
論文 参考訳(メタデータ) (2023-06-30T12:14:13Z) - SFP: Spurious Feature-targeted Pruning for Out-of-Distribution
Generalization [38.37530720506389]
本研究では,不均一な部分構造を自動探索するために,SFPと呼ばれる新しいSpurious Feature-targeted Model Pruningフレームワークを提案する。
SFP は構造ベースおよび非構造ベース OOD 一般化 SOTA をそれぞれ4.72% と 23.35% に向上させることができる。
論文 参考訳(メタデータ) (2023-05-19T11:46:36Z) - Bridging Component Learning with Degradation Modelling for Blind Image
Super-Resolution [69.11604249813304]
視覚障害者のためのコンポーネント分解・協調最適化ネットワーク(CDCN)を提案する。
CDCNは入力LR画像を特徴空間の構造と詳細成分に分解する。
本稿では,HR画像の細部と構造復元過程を協調的に監督する,劣化駆動型学習戦略を提案する。
論文 参考訳(メタデータ) (2022-12-03T14:53:56Z) - Learning Detail-Structure Alternative Optimization for Blind
Super-Resolution [69.11604249813304]
そこで我々は,ブラインドSRに先立ってカーネルを曖昧にすることなく,再帰的な詳細構造代替最適化を実現する,有効かつカーネルフリーなネットワークDSSRを提案する。
DSSRでは、細部構造変調モジュール(DSMM)が構築され、画像の詳細と構造の相互作用と協調を利用する。
本手法は既存の手法に対して最先端の手法を実現する。
論文 参考訳(メタデータ) (2022-12-03T14:44:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。