論文の概要: Fidelity- and Perception-Aware Local Implicit Attention for Arbitrary-Scale Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2606.21910v1
- Date: Sat, 20 Jun 2026 07:12:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 23:58:25.526471
- Title: Fidelity- and Perception-Aware Local Implicit Attention for Arbitrary-Scale Image Super-Resolution
- Title(参考訳): 任意規模の画像超解像に対する忠実度と知覚認識による局所的インシシタント注意
- Authors: Yu-Syuan Xu, Hao-Lun Sun, Hao-Wei Chen, Hsien-Kai Kuo, Chun-Yi Lee,
- Abstract要約: Arbitrary-scale Image Super- resolution (ASISR) は、連続的なアップスケーリング因子による低解像度入力から高解像度イメージを再構成することを目的としている。
従来のピクセル・レグレッションのアプローチは、現実的な詳細を欠いた非常にスムーズな結果をもたらすことが多い。
最近の拡散法は、よりシャープでより現実的なテクスチャを生み出すことができる。
本稿では,ASISRの現実的な再構築を実現するために,忠実度指向の機能を拡散パイプラインに統合するフレームワークを提案する。
- 参考スコア(独自算出の注目度): 16.91932620328557
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Arbitrary-scale image super-resolution (ASISR) aims to reconstruct high-resolution images from low-resolution inputs over a continuous range of upscaling factors. While traditional pixel-regression approaches often produce overly smooth results that lack realistic details, recent diffusion methods can produce sharper and more realistic textures. However, these diffusion techniques frequently introduce the risk of structural hallucinations. To address these issues, we propose Fidelity- and Perception-Aware Local Implicit Attention (FPLIA), a framework that effectively integrates fidelity-oriented features into a diffusion pipeline to produce realistic and faithful reconstructions for ASISR. We introduce a Fidelity and Perception Attention Module (FPAM), which applies both self-attention and cross-attention to fidelity-oriented and perceptual features to enhance representational capacity. To further exploit their complements, we design a Fidelity and Perception Select Module (FPSM) that adaptively selects the most representative features for RGB values prediction. We conduct extensive experiments to validate the effectiveness of these components. Both qualitative and quantitative results show that FPLIA delivers superior perceptual realism while maintaining reconstruction accuracy on standard ASISR benchmarks. The source code is accessible at the following repository: https://github.com/XUSean0118/FPLIA.
- Abstract(参考訳): Arbitrary-scale Image Super- resolution (ASISR) は、連続的なアップスケーリング因子による低解像度入力から高解像度イメージを再構成することを目的としている。
従来のピクセル・レグレッションのアプローチは、現実的な詳細を欠く非常にスムーズな結果をもたらすことが多いが、最近の拡散法はよりシャープでよりリアルなテクスチャを生み出すことができる。
しかし、これらの拡散技術は、しばしば構造幻覚のリスクをもたらす。
これらの問題に対処するため、我々は、FPLIA(Fidelity- and Perception-Aware Local Implicit Attention)を提案する。
本稿では,自己認識と相互認識を両立させるFPAM(Fidelity and Perception Attention Module)を提案する。
それらの補関数をさらに活用するために、RGB値予測のための最も代表的な特徴を適応的に選択するFPSM(Fidelity and Perception Select Module)を設計する。
これらのコンポーネントの有効性を検証するために、広範な実験を行う。
定性的かつ定量的な結果は、FPLIAが標準ASISRベンチマークの再現精度を維持しつつ、優れた知覚的リアリズムを提供することを示している。
ソースコードは以下のリポジトリでアクセスできる。
関連論文リスト
- FiDeSR: High-Fidelity and Detail-Preserving One-Step Diffusion Super-Resolution [11.03986460753769]
本稿では,高忠実かつ細部保存のワンステップ拡散超解像フレームワークFiDeSRを提案する。
トレーニング中、モデルがより高い予測誤差を示す領域を適応的に強調する詳細対応重み付け戦略を導入する。
推論中、低周波および高周波適応型エンハンサーはモデル再トレーニングを必要とせずに再構成をさらに洗練する。
論文 参考訳(メタデータ) (2026-03-03T07:34:49Z) - Iterative Inference-time Scaling with Adaptive Frequency Steering for Image Super-Resolution [75.3690742776891]
適応周波数ステアリング(IAFS)を用いた反復拡散推論時間スケーリングを提案する。
IAFSは、構造的偏差の反復的補正によって生成した画像を徐々に精細化することで、知覚品質と構造的忠実性のバランスをとるという課題に対処する。
実験の結果、IAFSは知覚と忠実性の対立を効果的に解決し、知覚の細部と構造的精度を一貫して改善し、既存の推論時間スケーリング手法よりも優れていた。
論文 参考訳(メタデータ) (2025-12-29T15:09:20Z) - Leveraging Vision-Language Models to Select Trustworthy Super-Resolution Samples Generated by Diffusion Models [0.026861992804651083]
本稿では拡散生成集合から最も信頼できるSRサンプルを特定するための堅牢なフレームワークを提案する。
本稿では,意味的類似性に基づいてSR信頼性を定量化するハイブリッド尺度TWSを提案する。
アウトプットを人間の期待と意味的正しさに合わせることで、この研究は生成的SRにおける信頼性の新たなベンチマークを定めている。
論文 参考訳(メタデータ) (2025-06-25T21:00:44Z) - One-Step Diffusion-based Real-World Image Super-Resolution with Visual Perception Distillation [53.24542646616045]
画像超解像(SR)生成に特化して設計された新しい視覚知覚拡散蒸留フレームワークであるVPD-SRを提案する。
VPD-SRは2つのコンポーネントから構成される: 明示的セマンティック・アウェア・スーパービジョン(ESS)と高周波知覚(HFP)損失。
提案したVPD-SRは,従来の最先端手法と教師モデルの両方と比較して,たった1ステップのサンプリングで優れた性能が得られる。
論文 参考訳(メタデータ) (2025-06-03T08:28:13Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - Visual Autoregressive Modeling for Image Super-Resolution [14.935662351654601]
次世代の予測モデルとして, ISRフレームワークの視覚的自己回帰モデルを提案する。
大規模データを収集し、ロバストな生成先行情報を得るためのトレーニングプロセスを設計する。
論文 参考訳(メタデータ) (2025-01-31T09:53:47Z) - FaithDiff: Unleashing Diffusion Priors for Faithful Image Super-resolution [48.88184541515326]
本稿では,忠実な画像SRのための遅延拡散モデル(LDM)のパワーをフル活用するために,FithDiffというシンプルで効果的な手法を提案する。
高品質画像上で事前学習した拡散モデルを凍結する既存の拡散ベースSR法とは対照的に,有用な情報を特定し,忠実な構造を復元する前に拡散を解き放つことを提案する。
論文 参考訳(メタデータ) (2024-11-27T23:58:03Z) - Diffusion Models Without Attention [110.5623058129782]
Diffusion State Space Model (DiffuSSM) は、よりスケーラブルな状態空間モデルバックボーンで注目メカニズムを置き換えるアーキテクチャである。
拡散訓練におけるFLOP効率の高いアーキテクチャへの注力は、大きな前進となる。
論文 参考訳(メタデータ) (2023-11-30T05:15:35Z) - Interpretable Detail-Fidelity Attention Network for Single Image
Super-Resolution [89.1947690981471]
本研究では,スムースとディテールを段階的に分割・収束的に処理する,目的・解釈可能なディテール・ファイダリティ・アテンション・ネットワークを提案する。
特に,詳細推論において顕著な解釈可能な特徴表現のためのヘシアンフィルタを提案する。
実験により,提案手法は最先端手法よりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2020-09-28T08:31:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。