論文の概要: Edge-Aware Normalized Attention for Efficient and Detail-Preserving Single Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2509.14550v1
- Date: Thu, 18 Sep 2025 02:31:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 17:26:53.029974
- Title: Edge-Aware Normalized Attention for Efficient and Detail-Preserving Single Image Super-Resolution
- Title(参考訳): 画像超解像の高効率保存のためのエッジアウェア正規化注意
- Authors: Penghao Rao, Tieyong Zeng,
- Abstract要約: 単一高分解能超解像(SISR)は、単一の低分解能観測から構造的に忠実な高周波成分を回収することが曖昧であるため、非常に不明瞭である。
既存のエッジ対応の手法では、エッジ先行または注意枝をますます複雑なバックボーンにアタッチすることが多いが、アドホック融合は冗長性、不安定な最適化、あるいは限られた構造的利得をもたらすことが多い。
このギャップには, エッジ特徴量と中間特徴量から適応変調マップを導出するエッジ誘導型アテンション機構を用いて対処し, それらを正規化および再重み付けに応用し, 微妙なテクスチャを抑えつつ, 構造的に健全な領域を選択的に増幅する。
- 参考スコア(独自算出の注目度): 27.3322913419539
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-image super-resolution (SISR) remains highly ill-posed because recovering structurally faithful high-frequency content from a single low-resolution observation is ambiguous. Existing edge-aware methods often attach edge priors or attention branches onto increasingly complex backbones, yet ad hoc fusion frequently introduces redundancy, unstable optimization, or limited structural gains. We address this gap with an edge-guided attention mechanism that derives an adaptive modulation map from jointly encoded edge features and intermediate feature activations, then applies it to normalize and reweight responses, selectively amplifying structurally salient regions while suppressing spurious textures. In parallel, we integrate this mechanism into a lightweight residual design trained under a composite objective combining pixel-wise, perceptual, and adversarial terms to balance fidelity, perceptual realism, and training stability. Extensive experiments on standard SISR benchmarks demonstrate consistent improvements in structural sharpness and perceptual quality over SRGAN, ESRGAN, and prior edge-attention baselines at comparable model complexity. The proposed formulation provides (i) a parameter-efficient path to inject edge priors, (ii) stabilized adversarial refinement through a tailored multiterm loss, and (iii) enhanced edge fidelity without resorting to deeper or heavily overparameterized architectures. These results highlight the effectiveness of principled edge-conditioned modulation for advancing perceptual super-resolution.
- Abstract(参考訳): 単一高分解能超解像(SISR)は、単一の低分解能観測から構造的に忠実な高周波成分を回収することが曖昧であるため、非常に不明瞭である。
既存のエッジ対応の手法では、エッジ先行または注意枝をますます複雑なバックボーンにアタッチすることが多いが、アドホック融合は冗長性、不安定な最適化、あるいは限られた構造的利得をもたらすことが多い。
このギャップには, エッジ特徴量と中間特徴量から適応変調マップを導出するエッジ誘導型アテンション機構を用いて対処し, それらを正規化および再重み付けに応用し, 微妙なテクスチャを抑えつつ, 構造的に健全な領域を選択的に増幅する。
並行して,この機構を,画素,知覚的,対角的,対角的な用語を組み合わせた複合的目的の下で訓練された軽量な残差設計に統合し,忠実さ,知覚的リアリズム,訓練安定性のバランスをとる。
標準SISRベンチマークの広範な実験は、SRGAN、ESRGAN、およびそれ以前のエッジアテンションベースラインに対する構造的シャープネスと知覚的品質を、同等のモデル複雑さで一貫した改善を示した。
提案する定式化
(i)エッジ先行を注入するパラメータ効率のよい経路
二 仮設多目的損失による安定対外精錬、及び
(三)より深い、あるいは過度にパラメータ化された建築に頼ることなく、縁の忠実度を高めること。
これらの結果は、知覚超解像の進行におけるエッジ条件変調の原理的効果を浮き彫りにした。
関連論文リスト
- AlignVAR: Towards Globally Consistent Visual Autoregression for Image Super-Resolution [16.90182090355781]
視覚的自己回帰モデルは、次のスケールの予測を通じて安定したトレーニング、非定性推論、高忠実性合成を提供する。
しかし、その応用は未調査のままであり、局所性に偏った注意と残留性のみの監督という2つの重要な課題に直面している。
画像超解像に適した一貫した視覚自己回帰フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-28T10:39:06Z) - Iterative Inference-time Scaling with Adaptive Frequency Steering for Image Super-Resolution [75.3690742776891]
適応周波数ステアリング(IAFS)を用いた反復拡散推論時間スケーリングを提案する。
IAFSは、構造的偏差の反復的補正によって生成した画像を徐々に精細化することで、知覚品質と構造的忠実性のバランスをとるという課題に対処する。
実験の結果、IAFSは知覚と忠実性の対立を効果的に解決し、知覚の細部と構造的精度を一貫して改善し、既存の推論時間スケーリング手法よりも優れていた。
論文 参考訳(メタデータ) (2025-12-29T15:09:20Z) - Robust-R1: Degradation-Aware Reasoning for Robust Visual Understanding [54.05243949024302]
既存の堅牢なMLLMは、視覚エンコーダの一般化にのみ焦点をあてた暗黙のトレーニング/適応に依存している。
本稿では,構造的推論連鎖による視覚的劣化を明示的にモデル化する新しいフレームワークであるRobust-R1を提案する。
提案手法は, (i) 劣化を考慮した推論基盤の微調整, (ii) 劣化パラメータを正確に知覚するための報酬駆動アライメント, (iii) 劣化強度に適応した動的推論深度スケーリングの2つを統合した。
論文 参考訳(メタデータ) (2025-12-19T12:56:17Z) - Unleashing Degradation-Carrying Features in Symmetric U-Net: Simpler and Stronger Baselines for All-in-One Image Restoration [52.82397287366076]
オールインワン画像復元は、統合された枠組み内で様々な劣化(ノイズ、ぼかし、悪天候など)を扱うことを目的としている。
本研究では, 優れた特徴抽出法により, 劣化伝達情報を本質的にエンコードする, 重要な知見を明らかにする。
我々の対称設計は固有の劣化信号を頑健に保存し、スキップ接続に単純な加法融合を施す。
論文 参考訳(メタデータ) (2025-12-11T12:20:31Z) - A Saddle Point Remedy: Power of Variable Elimination in Non-convex Optimization [37.51825281790747]
ローカルなミニマではなく、サドルポイントの拡散は、機械学習の大規模非最適化における障害である。
我々は, 変動除去が, 縮小した景観において, 決定的な最大質量を根本的に再認識することを示した。
論文 参考訳(メタデータ) (2025-11-03T05:19:43Z) - ERIS: An Energy-Guided Feature Disentanglement Framework for Out-of-Distribution Time Series Classification [51.07970070817353]
理想的な時系列分類(TSC)は不変表現をキャプチャできるべきである。
現在の手法は、真に普遍的な特徴を分離するために必要な意味的な方向性を欠いている。
本稿では,シフト・ロバストネス・フレームワークのためのエンドツーエンドのエネルギー規則化情報を提案する。
論文 参考訳(メタデータ) (2025-08-19T12:13:41Z) - Rotation Equivariant Arbitrary-scale Image Super-Resolution [62.41329042683779]
任意のスケールの超解像(ASISR)は、低解像度の入力画像から任意のスケールの高分解能回復を実現することを目的としている。
本研究では, 回転同変ASISR法の構築に尽力する。
論文 参考訳(メタデータ) (2025-08-07T08:51:03Z) - Elucidating Subspace Perturbation in Zeroth-Order Optimization: Theory and Practice at Scale [33.38543010618118]
Zeroth-order (ZO) 最適化は、勾配ベースのバックプロパゲーション法に代わる有望な代替手段として登場した。
高次元性が主要なボトルネックであることを示し、サブスペースの摂動が勾配ノイズを減らし収束を加速させる方法について説明するために、テキストサブスペースアライメントの概念を導入する。
本稿では,ブロック座標降下法(MeZO-BCD)を用いた効率的なZO法を提案し,各ステップでパラメータのサブセットのみを摂動・更新する。
論文 参考訳(メタデータ) (2025-01-31T12:46:04Z) - Low-Light Video Enhancement via Spatial-Temporal Consistent Decomposition [52.89441679581216]
低照度ビデオエンハンスメント(LLVE)は、激しい視認性とノイズに悩まされる動的または静的なシーンの復元を目指している。
本稿では、ビューに依存しない、ビューに依存しないコンポーネントを組み込んだ革新的なビデオ分解戦略を提案する。
我々のフレームワークは、既存のメソッドを一貫して上回り、新しいSOTAパフォーマンスを確立します。
論文 参考訳(メタデータ) (2024-05-24T15:56:40Z) - ESSAformer: Efficient Transformer for Hyperspectral Image
Super-resolution [76.7408734079706]
単一ハイパースペクトル像超解像(単一HSI-SR)は、低分解能観測から高分解能ハイパースペクトル像を復元することを目的としている。
本稿では,1つのHSI-SRの繰り返し精製構造を持つESSA注目組込みトランスフォーマネットワークであるESSAformerを提案する。
論文 参考訳(メタデータ) (2023-07-26T07:45:14Z) - Robust Single Image Dehazing Based on Consistent and Contrast-Assisted
Reconstruction [95.5735805072852]
画像復調モデルのロバスト性を改善するための新しい密度変分学習フレームワークを提案する。
具体的には、デハジングネットワークは、一貫性の規則化されたフレームワークの下で最適化されている。
我々の手法は最先端のアプローチを大きく上回っている。
論文 参考訳(メタデータ) (2022-03-29T08:11:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。