論文の概要: From Local Windows to Adaptive Candidates via Individualized Exploratory: Rethinking Attention for Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2601.08341v1
- Date: Tue, 13 Jan 2026 09:01:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.124941
- Title: From Local Windows to Adaptive Candidates via Individualized Exploratory: Rethinking Attention for Image Super-Resolution
- Title(参考訳): ローカルウィンドウから個別探索による適応候補へ:画像超解法に対する注意の再考
- Authors: Chunyu Meng, Wei Long, Shuhang Gu,
- Abstract要約: Single Image Super-Resolution (SISR)は、低解像度(LR)入力から高解像度(HR)画像を再構成することを目的とした、基本的なコンピュータビジョンタスクである。
フレキシブルかつトークン適応型アテンション計算を実現するために,IET(Personalized Exploratory Transformer)を提案する。
- 参考スコア(独自算出の注目度): 20.444907448992154
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single Image Super-Resolution (SISR) is a fundamental computer vision task that aims to reconstruct a high-resolution (HR) image from a low-resolution (LR) input. Transformer-based methods have achieved remarkable performance by modeling long-range dependencies in degraded images. However, their feature-intensive attention computation incurs high computational cost. To improve efficiency, most existing approaches partition images into fixed groups and restrict attention within each group. Such group-wise attention overlooks the inherent asymmetry in token similarities, thereby failing to enable flexible and token-adaptive attention computation. To address this limitation, we propose the Individualized Exploratory Transformer (IET), which introduces a novel Individualized Exploratory Attention (IEA) mechanism that allows each token to adaptively select its own content-aware and independent attention candidates. This token-adaptive and asymmetric design enables more precise information aggregation while maintaining computational efficiency. Extensive experiments on standard SR benchmarks demonstrate that IET achieves state-of-the-art performance under comparable computational complexity.
- Abstract(参考訳): Single Image Super-Resolution (SISR)は、低解像度(LR)入力から高解像度(HR)画像を再構成することを目的とした基本的なコンピュータビジョンタスクである。
変換器に基づく手法は、劣化した画像の長距離依存性をモデル化することで、優れた性能を実現している。
しかし、それらの特徴集中型注意計算は高い計算コストをもたらす。
効率を改善するために、既存のほとんどのアプローチは、画像を固定グループに分割し、各グループ内の注意を制限する。
このようなグループワイズ・アテンションはトークン類似性の固有の非対称性を見落とし、フレキシブルでトークン適応的なアテンション計算を可能にしない。
この制限に対処するために、各トークンが自身のコンテンツ認識および独立注意候補を適応的に選択できる新しい個別探索注意機構(IEA)を導入するIET(Personalized Exploratory Transformer)を提案する。
このトークン適応的で非対称な設計は、計算効率を維持しながらより正確な情報収集を可能にする。
標準SRベンチマークでの大規模な実験は、IETが同等の計算量で最先端のパフォーマンスを達成することを示した。
関連論文リスト
- Rotation Equivariant Arbitrary-scale Image Super-Resolution [62.41329042683779]
任意のスケールの超解像(ASISR)は、低解像度の入力画像から任意のスケールの高分解能回復を実現することを目的としている。
本研究では, 回転同変ASISR法の構築に尽力する。
論文 参考訳(メタデータ) (2025-08-07T08:51:03Z) - IM-LUT: Interpolation Mixing Look-Up Tables for Image Super-Resolution [21.982964666527646]
ルックアップテーブル(LUT)ベースのアプローチは、その効率と性能から関心を集めている。
既存のAISR技術は暗黙の神経表現を用いており、計算コストとメモリ要求がかなり高い。
本稿では,ASISR を動作させる新しいフレームワークである Interpolation Mixing LUT (IM-LUT) を提案する。
論文 参考訳(メタデータ) (2025-07-14T05:02:57Z) - Crafting Query-Aware Selective Attention for Single Image Super-Resolution [3.133812520659661]
SISR(Single Image Super-Resolution)は、低解像度の入力から高解像度の画像を再構成し、画像の詳細を向上する。
本稿では,クエリの類似性に基づいて,最も関連性の高いキー値ウィンドウを動的に選択するSSCANを提案する。
実験の結果、SSCANは既存のアテンションベースSISR法よりも優れており、都市データセットの最大0.14dBPSNR改善を実現していることがわかった。
論文 参考訳(メタデータ) (2025-04-09T07:17:29Z) - Efficient Visual State Space Model for Image Deblurring [99.54894198086852]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
提案したEVSSMは、ベンチマークデータセットや実世界の画像に対する最先端の手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - Transforming Image Super-Resolution: A ConvFormer-based Efficient Approach [58.57026686186709]
本稿では, Convolutional Transformer Layer (ConvFormer) を導入し, ConvFormer-based Super-Resolution Network (CFSR) を提案する。
CFSRは畳み込みベースのアプローチとトランスフォーマーベースのアプローチの両方の利点を継承する。
CFSRは計算コストと性能のバランスが最適であることを示す実験である。
論文 参考訳(メタデータ) (2024-01-11T03:08:00Z) - ESSAformer: Efficient Transformer for Hyperspectral Image
Super-resolution [76.7408734079706]
単一ハイパースペクトル像超解像(単一HSI-SR)は、低分解能観測から高分解能ハイパースペクトル像を復元することを目的としている。
本稿では,1つのHSI-SRの繰り返し精製構造を持つESSA注目組込みトランスフォーマネットワークであるESSAformerを提案する。
論文 参考訳(メタデータ) (2023-07-26T07:45:14Z) - DynaST: Dynamic Sparse Transformer for Exemplar-Guided Image Generation [56.514462874501675]
本稿では,動的スパースアテンションに基づくトランスフォーマーモデルを提案する。
このアプローチの核心は、ある位置がフォーカスすべき最適なトークン数の変化をカバーすることに特化した、新しいダイナミックアテンションユニットです。
3つの応用、ポーズ誘導型人物画像生成、エッジベース顔合成、歪みのない画像スタイル転送の実験により、DynaSTは局所的な詳細において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2022-07-13T11:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。