Fugu-MT 論文翻訳(概要): Burst Image Super-Resolution via Multi-Cross Attention Encoding and Multi-Scan State-Space Decoding

論文の概要: Burst Image Super-Resolution via Multi-Cross Attention Encoding and Multi-Scan State-Space Decoding

arxiv url: http://arxiv.org/abs/2505.19668v1
Date: Mon, 26 May 2025 08:24:33 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-27 16:58:43.276118
Title: Burst Image Super-Resolution via Multi-Cross Attention Encoding and Multi-Scan State-Space Decoding
Title（参考訳）: マルチクロスアテンション符号化とマルチスキャン状態空間復号によるバースト画像超解法
Authors: Tengda Huang, Yu Zhang, Tianren Li, Yufu Qu, Fulin Liu, Zhenzhong Wei,
Abstract要約: マルチイメージ・スーパーレゾリューション(MISR)は、シングルイメージ・スーパーレゾリューション(SISR)よりも高画質を実現することができる新たに設計された2つの注意機構を組み込んだ特徴抽出器を提案する。
参考スコア（独自算出の注目度）: 2.859229448115905
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Multi-image super-resolution (MISR) can achieve higher image quality than single-image super-resolution (SISR) by aggregating sub-pixel information from multiple spatially shifted frames. Among MISR tasks, burst super-resolution (BurstSR) has gained significant attention due to its wide range of applications. Recent methods have increasingly adopted Transformers over convolutional neural networks (CNNs) in super-resolution tasks, due to their superior ability to capture both local and global context. However, most existing approaches still rely on fixed and narrow attention windows that restrict the perception of features beyond the local field. This limitation hampers alignment and feature aggregation, both of which are crucial for high-quality super-resolution. To address these limitations, we propose a novel feature extractor that incorporates two newly designed attention mechanisms: overlapping cross-window attention and cross-frame attention, enabling more precise and efficient extraction of sub-pixel information across multiple frames. Furthermore, we introduce a Multi-scan State-Space Module with the cross-frame attention mechanism to enhance feature aggregation. Extensive experiments on both synthetic and real-world benchmarks demonstrate the superiority of our approach. Additional evaluations on ISO 12233 resolution test charts further confirm its enhanced super-resolution performance.
Abstract（参考訳）: マルチイメージ・スーパー解像度(MISR)は、複数の空間シフトフレームからサブピクセル情報を集約することで、シングルイメージ・スーパー解像度(SISR)よりも高い画質を実現することができる。 MISRタスクの中で、バースト超解像(BurstSR)は幅広い用途で注目されている。最近の手法では、ローカルとグローバルの両方のコンテキストをキャプチャする能力が優れているため、超高解像度タスクにおいて、畳み込みニューラルネットワーク(CNN)よりもトランスフォーマーを採用する傾向にある。しかし、既存のほとんどのアプローチは依然として、局所的な領域を超えた特徴の知覚を制限する固定された、狭い注意窓に依存している。この制限ハッパーのアライメントと特徴アグリゲーションはどちらも高品質の超解像に不可欠である。これらの制約に対処するため,複数フレームにまたがるサブピクセル情報のより正確かつ効率的な抽出を可能にする,クロスウィンドウアテンションとクロスフレームアテンションという,新たに設計された2つのアテンション機構を組み込んだ特徴抽出器を提案する。さらに、機能集約を強化するために、クロスフレームアテンション機構を備えたマルチスキャンステートスペースモジュールを導入する。人工ベンチマークと実世界のベンチマークの両方における大規模な実験は、我々のアプローチの優位性を実証している。 ISO 12233の分解能試験チャートのさらなる評価により、その超解像性能がさらに向上したことが確認された。

関連論文リスト

A Fusion-Guided Inception Network for Hyperspectral Image Super-Resolution [4.487807378174191]
我々はFusion-Guided Inception Network (FGIN)と呼ばれる単一画像の超解像モデルを提案する。具体的には、まずスペクトル空間融合モジュールを用いて、スペクトル情報と空間情報を効果的に統合する。インセプションのような階層的特徴抽出戦略は、マルチスケール空間依存をキャプチャするために用いられる。再構成品質をさらに向上するため,バイリニアと奥行き分離可能な畳み込みを組み合わせた最適化されたアップサンプリングモジュールを組み込んだ。
論文参考訳（メタデータ） (2025-05-06T11:15:59Z)
QMambaBSR: Burst Image Super-Resolution with Query State Space Model [55.56075874424194]
バースト超解像度は、複数のバースト低解像度フレームからサブピクセル情報を融合することにより、高画質でよりリッチな細部で高解像度の画像を再構成することを目的としている。 BusrtSRにおいて鍵となる課題は、高周波ノイズ障害を同時に抑制しつつ、ベースフレームの補完的なサブピクセルの詳細を抽出することである。本稿では,Query State Space Model (QSSM) とAdaptive Up-Sampling Module (AdaUp) を組み合わせた新しいQuery Mamba Burst Super-Resolution (QMambaBSR) ネットワークを紹介する。
論文参考訳（メタデータ） (2024-08-16T11:15:29Z)
Gated Multi-Resolution Transfer Network for Burst Restoration and Enhancement [75.25451566988565]
低画質の原画像のバーストから空間的精度の高い高画質画像を再構成する新しいGated Multi-Resolution Transfer Network (GMTNet)を提案する。 5つのデータセットに関する詳細な実験分析は、我々のアプローチを検証し、バースト超解像、バーストデノイング、低照度バーストエンハンスメントのための最先端技術を設定する。
論文参考訳（メタデータ） (2023-04-13T17:54:00Z)
Cross-View Hierarchy Network for Stereo Image Super-Resolution [14.574538513341277]
ステレオ画像スーパーレゾリューションは、ビュー間の相補的な情報を活用することにより、高解像度ステレオ画像ペアの品質を向上させることを目的としている。ステレオ画像超解法(CVHSSR)のためのクロスビュー階層ネットワーク(Cross-View-Hierarchy Network)という新しい手法を提案する。 CVHSSRは、パラメータを減らしながら、他の最先端手法よりも最高のステレオ画像超解像性能を達成する。
論文参考訳（メタデータ） (2023-04-13T03:11:30Z)
CiaoSR: Continuous Implicit Attention-in-Attention Network for Arbitrary-Scale Image Super-Resolution [158.2282163651066]
本稿ではCiaoSRと呼ばれる連続的な暗黙の注意-注意ネットワークを提案する。我々は、周辺地域の特徴のアンサンブル重みを学習するために、暗黙の注意ネットワークを明示的に設計する。我々は、この暗黙の注意ネットワークにスケールアウェアの注意を埋め込んで、追加の非ローカル情報を活用する。
論文参考訳（メタデータ） (2022-12-08T15:57:46Z)
Decoupled-and-Coupled Networks: Self-Supervised Hyperspectral Image Super-Resolution with Subpixel Fusion [67.35540259040806]
サブピクセルレベルのHS超解像フレームワークを提案する。名前が示すように、DC-Netはまず入力を共通(またはクロスセンサー)とセンサー固有のコンポーネントに分離する。我々は,CSUネットの裏側に自己教師付き学習モジュールを付加し,素材の整合性を保証し,復元されたHS製品の詳細な外観を向上する。
論文参考訳（メタデータ） (2022-05-07T23:40:36Z)
Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文参考訳（メタデータ） (2022-04-19T17:59:45Z)
Fusformer: A Transformer-based Fusion Approach for Hyperspectral Image Super-resolution [9.022005574190182]
低分解能ハイパースペクトル像と高分解能マルチスペクトル像を融合させるトランスフォーマーに基づくネットワークを設計する。 LR-HSIは主スペクトル構造を持つため、ネットワークは空間的詳細推定に重点を置いている。様々な実験と品質指標は、他の最先端手法と比較して、我々のアプローチの優位性を示している。
論文参考訳（メタデータ） (2021-09-05T14:00:34Z)
Deep Burst Super-Resolution [165.90445859851448]
バースト超解像タスクのための新しいアーキテクチャを提案する。我々のネットワークは複数のノイズRAW画像を入力として取り出し、出力として分解された超解像RGB画像を生成する。実世界のデータのトレーニングと評価を可能にするため,BurstSRデータセットも導入する。
論文参考訳（メタデータ） (2021-01-26T18:57:21Z)
Cross-MPI: Cross-scale Stereo for Image Super-Resolution using Multiplane Images [44.85260985973405]
Cross-MPIは、新しい平面対応MPI機構、マルチスケールガイドアップサンプリングモジュール、超高分解能合成・融合モジュールからなるエンドツーエンドのRefSRネットワークである。デジタル合成および光ズームクロススケールデータによる実験結果から,Cross-MPIフレームワークは既存のRefSR手法よりも優れた性能が得られることが示された。
論文参考訳（メタデータ） (2020-11-30T09:14:07Z)
Multi-image Super Resolution of Remotely Sensed Images using Residual Feature Attention Deep Neural Networks [1.3764085113103222]
本研究は,マルチイメージ超解像課題に効果的に取り組む新しい残像注意モデル(RAMS)を提案する。本研究では,3次元畳み込みによる視覚特徴の注意機構を導入し,意識的なデータ融合と情報抽出を実現する。我々の表現学習ネットワークは、冗長な低周波信号を流すためにネストした残差接続を広範囲に利用している。
論文参考訳（メタデータ） (2020-07-06T22:54:02Z)
Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文参考訳（メタデータ） (2020-03-15T11:04:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。