Fugu-MT 論文翻訳(概要): Learning Enriched Features via Selective State Spaces Model for Efficient Image Deblurring

論文の概要: Learning Enriched Features via Selective State Spaces Model for Efficient Image Deblurring

arxiv url: http://arxiv.org/abs/2403.20106v2
Date: Fri, 5 Apr 2024 10:29:00 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-08 18:06:16.480190
Title: Learning Enriched Features via Selective State Spaces Model for Efficient Image Deblurring
Title（参考訳）: 効率的な画像分解のための選択状態空間モデルによるリッチな特徴の学習
Authors: Hu Gao, Depeng Dang,
Abstract要約: Image Deblurringは、高品質な画像を、それに対応するぼやけた画像から復元することを目的としている。本稿では、選択状態空間モデルを利用して、リッチで正確な特徴を集約する効率的な画像デブロアリングネットワークを提案する。実験により,提案手法は広く用いられているベンチマークにおいて,最先端の手法よりも優れていることが示された。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Image deblurring aims to restore a high-quality image from its corresponding blurred. The emergence of CNNs and Transformers has enabled significant progress. However, these methods often face the dilemma between eliminating long-range degradation perturbations and maintaining computational efficiency. While the selective state space model (SSM) shows promise in modeling long-range dependencies with linear complexity, it also encounters challenges such as local pixel forgetting and channel redundancy. To address this issue, we propose an efficient image deblurring network that leverages selective state spaces model to aggregate enriched and accurate features. Specifically, we introduce an aggregate local and global information block (ALGBlock) designed to effectively capture and integrate both local invariant properties and non-local information. The ALGBlock comprises two primary modules: a module for capturing local and global features (CLGF), and a feature aggregation module (FA). The CLGF module is composed of two branches: the global branch captures long-range dependency features via a selective state spaces model, while the local branch employs simplified channel attention to model local connectivity, thereby reducing local pixel forgetting and channel redundancy. In addition, we design a FA module to accentuate the local part by recalibrating the weight during the aggregation of the two branches for restoration. Experimental results demonstrate that the proposed method outperforms state-of-the-art approaches on widely used benchmarks.
Abstract（参考訳）: Image Deblurringは、高品質な画像を、それに対応するぼやけた画像から復元することを目的としている。 CNNとTransformersの出現は、大きな進歩をもたらした。しかし、これらの手法は、長距離劣化摂動を排除し、計算効率を維持するというジレンマに直面することが多い。選択状態空間モデル(SSM)は、線形複雑性を伴う長距離依存のモデリングにおいて有望であるが、局所画素の忘れやチャネルの冗長性といった問題にも遭遇する。この問題に対処するために、選択状態空間モデルを利用して、リッチで正確な特徴を集約する効率的な画像デブロアリングネットワークを提案する。具体的には,局所的不変性と非局所的情報の両方を効果的に捕捉・統合するために,局所的およびグローバルな情報ブロック(ALGBlock)を導入する。 ALGBlockは、ローカル機能とグローバル機能(CLGF)をキャプチャするモジュールと、機能集約モジュール(FA)の2つの主要なモジュールから構成されている。 CLGFモジュールは2つのブランチで構成されており、グローバルブランチは選択された状態空間モデルを介して長距離依存機能をキャプチャし、ローカルブランチは単純化されたチャネルアテンションを使用してローカル接続をモデル化し、ローカルピクセルの忘れとチャネル冗長性を低減している。さらに,2つの枝の集合時の重みを補正し,局所的な部分のアクセント付けを行うFAモジュールを設計した。実験により,提案手法は広く用いられているベンチマークにおいて,最先端の手法よりも優れていることが示された。

関連論文リスト

Efficient Image Super-Resolution with Multi-Scale Spatial Adaptive Attention Networks [3.4782736103257323]
本稿では,マルチスケール空間適応注意ネットワーク(MSAAN)と呼ばれる,軽量画像超解像(SR)ネットワークを提案する。提案手法のコアとなるのは,局所的な細部と長期のコンテキスト依存性を協調的にモデル化する,マルチスケール空間適応型注意モジュール(MSAA)である。
論文参考訳（メタデータ） (2026-02-22T07:47:39Z)
UAGLNet: Uncertainty-Aggregated Global-Local Fusion Network with Cooperative CNN-Transformer for Building Extraction [83.48950950780554]
リモートセンシング画像からの抽出は、複雑な構造変化のために難しい課題である。既存の方法は、セグメンテーションモデルにおけるマルチスケール特徴をキャプチャするために、畳み込みブロックまたは自己アテンションブロックを使用する。高品質なグローバルローカルなビジュアルセマンティクスを活用するために,不確実性集約型グローバルローカルフュージョンネットワーク(UAGLNet)を提案する。
論文参考訳（メタデータ） (2025-12-15T02:59:16Z)
RelayFormer: A Unified Local-Global Attention Framework for Scalable Image and Video Manipulation Localization [50.75654397516163]
様々な解像度とモダリティに対応する統一フレームワークであるRelayFormerを提案する。 RelayFormerは、入力を固定サイズのサブイメージに分割し、Global-Local Relay(GLR)トークンを導入する。これにより、セマンティックや時間的一貫性などのグローバルなキューを効率よく交換でき、きめ細かいアーティファクトを保存できる。
論文参考訳（メタデータ） (2025-08-13T03:35:28Z)
SAMamba: Adaptive State Space Modeling with Hierarchical Vision for Infrared Small Target Detection [12.964308630328688]
赤外線小目標検出(ISTD)は、軍事・海上・早期警戒用途における長距離監視に不可欠である。 ISTDは画像の0.15%未満のターゲットと複雑な背景との識別性が低いターゲットによって挑戦されている。本稿では,SAM2の階層的特徴学習とMambaの選択的シーケンスモデリングを統合した新しいフレームワークSAMambaを提案する。
論文参考訳（メタデータ） (2025-05-29T07:55:23Z)
Any Image Restoration via Efficient Spatial-Frequency Degradation Adaptation [158.37640586809187]
劣化した画像を1つのモデルで効率的に復元することは、ますます重要になっている。我々のアプローチはAnyIRと呼ばれ、様々な劣化にまたがる固有の類似性を活用する統一された経路をとっています。劣化認識と文脈的注意を融合させるため,空間周波数並列融合戦略を提案する。
論文参考訳（メタデータ） (2025-04-19T09:54:46Z)
SEM-Net: Efficient Pixel Modelling for image inpainting with Spatially Enhanced SSM [11.447968918063335]
画像の塗装は、画像の既知の領域の情報に基づいて、部分的に損傷した画像の修復を目的としている。 SEM-Netは、新しいビジュアル・ステート・スペース・モデル(SSM)ビジョン・ネットワークであり、画像の劣化をピクセルレベルでモデル化し、状態空間における長距離依存(LRD)をキャプチャする。
論文参考訳（メタデータ） (2024-11-10T00:35:14Z)
MambaMIC: An Efficient Baseline for Microscopic Image Classification with State Space Models [12.182070604073585]
本研究では,顕微鏡画像分類(MIC)タスクのための視覚バックボーンであるMambaMICを提案する。具体的には,MambaMIC Blockというローカル・グローバルなデュアルブランチアグリゲーションモジュールを紹介する。局所的な分岐では、局所的な畳み込みを用いて画素類似性を捉え、局所的な画素の忘れと知覚の増強を緩和する。グローバルブランチでは、SSMはグローバル依存関係を抽出し、Locally Aware Enhanced Filterはチャネルの冗長性とローカルピクセルの忘れを低減します。
論文参考訳（メタデータ） (2024-09-12T10:01:33Z)
LoFormer: Local Frequency Transformer for Image Deblurring [12.032239441930306]
局所周波数変換器(LoFormer)と呼ばれる新しい手法を導入する。 LoFormerの各ユニットに、周波数領域(Freq-LC)にローカルチャネル対応SAを組み込み、低周波および高周波のローカルウィンドウ内の相互共分散を同時にキャプチャする。実験の結果,126G FLOPsのGoProデータセット上でPSNR34.09dBを達成することにより,LoFormerは画像劣化タスクの性能を著しく向上することが示された。
論文参考訳（メタデータ） (2024-07-24T04:27:03Z)
Emphasizing Crucial Features for Efficient Image Restoration [6.204240924744974]
画像復元のための様々な領域の劣化度に適応する枠組みを提案する。具体的には、修復の重要な特徴を強調するために、空間的・周波数的注意機構(SFAM)を設計する。また、上述のコンポーネントをU字型のバックボーンに統合して高品質な画像の復元を行うECFNetを提案する。
論文参考訳（メタデータ） (2024-05-19T07:04:05Z)
Spatial-Aware Token for Weakly Supervised Object Localization [137.0570026552845]
タスク固有の空間認識トークンを,弱教師付き方式で条件定位に提案する。実験の結果、SATはCUB-200とImageNetの両方で、98.45%と73.13%のGT-known Locで最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (2023-03-18T15:38:17Z)
Spatially-Adaptive Feature Modulation for Efficient Image Super-Resolution [90.16462805389943]
視覚変換器(ViT)のようなブロック上に,空間適応型特徴変調(SAFM)機構を開発する。提案法は最先端のSR法よりも3倍程度小さい。
論文参考訳（メタデータ） (2023-02-27T14:19:31Z)
DuAT: Dual-Aggregation Transformer Network for Medical Image Segmentation [21.717520350930705]
トランスフォーマーベースのモデルはコンピュータビジョンタスクで成功することが広く実証されている。しかし、それらはしばしば大きなパターンの特徴によって支配され、局所的な詳細が失われる。本稿では、2つの革新的な設計を特徴とするDuATと呼ばれるDual-Aggregation Transformer Networkを提案する。大腸内視鏡画像における皮膚病変像とポリープの分画における最先端の手法よりも優れていた。
論文参考訳（メタデータ） (2022-12-21T07:54:02Z)
Cross-modal Local Shortest Path and Global Enhancement for Visible-Thermal Person Re-Identification [2.294635424666456]
本稿では,局所的特徴とグローバル的特徴の同時学習に基づく2ストリームネットワークであるCM-LSP-GE(Cross-modal Local Shortest Path and Global Enhancement)モジュールを提案する。 2つの典型的なデータセットの実験結果は、我々のモデルは明らかに最先端の手法よりも優れていることを示している。
論文参考訳（メタデータ） (2022-06-09T10:27:22Z)
CM-GAN: Image Inpainting with Cascaded Modulation GAN and Object-Aware Training [112.96224800952724]
複雑な画像に大きな穴をあける際の可視像構造を生成するためのカスケード変調GAN(CM-GAN)を提案する。各デコーダブロックにおいて、まず大域変調を適用し、粗い意味認識合成構造を行い、次に大域変調の出力に空間変調を適用し、空間適応的に特徴写像を更に調整する。さらに,ネットワークがホール内の新たな物体を幻覚させるのを防ぐため,実世界のシナリオにおける物体除去タスクのニーズを満たすために,オブジェクト認識型トレーニングスキームを設計する。
論文参考訳（メタデータ） (2022-03-22T16:13:27Z)
Layout-to-Image Translation with Double Pooling Generative Adversarial Networks [76.83075646527521]
入力レイアウトからフォトリアリスティックでセマンティックに一貫性のある結果を生成するための新しいDouble Pooing GAN(DPGAN)を提案する。また,角形プールモジュール (SPM) と矩形プールモジュール (RPM) からなる新しい二重プールモジュール (DPM) を提案する。
論文参考訳（メタデータ） (2021-08-29T19:55:14Z)
Global Aggregation then Local Distribution for Scene Parsing [99.1095068574454]
提案手法は,エンドツーエンドのトレーニング可能なブロックとしてモジュール化され,既存のセマンティックセグメンテーションネットワークに容易に接続可能であることを示す。私たちのアプローチでは、Cityscapes、ADE20K、Pascal Context、Camvid、COCO-stuffといった主要なセマンティックセグメンテーションベンチマークに基づいて、新しい最先端の技術を構築できます。
論文参考訳（メタデータ） (2021-07-28T03:46:57Z)
Image Super-Resolution with Cross-Scale Non-Local Attention and Exhaustive Self-Exemplars Mining [66.82470461139376]
本稿では,再帰型ニューラルネットワークに統合されたCS-NLアテンションモジュールを提案する。新しいCS-NLと局所的および非局所的非局所的前駆体を強力な再帰核融合セルで組み合わせることで、単一の低分解能画像内でよりクロススケールな特徴相関を見出すことができる。
論文参考訳（メタデータ） (2020-06-02T07:08:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。