Fugu-MT 論文翻訳(概要): FreqMamba: Viewing Mamba from a Frequency Perspective for Image Deraining

論文の概要: FreqMamba: Viewing Mamba from a Frequency Perspective for Image Deraining

arxiv url: http://arxiv.org/abs/2404.09476v1
Date: Mon, 15 Apr 2024 06:02:31 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-16 13:19:30.807550
Title: FreqMamba: Viewing Mamba from a Frequency Perspective for Image Deraining
Title（参考訳）: FreqMamba: 画像レイニングの周波数視点からMambaを見る
Authors: Zou Zhen, Yu Hu, Zhao Feng,
Abstract要約: 雨害による画像の劣化は、知覚に欠かせない周波数情報を失うことが多く、画像の劣化はこの問題を解決することを目的としている。近年の研究では、マンバのグローバルおよびローカル情報知覚の有効性と効率性が確認されている。本稿では,マンバと周波数解析の相補性を利用して画像デライニングを行う,効率的かつ効率的なパラダイムであるFreqMambaを提案する。
参考スコア（独自算出の注目度）: 1.6793052475826054
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Images corrupted by rain streaks often lose vital frequency information for perception, and image deraining aims to solve this issue which relies on global and local degradation modeling. Recent studies have witnessed the effectiveness and efficiency of Mamba for perceiving global and local information based on its exploiting local correlation among patches, however, rarely attempts have been explored to extend it with frequency analysis for image deraining, limiting its ability to perceive global degradation that is relevant to frequency modeling (e.g. Fourier transform). In this paper, we propose FreqMamba, an effective and efficient paradigm that leverages the complementary between Mamba and frequency analysis for image deraining. The core of our method lies in extending Mamba with frequency analysis from two perspectives: extending it with frequency-band for exploiting frequency correlation, and connecting it with Fourier transform for global degradation modeling. Specifically, FreqMamba introduces complementary triple interaction structures including spatial Mamba, frequency band Mamba, and Fourier global modeling. Frequency band Mamba decomposes the image into sub-bands of different frequencies to allow 2D scanning from the frequency dimension. Furthermore, leveraging Mamba's unique data-dependent properties, we use rainy images at different scales to provide degradation priors to the network, thereby facilitating efficient training. Extensive experiments show that our method outperforms state-of-the-art methods both visually and quantitatively.
Abstract（参考訳）: 雨害による画像の劣化は、知覚に欠かせない周波数情報を失うことが多く、画像のデライン化は、グローバルおよび局所的な劣化モデリングに依存するこの問題を解決することを目的としている。近年の研究では、パッチ間の局所的相関を利用して、グローバルおよびローカルな情報を知覚するためのMambaの有効性と効率が指摘されているが、画像デラリニングの周波数解析による拡張の試みは稀であり、周波数モデリング(例えばフーリエ変換)に関連するグローバルな劣化を知覚する能力が制限されている。本稿では,マンバと周波数解析の相補性を利用した画像デライニングの効率的かつ効率的なパラダイムであるFreqMambaを提案する。本手法のコアとなるのは,周波数相関を利用する周波数帯域の拡張と,大域的劣化モデリングのためのフーリエ変換の2つの観点からの周波数解析によるマンバの拡張である。具体的には、FreqMambaは空間マンバ、周波数帯域マンバ、フーリエグローバルモデリングなどの相補的な3重相互作用構造を導入している。周波数帯域のMambaは、画像を異なる周波数のサブバンドに分解し、周波数次元から2Dスキャンを可能にする。さらに、Mambaのユニークなデータ依存特性を活用して、異なるスケールの雨画像を用いて、ネットワークに先立って劣化をもたらすことにより、効率的なトレーニングを容易にする。広汎な実験により,本手法は視覚的,定量的に最先端の手法より優れていることが示された。

関連論文リスト

Interactive Spatial-Frequency Fusion Mamba for Multi-Modal Image Fusion [69.13852939945433]
MMIF(Multi-Modal Image Fusion)は、異なるモダリティの画像を組み合わせて融合画像を作成することを目的としている。 MMIFのための対話型空間周波数フュージョン・マンバフレームワークを提案する。私たちのISFMは、他の最先端手法よりも優れたパフォーマンスを実現できます。
論文参考訳（メタデータ） (2026-02-04T10:35:55Z)
Traffic Image Restoration under Adverse Weather via Frequency-Aware Mamba [37.901352525347214]
本稿では,周波数対応マンバ(FAMamba)を提案する。このフレームワークは,周波数誘導とシーケンスモデリングを統合し,効率的な画像復元を実現する。本アーキテクチャは,(1)双方向2次元周波数適応走査による局所的相互作用を強化するDual-Branch Feature extract Block (DFEB) と,(2)ウェーブレットに基づく高周波数残差学習によりテクスチャの詳細を洗練するPreside-Guided Block (PGB) の2つのキーコンポーネントから構成される。
論文参考訳（メタデータ） (2025-12-03T14:50:20Z)
SSFMamba: Symmetry-driven Spatial-Frequency Feature Fusion for 3D Medical Image Segmentation [40.740193362371734]
3次元医用画像分割のためのシンメトリー駆動型空間周波数特徴融合ネットワークであるSSFMambaを提案する。 SSFMambaは、空間領域と周波数領域の両方から特徴を抽出する補完的な二重ブランチアーキテクチャを採用している。周波数領域分岐では、マンバの異常な能力を利用して、グローバルな文脈情報を抽出する。
論文参考訳（メタデータ） (2025-08-05T04:36:04Z)
Frequency Domain-Based Diffusion Model for Unpaired Image Dehazing [92.61216319417208]
そこで本稿では,未確認データにおける有益な知識を十分に活用するための,新しい周波数領域ベース拡散モデルを提案する。拡散モデル(DM)が示す強い生成能力に着想を得て,周波数領域再構成の観点からデハージング課題に取り組む。
論文参考訳（メタデータ） (2025-07-02T01:22:46Z)
Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.40450475728792]
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (2025-05-25T12:23:10Z)
FMNet: Frequency-Assisted Mamba-Like Linear Attention Network for Camouflaged Object Detection [7.246630480680039]
カモフラージュ対象物検出(COD)は、カモフラージュ対象物とその周囲の強い類似性のために困難である。既存の手法は主に空間的局所的特徴に依存しており、グローバルな情報を捉えていない。これを解決するために、FMNet ( Frequency-Assisted Mamba-Like Linear Attention Network) を提案する。
論文参考訳（メタデータ） (2025-03-14T02:55:19Z)
FE-UNet: Frequency Domain Enhanced U-Net with Segment Anything Capability for Versatile Image Segmentation [50.9040167152168]
CNNのコントラスト感度関数を実験的に定量化し,人間の視覚システムと比較した。本稿ではウェーブレット誘導分光ポーリングモジュール(WSPM)を提案する。人間の視覚系をさらにエミュレートするために、周波数領域拡張受容野ブロック(FE-RFB)を導入する。本研究では,SAM2 をバックボーンとし,Hiera-Large を事前学習ブロックとして組み込んだ FE-UNet を開発した。
論文参考訳（メタデータ） (2025-02-06T07:24:34Z)
DiMSUM: Diffusion Mamba -- A Scalable and Unified Spatial-Frequency Method for Image Generation [4.391439322050918]
拡散モデルのための新しい状態空間アーキテクチャを提案する。入力画像の局所的特徴に対する帰納バイアスを高めるために,空間情報と周波数情報を利用する。
論文参考訳（メタデータ） (2024-11-06T18:59:17Z)
A Hybrid Transformer-Mamba Network for Single Image Deraining [70.64069487982916]
既存のデラリング変換器では、固定レンジウィンドウやチャネル次元に沿って自己アテンション機構を採用している。本稿では,多分岐型トランスフォーマー・マンバネットワーク(Transformer-Mamba Network,TransMamba Network,Transformer-Mamba Network)を提案する。
論文参考訳（メタデータ） (2024-08-31T10:03:19Z)
DemMamba: Alignment-free Raw Video Demoireing with Frequency-assisted Spatio-Temporal Mamba [18.06907326360215]
2つの同様の反復パターンの干渉によるモアレパターンは、画面上の画像やビデオのキャプチャ中に頻繁に観察される。本稿では,周波数アシスト型マンバを用いたアライメントレス生ビデオ復調ネットワークを提案する。提案するDemMambaはPSNRで1.3dBの最先端手法を超越し,良好な視覚体験を提供する。
論文参考訳（メタデータ） (2024-08-20T09:31:03Z)
Adaptive Frequency Enhancement Network for Single Image Deraining [10.64622976628013]
本稿では,単一画像のデライニングに特化して,新しいエンドツーエンド適応周波数拡張ネットワーク(AFENet)を提案する。我々は、異なるスケールの畳み込みを用いて、画像周波数帯域を適応的に分解し、特徴拡張モジュールを導入し、新しい相互作用モジュールを示す。このアプローチにより,多様で複雑な降雨パターンを排除し,画像の細部を正確に再構築することが可能になる。
論文参考訳（メタデータ） (2024-07-19T13:24:05Z)
Frequency Guidance Matters: Skeletal Action Recognition by Frequency-Aware Mixed Transformer [18.459822172890473]
骨格の周波数表現を除去するための周波数認識型アテンションモジュールを提案する。また、周波数特徴を持つ空間特徴を組み込む混合変圧器アーキテクチャも開発している。 FreqMiXFormerは3つの一般的な骨格認識データセットでSOTAを上回っている。
論文参考訳（メタデータ） (2024-07-17T05:47:27Z)
FourierMamba: Fourier Learning Integration with State Space Models for Image Deraining [71.46369218331215]
Image derainingは雨が降る画像から雨の跡を取り除き、透明な背景を復元することを目的としている。本稿では,FourierMambaという新しいフレームワークを提案する。
論文参考訳（メタデータ） (2024-05-29T18:58:59Z)
Frequency-Aware Deepfake Detection: Improving Generalizability through Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文参考訳（メタデータ） (2024-03-12T01:28:00Z)
Masked Frequency Modeling for Self-Supervised Visual Pre-Training [102.89756957704138]
MFM(Masked Frequency Modeling)は、視覚モデルの自己教師付き事前学習のための統合周波数領域に基づくアプローチである。 MFMはまず入力画像の周波数成分の一部をマスクアウトし、周波数スペクトルの欠落周波数を予測する。 MFMは初めて、ViTとCNNの両方で、単純な非シームフレームワークは、以下のものを使って意味のある表現を学習できることを示した。
論文参考訳（メタデータ） (2022-06-15T17:58:30Z)
Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文参考訳（メタデータ） (2022-03-27T14:25:52Z)
WaveFill: A Wavelet-based Generation Network for Image Inpainting [57.012173791320855]
WaveFillはウェーブレットベースの塗装ネットワークで、画像を複数の周波数帯域に分解する。 WaveFillは、空間情報を自然に保存する離散ウェーブレット変換(DWT)を用いて画像を分解する。低周波帯にL1再構成損失を、高周波帯に敵対損失を施し、それによって周波数間紛争を効果的に軽減する。
論文参考訳（メタデータ） (2021-07-23T04:44:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。