論文の概要: FMNet: Frequency-Assisted Mamba-Like Linear Attention Network for Camouflaged Object Detection
- arxiv url: http://arxiv.org/abs/2503.11030v1
- Date: Fri, 14 Mar 2025 02:55:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-17 13:09:04.050966
- Title: FMNet: Frequency-Assisted Mamba-Like Linear Attention Network for Camouflaged Object Detection
- Title(参考訳): FMNet:カモフラージュ物体検出のための周波数支援マンバ様リニアアテンションネットワーク
- Authors: Ming Deng, Sijin Sun, Zihao Li, Xiaochuan Hu, Xing Wu,
- Abstract要約: カモフラージュ対象物検出(COD)は、カモフラージュ対象物とその周囲の強い類似性のために困難である。
既存の手法は主に空間的局所的特徴に依存しており、グローバルな情報を捉えていない。
これを解決するために、FMNet ( Frequency-Assisted Mamba-Like Linear Attention Network) を提案する。
- 参考スコア(独自算出の注目度): 7.246630480680039
- License:
- Abstract: Camouflaged Object Detection (COD) is challenging due to the strong similarity between camouflaged objects and their surroundings, which complicates identification. Existing methods mainly rely on spatial local features, failing to capture global information, while Transformers increase computational costs.To address this, the Frequency-Assisted Mamba-Like Linear Attention Network (FMNet) is proposed, which leverages frequency-domain learning to efficiently capture global features and mitigate ambiguity between objects and the background. FMNet introduces the Multi-Scale Frequency-Assisted Mamba-Like Linear Attention (MFM) module, integrating frequency and spatial features through a multi-scale structure to handle scale variations while reducing computational complexity. Additionally, the Pyramidal Frequency Attention Extraction (PFAE) module and the Frequency Reverse Decoder (FRD) enhance semantics and reconstruct features. Experimental results demonstrate that FMNet outperforms existing methods on multiple COD datasets, showcasing its advantages in both performance and efficiency. Code available at https://anonymous.4open.science/r/FMNet-3CE5.
- Abstract(参考訳): カモフラージュ対象物検出(COD)は、カモフラージュ対象物とその周囲の密接な類似性のため困難であり、識別が複雑である。
既存の手法は主に空間的局所的特徴に依存し,グローバルな情報をキャプチャできないのに対して,トランスフォーマーは計算コストを増大させるが,これに対応するために,周波数領域学習を活用してグローバルな特徴を効率的に把握し,対象と背景のあいまいさを軽減するFMNetを提案する。
FMNetはマルチスケール周波数支援のMamba-Like Linear Attention (MFM)モジュールを導入し、マルチスケール構造を通じて周波数と空間の特徴を統合し、スケールの変動を処理し、計算複雑性を低減した。
さらに、ピラミッド周波数アテンション抽出(PFAE)モジュールと周波数逆デコーダ(FRD)はセマンティクスを強化し、特徴を再構築する。
実験の結果、FMNetは複数のCODデータセット上で既存の手法よりも優れており、性能と効率の両面で優位性を示している。
コードはhttps://anonymous.4open.science/r/FMNet-3CE5で公開されている。
関連論文リスト
- Spatial and Frequency Domain Adaptive Fusion Network for Image Deblurring [0.0]
Image Deblurringは、対応するぼやけた画像から潜むシャープなイメージを再構築することを目的としている。
本稿では、この制限に対応するために、空間周波数領域適応核融合ネットワーク(SFAFNet)を提案する。
我々のSFAFNetは、一般的に使用されているベンチマークにおける最先端のアプローチと比較して好意的に機能する。
論文 参考訳(メタデータ) (2025-02-20T02:43:55Z) - FE-UNet: Frequency Domain Enhanced U-Net with Segment Anything Capability for Versatile Image Segmentation [50.9040167152168]
CNNのコントラスト感度関数を実験的に定量化し,人間の視覚システムと比較した。
本稿ではウェーブレット誘導分光ポーリングモジュール(WSPM)を提案する。
人間の視覚系をさらにエミュレートするために、周波数領域拡張受容野ブロック(FE-RFB)を導入する。
本研究では,SAM2 をバックボーンとし,Hiera-Large を事前学習ブロックとして組み込んだ FE-UNet を開発した。
論文 参考訳(メタデータ) (2025-02-06T07:24:34Z) - Accelerated Multi-Contrast MRI Reconstruction via Frequency and Spatial Mutual Learning [50.74383395813782]
本稿では,周波数・空間相互学習ネットワーク(FSMNet)を提案する。
提案したFSMNetは, 加速度係数の異なるマルチコントラストMR再構成タスクに対して, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-09-21T12:02:47Z) - Frequency-Spatial Entanglement Learning for Camouflaged Object Detection [34.426297468968485]
既存の手法では、複雑な設計で空間的特徴の識別能力を最大化することにより、画素類似性の影響を減らそうとしている。
本稿では,周波数領域と空間領域の表現を共同で探索し,周波数空間の絡み合い学習(FSEL)手法を提案する。
我々の実験は、広く使われている3つのデータセットにおける包括的量的および質的比較を通じて、21以上の最先端手法によるFSELの優位性を実証した。
論文 参考訳(メタデータ) (2024-09-03T07:58:47Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - Adaptive Frequency Filters As Efficient Global Token Mixers [100.27957692579892]
適応周波数フィルタは効率的なグローバルトークンミキサーとして機能することを示す。
我々は、AFFNetと呼ばれる軽量ニューラルネットワークを構築するために、AFFトークンミキサーを主要なニューラルネットワークとして捉えています。
論文 参考訳(メタデータ) (2023-07-26T07:42:28Z) - MSFA-Frequency-Aware Transformer for Hyperspectral Images Demosaicing [15.847332787718852]
本稿では,MSFA対応変圧器ネットワーク(FDM-Net)を新たに提案する。
Maformerの利点は、データに存在するMSFA情報と非ローカル依存関係を活用することができることである。
実験の結果、FDM-Netは6dB PSNRで最先端の手法より優れており、高忠実度の詳細を再構築することに成功した。
論文 参考訳(メタデータ) (2023-03-23T16:27:30Z) - Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。
我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-27T14:25:52Z) - Deep Frequency Filtering for Domain Generalization [55.66498461438285]
Deep Neural Networks(DNN)は、学習プロセスにおいて、いくつかの周波数成分を優先する。
本稿では、ドメイン一般化可能な特徴を学習するためのDeep Frequency Filtering (DFF)を提案する。
提案したDFFをベースラインに適用すると,ドメインの一般化タスクにおける最先端の手法よりも優れることを示す。
論文 参考訳(メタデータ) (2022-03-23T05:19:06Z) - FMNet: Latent Feature-wise Mapping Network for Cleaning up Noisy
Micro-Doppler Spectrogram [2.9849405664643585]
ノイズの多い環境は、マイクロドップラー分光器の解釈不能な動きパターンを引き起こす。
レーダーの帰還は しばしば マルチパス 乱雑 干渉に悩まされる
本稿では,FMNet (Feature Mapping Network) と呼ばれる潜在機能対応マッピング手法を提案する。
論文 参考訳(メタデータ) (2021-07-09T19:20:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。