論文の概要: MambaDSF: Multi-Scale SSM with Dilated Feature Fusion for Sonar Small Target Detection
- arxiv url: http://arxiv.org/abs/2605.24928v1
- Date: Sun, 24 May 2026 08:14:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.515684
- Title: MambaDSF: Multi-Scale SSM with Dilated Feature Fusion for Sonar Small Target Detection
- Title(参考訳): MambaDSF:Sonar Small Target DetectionのためのDilated Feature Fusionを用いたマルチスケールSSM
- Authors: Hui Lin, Jiayi Li, Jing Wang, Shenghui Rong,
- Abstract要約: 小さいターゲットは、画素のカバー不足、音響コントラストの低さ、画像範囲のあいまいさのため、検出が難しいままである。
この手紙は、これらの制限に対処するハイブリッドフレームワークであるMamba Dilated-Scale Fusion (MambaDSF)を提案する。
MambaDSFはUATDの前向きソナーのベンチマークで91.5%のmAP50を達成し、28.7百万のパラメータを持つ。
- 参考スコア(独自算出の注目度): 8.504127970224703
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sonar imaging is the primary modality for underwater target detection, yet small targets remain difficult to detect due to insufficient pixel coverage, low acoustic contrast, and scale ambiguity across imaging ranges. CNN-based detectors extract local features efficiently but cannot suppress noise-induced false alarms without global acoustic context. Transformer-based methods capture long-range dependencies at quadratic computational cost. Existing Mamba-based vision models offer efficient linear-cost scanning but lack multi-scale semantic alignment across pyramid levels, multi-receptive-field fusion, and small-target-aware training supervision needed for reliable sonar detection. This letter proposes Mamba Dilated-Scale Fusion (MambaDSF), a hybrid framework addressing these limitations through three contributions: a Mamba Enhanced Feature Pyramid (MambaEFP) backbone that jointly captures local echo cues and global acoustic context at linear complexity; a Dilate Fusion Mamba (DFMamba) encoder that enforces multi-scale feature alignment across pyramid levels; and Scale-Adaptive Weighted IoU (SA-WIoU) and Cross-Scale Coherence (CSC) losses that stabilize small-target training. MambaDSF achieves 91.5% mAP50 on the UATD forward-looking sonar benchmark with 28.7 million parameters, surpassing all compared detectors. On a small-target subset the gain reached +2.2 percentage points, and cross-domain evaluation on FLS and MD-FLS confirms the generalization of the proposed architecture. The codes are publicly available at https://github.com/IDontKnowAAA/MambaDSF.
- Abstract(参考訳): ソナーイメージングは水中での標的検出の主要なモダリティであるが、画素のカバー不足、音響コントラストの低さ、画像範囲のあいまいさのため、小さなターゲットの検出は困難である。
CNNベースの検出器は、局所的な特徴を効率的に抽出するが、大域的な音環境がなければ、ノイズによる誤報を抑えることはできない。
トランスフォーマーベースの手法は、2次計算コストで長距離依存関係をキャプチャする。
既存のMambaベースの視覚モデルは、効率的な線形コストスキャンを提供するが、ピラミッドレベル全体にわたるマルチスケールセマンティックアライメント、マルチレセプティブフィールド融合、信頼性の高いソナー検出に必要な小さなターゲット・アウェア・トレーニング・インスペクションが欠如している。
この書簡では,これらの制限に対処するハイブリッドフレームワークであるMamba Dilated-Scale Fusion (MambaDSF)を提案する。Mamba Enhanced Feature Pyramid (MambaEFP) バックボーンは,局所エコーキューと大域音響コンテキストを線形複雑度で同時キャプチャし,Dilate Fusion Mamba (DFMamba) エンコーダはピラミッドレベルのマルチスケール機能アライメントを強制し,Scale-Adaptive Weighted IoU (SA-WIoU) と Cross-Scale Coherence (CSC) は,小ターゲットトレーニングを安定化させる。
MambaDSFはUATDの前向きソナーのベンチマークで91.5%のmAP50を達成し、28.7百万のパラメータを持つ。
小ターゲットのサブセットではゲインは+2.2パーセンテージに達し、FLSとMD-FLSのクロスドメイン評価によって提案されたアーキテクチャの一般化が確認される。
コードはhttps://github.com/IDontKnowAAA/MambaDSFで公開されている。
関連論文リスト
- Pyramidal Adaptive Cross-Gating for Multimodal Detection [0.0]
PACGNetは、バックボーン内で深い融合を実行するように設計されたアーキテクチャである。
Pモジュールは、プログレッシブ階層的ゲーティング機構を通じて特徴階層を再構築する。
私たちのPACGNetは、mAP50スコアがそれぞれ81.7%と82.1%という、最先端のベンチマークを新たに設定しています。
論文 参考訳(メタデータ) (2025-12-20T09:32:18Z) - DEPFusion: Dual-Domain Enhancement and Priority-Guided Mamba Fusion for UAV Multispectral Object Detection [6.4402018224356015]
DEPFusionというフレームワークがUAVマルチスペクトル物体検出のために提案されている。
デュアルドメイン強化(DDE)と優先誘導マンバ核融合(PGMF)から構成される。
DroneVehicleとVEDAIデータセットの実験は、DEPFusionが最先端の手法で優れたパフォーマンスを達成することを実証している。
論文 参考訳(メタデータ) (2025-09-09T01:51:57Z) - HiFi-Mamba: Dual-Stream W-Laplacian Enhanced Mamba for High-Fidelity MRI Reconstruction [5.899756063964437]
High-Fidelity Mamba (HiFi-Mamba)はMRI再構成のための新しいデュアルストリームMambaベースのアーキテクチャである。
HiFi-Mambaは、最先端のCNNベース、Transformerベース、およびその他のMambaベースモデルよりも、再現精度が優れている。
論文 参考訳(メタデータ) (2025-08-07T10:08:18Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [92.4205087439928]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基盤モデルとの遅延空間アライメントによるクロスモーダルな知識伝達を確立し、データ不足を効果的に軽減する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
この組み合わせのアプローチにより、FUSEはターゲットデータセットに対する軽量デコーダ適応のみを必要とするユニバーサルなイメージイベントを構築することができる。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - DualMamba: A Lightweight Spectral-Spatial Mamba-Convolution Network for Hyperspectral Image Classification [10.329381824237434]
本稿では,HSI分類のための軽量なデュアルストリームマンバ畳み込みネットワーク(DualMamba)を提案する。
具体的には,グローバルおよび局所スペクトル空間の特徴を抽出するために,並列軽量なMambaブロックとCNNブロックを開発した。
現状のHSI分類法と比較して、DualMambaが有意な分類精度を達成することを示す実験結果が得られた。
論文 参考訳(メタデータ) (2024-06-11T08:26:42Z) - Fusion-Mamba for Cross-modality Object Detection [63.56296480951342]
異なるモダリティから情報を融合するクロスモダリティは、オブジェクト検出性能を効果的に向上させる。
We design a Fusion-Mamba block (FMB) to map cross-modal features into a hidden state space for interaction。
提案手法は,m3FD$が5.9%,FLIRデータセットが4.9%,m3FD$が5.9%である。
論文 参考訳(メタデータ) (2024-04-14T05:28:46Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。