論文の概要: UIS-Mamba: Exploring Mamba for Underwater Instance Segmentation via Dynamic Tree Scan and Hidden State Weaken
- arxiv url: http://arxiv.org/abs/2508.00421v1
- Date: Fri, 01 Aug 2025 08:21:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-04 18:08:53.797252
- Title: UIS-Mamba: Exploring Mamba for Underwater Instance Segmentation via Dynamic Tree Scan and Hidden State Weaken
- Title(参考訳): UIS-Mamba: 動的ツリースキャンと隠れ状態ウェケンによる水中インスタンスセグメンテーションのためのMamba探索
- Authors: Runmin Cong, Zongji Yu, Hao Fang, Haoyan Sun, Sam Kwong,
- Abstract要約: マンバは本質的に線形な複雑性と大域的受容場を持つ新興状態空間モデルである。
我々は,最初のマンバ型水中インスタンスセグメンテーションモデル UIS-Mamba を提案し,動的ツリースキャン (DTS) と隠れ状態ウィーケン (HSW) の2つの革新的なモジュールを設計した。
DTSモジュールは、パッチを動的にオフセットしスケールさせることで、インスタンスオブジェクトの内部機能の継続性を維持する。
HSWモジュールは複雑なバックグラウンドの干渉を抑制し、状態伝播の情報フローをインスタンス自体に効果的に焦点を合わせる。
- 参考スコア(独自算出の注目度): 57.812799861886305
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater Instance Segmentation (UIS) tasks are crucial for underwater complex scene detection. Mamba, as an emerging state space model with inherently linear complexity and global receptive fields, is highly suitable for processing image segmentation tasks with long sequence features. However, due to the particularity of underwater scenes, there are many challenges in applying Mamba to UIS. The existing fixed-patch scanning mechanism cannot maintain the internal continuity of scanned instances in the presence of severely underwater color distortion and blurred instance boundaries, and the hidden state of the complex underwater background can also inhibit the understanding of instance objects. In this work, we propose the first Mamba-based underwater instance segmentation model UIS-Mamba, and design two innovative modules, Dynamic Tree Scan (DTS) and Hidden State Weaken (HSW), to migrate Mamba to the underwater task. DTS module maintains the continuity of the internal features of the instance objects by allowing the patches to dynamically offset and scale, thereby guiding the minimum spanning tree and providing dynamic local receptive fields. HSW module suppresses the interference of complex backgrounds and effectively focuses the information flow of state propagation to the instances themselves through the Ncut-based hidden state weakening mechanism. Experimental results show that UIS-Mamba achieves state-of-the-art performance on both UIIS and USIS10K datasets, while maintaining a low number of parameters and computational complexity. Code is available at https://github.com/Maricalce/UIS-Mamba.
- Abstract(参考訳): 水中インスタンスセグメンテーション(UIS)タスクは、水中の複雑なシーン検出に不可欠である。
Mambaは、本質的に線形な複雑性と大域的受容場を持つ新興状態空間モデルであり、長いシーケンス特徴を持つ画像分割タスクの処理に非常に適している。
しかし、水中シーンの特殊性のため、UISにマンバを適用するには多くの課題がある。
既存の固定パッチスキャン機構は、水中色歪みやぼやけたインスタンス境界の存在下でスキャンされたインスタンスの内部連続性を維持することができず、複雑な水中背景の隠蔽状態は、インスタンスオブジェクトの理解を阻害する。
本研究では,マンバをベースとした水中インスタンスセグメンテーションモデルUIS-Mambaを提案し,動的ツリースキャン(DTS)と隠れ状態ウィーケン(HSW)という2つの革新的なモジュールを設計して,マンバを水中タスクに移行する。
DTSモジュールは、パッチの動的オフセットとスケールを可能にし、最小のスパンニングツリーを誘導し、動的局所受容フィールドを提供することにより、インスタンスオブジェクトの内部機能の継続性を維持する。
HSWモジュールは複雑なバックグラウンドの干渉を抑制し、Ncutベースの隠れ状態弱化機構を通じて、状態伝播の情報フローをインスタンス自体に効果的に焦点を合わせる。
実験の結果,UIS-Mamba は UIIS と USIS10K のデータセット上で,低いパラメータ数と計算複雑性を維持しながら,最先端のパフォーマンスを実現していることがわかった。
コードはhttps://github.com/Maricalce/UIS-Mamba.comで入手できる。
関連論文リスト
- A2Mamba: Attention-augmented State Space Models for Visual Recognition [45.68176825375723]
本稿では,トランスフォーマー-マンバハイブリッドネットワークアーキテクチャであるA2Mambaを提案する。
A2SSMのキーステップは、空間的にSSMの隠された状態を集約することで、異種交叉アテンションを実行する。
私たちのA2Mambaは、視覚認識タスクにおいて、以前のConvNet-、Transformer-、およびMambaベースのアーキテクチャよりも優れています。
論文 参考訳(メタデータ) (2025-07-22T14:17:08Z) - Tree-Mamba: A Tree-Aware Mamba for Underwater Monocular Depth Estimation [85.17735565146106]
水中単眼深度推定(UMDE)は水中劣化画像から高精度深度マップを推定することを目的とした重要な課題である。
我々は,水中の劣化画像から正確な単分子深度マップを推定するための,木を意識した新しいマンバ手法であるTree-Mambaを開発した。
海底深度推定ベンチマーク (BlueDepth) を構築し, 深度ラベルが信頼できる海底画像ペア38,162枚を構築した。
論文 参考訳(メタデータ) (2025-07-10T12:10:51Z) - UWSAM: Segment Anything Model Guided Underwater Instance Segmentation and A Large-scale Benchmark Dataset [62.00529957144851]
大規模な水中インスタンスセグメンテーションデータセットであるUIIS10Kを提案する。
次に,水中インスタンスの自動・高精度セグメンテーションのための効率的なモデルであるUWSAMを紹介する。
複数の水中インスタンスデータセット上での最先端手法よりも優れた性能向上を実現し,本モデルの有効性を示す。
論文 参考訳(メタデータ) (2025-05-21T14:36:01Z) - RD-UIE: Relation-Driven State Space Modeling for Underwater Image Enhancement [59.364418120895]
水中画像強調(UIE)は、海洋視覚応用のための重要な前処理ステップである。
実効UIE(RD-UIE)のための新しい関係駆動型マンバフレームワークを開発した。
水中強化ベンチマークの実験では、RD-UIEは最先端のアプローチであるWMambaよりも優れていた。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - DefMamba: Deformable Visual State Space Model [65.50381013020248]
我々はDefMambaと呼ばれる新しい視覚基盤モデルを提案する。
変形性スキャン(DS)戦略を組み合わせることで、画像構造を学習し、オブジェクトの細部の変化を検出する能力を大幅に向上する。
多くの実験により、DefMambaは様々な視覚的タスクで最先端のパフォーマンスを達成することが示されている。
論文 参考訳(メタデータ) (2025-04-08T08:22:54Z) - PPMamba: A Pyramid Pooling Local Auxiliary SSM-Based Model for Remote Sensing Image Semantic Segmentation [1.5136939451642137]
本稿では,CNN と Mamba を統合し,セマンティックセグメンテーションタスクを実現する新しいネットワークである Pyramid Pooling Mamba (PPMamba) を提案する。
PPMambaは最先端のモデルに比べて競争力がある。
論文 参考訳(メタデータ) (2024-09-10T08:08:50Z) - Mamba-UIE: Enhancing Underwater Images with Physical Model Constraint [6.2101866921752285]
水中画像強調(UIE)では、畳み込みニューラルネットワーク(CNN)は長距離依存関係のモデリングに固有の制限がある。
本研究では,物理モデルによる制約に基づく水中画像強調フレームワークであるMamba-UIEを提案する。
提案したMamba-UIEは既存の最先端手法よりも優れており,PSNRは27.13で,SSIMは0.93である。
論文 参考訳(メタデータ) (2024-07-27T13:22:10Z) - Diving into Underwater: Segment Anything Model Guided Underwater Salient Instance Segmentation and A Large-scale Dataset [60.14089302022989]
水中視覚タスクは複雑な水中状況のため、しばしばセグメンテーションの精度が低い。
第1次大規模水中塩分分節データセット(USIS10K)を構築した。
本研究では,水中ドメインに特化してセグメンツ・ア・シング・モデル(USIS-SAM)に基づく水中塩分・インスタンス・アーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-06-10T06:17:33Z) - MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models [56.37780601189795]
本稿では,WSI分析のためのフレームワークMamMILを提案する。
私たちは各WSIを非指向グラフとして表現します。
マンバが1次元シーケンスしか処理できない問題に対処するために、トポロジ対応の走査機構を提案する。
論文 参考訳(メタデータ) (2024-03-08T09:02:13Z) - SVAM: Saliency-guided Visual Attention Modeling by Autonomous Underwater
Robots [16.242924916178282]
本稿では,自律型水中ロボットの視覚的注意モデル(SVAM)に対する総合的なアプローチを提案する。
提案するSVAM-Netは,様々なスケールの深部視覚的特徴を統合し,自然水中画像に有効なSOD(Salient Object Detection)を実現する。
論文 参考訳(メタデータ) (2020-11-12T08:17:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。