論文の概要: Aqua Boundary-Saliency Attention Module for Lightweight Underwater Salient Instance Segmentation Detection Transformer
- arxiv url: http://arxiv.org/abs/2606.08002v1
- Date: Sat, 06 Jun 2026 06:43:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.611962
- Title: Aqua Boundary-Saliency Attention Module for Lightweight Underwater Salient Instance Segmentation Detection Transformer
- Title(参考訳): 軽量水中塩分セグメンテーション検出変圧器のアクアバウンダリサリアンスアテンションモジュール
- Authors: M. Fazri Nizar, Julian Supardi, Muhammad Naufal Rachmatullah,
- Abstract要約: 水中のインスタンスセグメンテーションは、海洋資源探索、生態モニタリング、水中ロボット知覚のためのピクセルレベルのマスク予測とインスタンスレベルの識別を統合している。
本研究では,アクアバウンダリ・サリエンシ・アテンションモジュール(AquaBSAM)を中心に構築された小型検出・変圧器フレームワークLUSIS-DETRを紹介する。
AquaBSAMは、水中境界、コントラスト、減衰、クロマ、暗チャネル、そしてDINOv2でコーティングされたマルチスケールの特徴を、有界残留変調によって埋め込む。
- 参考スコア(独自算出の注目度): 0.41292255339309664
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater instance segmentation integrates pixel-level mask prediction and instance-level discrimination for marine resource exploration, ecological monitoring, and underwater robotic perception. Recent prompt-based and auxiliary-modality methods improve mask quality, but their reliance on large foundation models, prompt generation, or extra modality estimation complicates efficient deployment. This work introduces Lightweight Underwater Salient Instance Segmentation Detection Transformer (LUSIS-DETR), a compact detection-transformer framework built around the Aqua Boundary-Saliency Attention Module (AquaBSAM). AquaBSAM embeds underwater boundary, contrast, attenuation, chroma, dark-channel, and center-prior cues into DINOv2-initialized multi-scale features through bounded residual modulation, while auxiliary mask supervision and small-object copy-paste are training-only. Extensive evaluation on four recent underwater instance segmentation datasets, UIIS, UIIS10K, USIS10K, and USIS16K, shows competitively leading performance against previous state-of-the-art works across category-aware and salient-instance protocols. TensorRT half-precision (FP16) benchmarking on an NVIDIA T4 graphics processing unit (GPU) achieves 4.31-6.34 milliseconds (ms) latency, supporting real-time inference under an accessible reproduction setting.
- Abstract(参考訳): 水中のインスタンスセグメンテーションは、海洋資源探索、生態モニタリング、水中ロボット知覚のためのピクセルレベルのマスク予測とインスタンスレベルの識別を統合している。
最近のプロンプトベースおよび補助モダリティ手法はマスクの品質を向上させるが、大きな基礎モデル、即時生成、または余剰モダリティ推定に依存するため、効率的な展開が複雑になる。
本研究は,アクアバウンダリ・サリエンシ・アテンション・モジュール(AquaBSAM)を中心に構築されたコンパクトな検出・トランスフォーマフレームワークであるLUSIS-DETR(Lightweight Underwater Salient Instance Segmentation Detection Transformer)を紹介する。
AquaBSAMは、水中境界、コントラスト、減衰、クロマ、暗チャネル、および中心優先のキューを、有界残留変調によるDINOv2初期化マルチスケール特徴に埋め込む。
最近の4つの水中インスタンスセグメンテーションデータセット(UIIS, UIIS10K, USIS10K, USIS16K)に対する広範囲な評価は、カテゴリ認識およびサージェントインスタンスプロトコル間の従来の最先端の作業に対して競争力のあるパフォーマンスを示している。
TensorRT half-precision (FP16)ベンチマークではNVIDIA T4グラフィックス処理ユニット(GPU)が4.31-6.34ミリ秒(ms)のレイテンシを達成した。
関連論文リスト
- Expose Camouflage in the Water: Underwater Camouflaged Instance Segmentation and Dataset [76.92197418745822]
カモフラージュされたインスタンスセグメンテーション(CIS)は、周囲と密接に融合したオブジェクトを正確にセグメンテーションする際の大きな課題に直面します。
従来のカモフラージュされたインスタンスセグメンテーション法は、水中のサンプルが限られている地球上で支配的なデータセットに基づいて訓練されており、水中のシーンでは不十分な性能を示す可能性がある。
本研究は,海中カモフラージュされた海洋生物の3,953枚の画像とインスタンスレベルのアノテーションを含む,最初の水中カモフラージュされたインスタンスセグメンテーションデータセットUCIS4Kを紹介する。
論文 参考訳(メタデータ) (2025-10-20T14:34:51Z) - UIS-Mamba: Exploring Mamba for Underwater Instance Segmentation via Dynamic Tree Scan and Hidden State Weaken [57.812799861886305]
マンバは本質的に線形な複雑性と大域的受容場を持つ新興状態空間モデルである。
我々は,最初のマンバ型水中インスタンスセグメンテーションモデル UIS-Mamba を提案し,動的ツリースキャン (DTS) と隠れ状態ウィーケン (HSW) の2つの革新的なモジュールを設計した。
DTSモジュールは、パッチを動的にオフセットしスケールさせることで、インスタンスオブジェクトの内部機能の継続性を維持する。
HSWモジュールは複雑なバックグラウンドの干渉を抑制し、状態伝播の情報フローをインスタンス自体に効果的に焦点を合わせる。
論文 参考訳(メタデータ) (2025-08-01T08:21:24Z) - Advancing Marine Research: UWSAM Framework and UIIS10K Dataset for Precise Underwater Instance Segmentation [110.02397462607449]
大規模な水中インスタンスセグメンテーションデータセットであるUIIS10Kを提案する。
次に,水中インスタンスの自動・高精度セグメンテーションのための効率的なモデルであるUWSAMを紹介する。
複数の水中インスタンスデータセット上での最先端手法よりも優れた性能向上を実現し,本モデルの有効性を示す。
論文 参考訳(メタデータ) (2025-05-21T14:36:01Z) - Diving into Underwater: Segment Anything Model Guided Underwater Salient Instance Segmentation and A Large-scale Dataset [60.14089302022989]
水中視覚タスクは複雑な水中状況のため、しばしばセグメンテーションの精度が低い。
第1次大規模水中塩分分節データセット(USIS10K)を構築した。
本研究では,水中ドメインに特化してセグメンツ・ア・シング・モデル(USIS-SAM)に基づく水中塩分・インスタンス・アーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-06-10T06:17:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。