論文の概要: USIS-PGM: Photometric Gaussian Mixtures for Underwater Salient Instance Segmentation
- arxiv url: http://arxiv.org/abs/2603.13961v2
- Date: Tue, 17 Mar 2026 02:39:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 13:19:43.855679
- Title: USIS-PGM: Photometric Gaussian Mixtures for Underwater Salient Instance Segmentation
- Title(参考訳): USIS-PGM:水中塩分分離のための測光ガウス混合
- Authors: Lin Hong, Xiangtong Yao, Mürüvvet Bozkurt, Xin Wang, Fumin Zhang,
- Abstract要約: 水中の塩分インスタンスセグメンテーション(USIS)は海洋ロボットシステムにとって不可欠である。
本稿では,USISの単一ステージフレームワークであるUSIS-PGMを提案する。
実験により提案したUSIS-PGMモデルの優位性と実用性を示した。
- 参考スコア(独自算出の注目度): 6.54166555479635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater salient instance segmentation (USIS) is crucial for marine robotic systems, as it enables both underwater salient object detection and instance-level mask prediction for visual scene understanding. Compared with its terrestrial counterpart, USIS is more challenging due to the underwater image degradation. To address this issue, this paper proposes USIS-PGM, a single-stage framework for USIS. Specifically, the encoder enhances boundary cues through a frequency-aware module and performs content-adaptive feature reweighting via a dynamic weighting module. The decoder incorporates a Transformer-based instance activation module to better distinguish salient instances. In addition, USIS-PGM employs multi-scale Gaussian heatmaps generated from ground-truth masks through Photometric Gaussian Mixture (PGM) to supervise intermediate decoder features, thereby improving salient instance localization and producing more structurally coherent mask predictions. Experimental results demonstrate the superiority and practical applicability of the proposed USIS-PGM model.
- Abstract(参考訳): USIS(In Underwater Salient instance segmentation)は、水中の塩分物体の検出と、視覚的なシーン理解のためのインスタンスレベルのマスク予測を可能にするため、海洋ロボットシステムにとって不可欠である。
地上画像と比較すると、USISは水中画像の劣化によりより困難である。
この問題に対処するため,本論文では,USISの単一ステージフレームワークであるUSIS-PGMを提案する。
具体的には、エンコーダは、周波数認識モジュールを介してバウンダリキューを強化し、動的重み付けモジュールを介してコンテンツ適応的特徴再重み付けを行う。
デコーダにはTransformerベースのインスタンスアクティベーションモジュールが組み込まれている。
さらに、USIS-PGMは、フォトメトリック・ガウシアン・ミキチャー(PGM)を介して地上のトラスマスクから生成されたマルチスケールガウシアン・ヒートマップを用いて中間デコーダの特徴を監督し、より健全なインスタンスのローカライゼーションを改善し、より構造的に一貫性のあるマスク予測を生成する。
実験により提案したUSIS-PGMモデルの優位性と実用性を示した。
関連論文リスト
- RPCANet++: Deep Interpretable Robust PCA for Sparse Object Segmentation [51.37553739930992]
RPCANet++は、RPCAの解釈可能性と効率的なディープアーキテクチャを融合したスパースオブジェクトセグメンテーションフレームワークである。
我々のアプローチは、緩やかなRPCAモデルを背景近似モジュール(BAM)、対象抽出モジュール(OEM)、画像復元モジュール(IRM)からなる構造化ネットワークに展開する。
さまざまなデータセットの実験では、RPCANet++がさまざまなイメージングシナリオの下で最先端のパフォーマンスを達成することが示されている。
論文 参考訳(メタデータ) (2025-08-06T08:19:37Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - Frequency Domain Enhanced U-Net for Low-Frequency Information-Rich Image Segmentation in Surgical and Deep-Sea Exploration Robots [34.28684917337352]
CNNと人間の視覚系における周波数帯域感度の差について検討する。
本稿では、生体視覚機構にインスパイアされたウェーブレット適応スペクトル融合(WASF)法を提案する。
我々は SAM2 のバックボーンネットワークを利用する FE-UNet モデルを開発し, セグメンテーション精度を確保するために細調整した Hiera-Large モジュールを組み込んだ。
論文 参考訳(メタデータ) (2025-02-06T07:24:34Z) - UniUIR: Considering Underwater Image Restoration as An All-in-One Learner [62.65503609562905]
我々はUniUIRと呼ばれるユニバーサル水中画像復元手法を提案する。
劣化固有の問題を分離し、UIRタスクにおける様々な劣化の相関関係を探るため、我々はMamba Mixture-of-Expertsモジュールを設計した。
このモジュールは、空間領域と周波数領域の両方において劣化前の情報を抽出し、最適なタスク固有のプロンプトを適応的に選択する。
論文 参考訳(メタデータ) (2025-01-22T16:10:42Z) - MV-Adapter: Enhancing Underwater Instance Segmentation via Adaptive Channel Attention [0.0]
MarineVision Adapter (MV-Adapter) は、各チャネルの特徴量を調整するための適応的なチャネルアテンダ機構である。
特徴を適応的に重み付けすることで、モデルは光の減衰、色の変化、複雑な背景といった課題を効果的に処理できる。
実験結果から,MV-AdapterモジュールをUSIS-SAMネットワークアーキテクチャに統合することで,モデル全体の性能が向上することが示された。
論文 参考訳(メタデータ) (2024-11-01T09:38:04Z) - WaterMamba: Visual State Space Model for Underwater Image Enhancement [17.172623370407155]
水中イメージングは、光の伝播や水中の吸収に影響を及ぼす要因によって、しばしば品質の低下に悩まされる。
画像品質を向上させるため、畳み込みニューラルネットワーク(CNN)とトランスフォーマーに基づく水中画像強調法(UIE)が提案されている。
計算複雑性と高度水中画像劣化を考慮して,UIEの線形計算複雑性を持つ状態空間モデルであるWaterMambaを提案する。
論文 参考訳(メタデータ) (2024-05-14T08:26:29Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Synergistic Multiscale Detail Refinement via Intrinsic Supervision for
Underwater Image Enhancement [39.208417033777415]
マルチステージを含む水中シーンの細部を高度化するための内在監視(SMDR-IS)を提案する。
ASISFモジュールは、多段劣化段階における特徴伝達を正確に制御し、ガイドすることができる。
Bifocal Intrinsic-Context Attention Module (BICA) は画像中のマルチスケールシーン情報を効率的に活用する。
論文 参考訳(メタデータ) (2023-08-23T05:40:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。