Fugu-MT 論文翻訳(概要): Learning Dynamic Structural Specialization for Underwater Salient Object Detection

論文の概要: Learning Dynamic Structural Specialization for Underwater Salient Object Detection

arxiv url: http://arxiv.org/abs/2605.15535v1
Date: Fri, 15 May 2026 02:14:10 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-19 03:45:13.150605
Title: Learning Dynamic Structural Specialization for Underwater Salient Object Detection
Title（参考訳）: 水中塩性物体検出のための動的構造特化学習
Authors: Lin Hong, Chenhui Wang, Linan Deng, Yuning Cui, Yu Zhang, Xin Wang, Bojian Zhang, Wenqi Ren, Xingchen Yang, Fumin Zhang,
Abstract要約: 水中サルエント物体検出(USOD)は、水中の視覚的シーン理解と視覚誘導型ロボット応用に注目が集まっている。本稿では,動的構造特化に基づく新しいRGBベースUSOD法であるDSS-USODを提案する。 DSS-USODは、単一の水中画像から共有ベース表現を抽出し、それを境界感性と領域コヒーレントな構造特徴に分解し、局所的な構造的文脈に応じてそれらの寄与を動的に調整する。
参考スコア（独自算出の注目度）: 44.667623434444074
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Underwater salient object detection (USOD) has attracted increasing attention for underwater visual scene understanding and vision-guided robotic applications. However, existing USOD methods still struggle with underwater image degradations, which often lead to inaccurate object localization, fragmented salient regions, and coarse boundary prediction. To address these challenges, this paper proposes DSS-USOD, a novel RGB-based USOD method built upon dynamic structural specialization. DSS-USOD extracts a shared base representation from a single underwater image, decomposes it into boundary-sensitive and region-coherent structural features, and dynamically coordinates their contributions according to local structural context. Specifically, the extracted shared base representation is decomposed into a boundary-sensitive branch for modeling fine-grained boundary details and a region-coherent branch for capturing region-level structural consistency. A spatial coordination module is then introduced to adaptively regulate the relative contributions of the two branches according to local structural context. Moreover, cooperative structural supervision is introduced to promote branch specialization and stabilize spatial coordination, enabling DSS-USOD to better balance boundary precision and region coherence under degraded underwater conditions. Extensive experiments show that DSS-USOD achieves superior performance on benchmark datasets. Finally, real-world deployment on an underwater robot validates the practical effectiveness of DSS-USOD for underwater object inspection.
Abstract（参考訳）: 水中サルエント物体検出(USOD)は、水中の視覚的シーン理解と視覚誘導型ロボット応用に注目が集まっている。しかし、既存のUSOD法はまだ水中画像の劣化に苦慮しており、不正確な物体の局在、断片化された塩分領域、粗い境界予測につながることが多い。これらの課題に対処するために,動的構造特化に基づく新しいRGBベースUSOD法であるDSS-USODを提案する。 DSS-USODは、単一の水中画像から共有ベース表現を抽出し、それを境界感性と領域コヒーレントな構造特徴に分解し、局所的な構造的文脈に応じてそれらの寄与を動的に調整する。具体的には、抽出した共有基底表現を、きめ細かな境界の詳細をモデル化するための境界感性分岐と、領域レベルの構造一貫性を捉えるための領域コヒーレント分岐に分解する。次に空間調整モジュールを導入し、局所的構造的文脈に応じて2つの枝の相対的寄与を適応的に制御する。さらに,DSS-USODが水中の劣化条件下で境界精度と領域コヒーレンスをよりよくバランスさせることにより,枝の特殊化と空間的調整の安定化を図るために,協調的な構造管理が導入された。大規模な実験により、DSS-USODはベンチマークデータセット上で優れたパフォーマンスを達成することが示された。最後に,水中ロボットへの実世界展開により,水中物体検査におけるDSS-USODの有効性が検証された。

関連論文リスト

Layout-Guided Controllable Pathology Image Generation with In-Context Diffusion Transformers [57.54843029965778]
制御可能な病理画像合成には、空間配置、組織形態、意味的詳細の信頼できる規制が必要である。 In-Context Diffusion Transformer (IC-DiT) は,空間レイアウト,テキスト記述,視覚的埋め込みを統合拡散変換器に組み込んだレイアウト認識生成モデルである。 IC-DiTは既存の方法よりも忠実度が高く、空間制御性が強く、診断の整合性が良くなる。
論文参考訳（メタデータ） (2026-03-11T06:14:11Z)
High-Resolution Underwater Camouflaged Object Detection: GBU-UCOD Dataset and Topology-Aware and Frequency-Decoupled Networks [32.76569239634241]
本稿では,位相認識モデルと周波数分離認識を統合した新しいフレームワークを提案する。 DeepTopo-Netは、特に複雑な水中パターンの形態的整合性を維持する上で、最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2026-02-03T14:41:27Z)
Dynamic Topology Awareness: Breaking the Granularity Rigidity in Vision-Language Navigation [22.876516699004814]
VLN-CE(Vision-Language Navigation in Continuous Environments)は、高レベルの言語命令を正確で安全で長期の空間行動に基礎付けるという、中核的な課題を提示している。露骨なトポロジカルマップは、そのようなタスクにおいて堅牢な空間記憶を提供するための重要な解決策であることが証明されている。既存のトポロジカルプランニング手法は、"Granularity Rigidity"問題に悩まされている。本研究では,動的トポロジカルナビゲーションのためのフレームワークであるDGNavを提案する。
論文参考訳（メタデータ） (2026-01-29T14:06:23Z)
Harmonizing the Deep: A Unified Information Pipeline for Robust Marine Biodiversity Assessment Across Heterogeneous Domains [0.769971486557519]
この研究は、北極と大西洋の海洋生態系を対象とする多年にわたる侵略的な種モニタリングイニシアチブの基礎的な検出層を確立する。異種データセットを同等の情報フローに標準化する統一情報パイプラインを開発した。シーン構成やオブジェクト密度,コンテキスト冗長性などの構造的要因から,ドメイン間の性能損失が説明できる。
論文参考訳（メタデータ） (2026-01-20T13:51:55Z)
A Spatial Semantics and Continuity Perception Attention for Remote Sensing Water Body Change Detection [7.111688480237728]
水体変化検出(WBCD)のための空間分解能3m以上の新しいデータセットHSRW-CDを提案する。空間意味と連続知覚モジュールは、WBCDネットワークにおける空間意味と深い特徴の構造の両方を完全に活用するように設計されている。提案したSSCPには,マルチセマンティック空間注意(MSA),構造関係認識グローバル注意(SRGA),チャネルワイド自己注意(CSA)の3つの構成要素がある。
論文参考訳（メタデータ） (2025-11-20T08:30:05Z)
Expose Camouflage in the Water: Underwater Camouflaged Instance Segmentation and Dataset [76.92197418745822]
カモフラージュされたインスタンスセグメンテーション(CIS)は、周囲と密接に融合したオブジェクトを正確にセグメンテーションする際の大きな課題に直面します。従来のカモフラージュされたインスタンスセグメンテーション法は、水中のサンプルが限られている地球上で支配的なデータセットに基づいて訓練されており、水中のシーンでは不十分な性能を示す可能性がある。本研究は,海中カモフラージュされた海洋生物の3,953枚の画像とインスタンスレベルのアノテーションを含む,最初の水中カモフラージュされたインスタンスセグメンテーションデータセットUCIS4Kを紹介する。
論文参考訳（メタデータ） (2025-10-20T14:34:51Z)
MARIS: Marine Open-Vocabulary Instance Segmentation with Geometric Enhancement and Semantic Alignment [56.88334234553316]
我々は,水中オープンボキャブラリ(OV)セグメンテーションのための大規模なベンチマークであるtextbfMARIS (underlineMarine Open-Vocabulary underlineInstance underlineSegmentation)を紹介した。当社のフレームワークは、既存のOVベースラインであるIn-DomainとCross-Domainの両方を一貫して上回ります。
論文参考訳（メタデータ） (2025-10-17T07:50:58Z)
VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文参考訳（メタデータ） (2025-05-02T12:21:44Z)
Decomposition-based Unsupervised Domain Adaptation for Remote Sensing Image Semantic Segmentation [30.606689882397223]
非教師なし領域適応(UDA)技術は、地球科学のセマンティックセグメンテーションに不可欠である。高レベルの特徴空間におけるドメインアライメントに焦点を当てた既存のUDA手法の多くは、局所的な空間的詳細とグローバルな文脈的意味論を同時に維持するのに苦労している。ドメイン不変表現学習を導くための新しい分解手法を提案する。
論文参考訳（メタデータ） (2024-04-06T07:13:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。