論文の概要: High-Resolution Underwater Camouflaged Object Detection: GBU-UCOD Dataset and Topology-Aware and Frequency-Decoupled Networks
- arxiv url: http://arxiv.org/abs/2602.03591v1
- Date: Tue, 03 Feb 2026 14:41:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.51784
- Title: High-Resolution Underwater Camouflaged Object Detection: GBU-UCOD Dataset and Topology-Aware and Frequency-Decoupled Networks
- Title(参考訳): 高分解能水中カモフラージュ物体検出:GBU-UCODデータセットとトポロジ対応・周波数分離ネットワーク
- Authors: Wenji Wu, Shuo Ye, Yiyu Liu, Jiguang He, Zhuo Wang, Zitong Yu,
- Abstract要約: 本稿では,位相認識モデルと周波数分離認識を統合した新しいフレームワークを提案する。
DeepTopo-Netは、特に複雑な水中パターンの形態的整合性を維持する上で、最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 32.76569239634241
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater Camouflaged Object Detection (UCOD) is a challenging task due to the extreme visual similarity between targets and backgrounds across varying marine depths. Existing methods often struggle with topological fragmentation of slender creatures in the deep sea and the subtle feature extraction of transparent organisms. In this paper, we propose DeepTopo-Net, a novel framework that integrates topology-aware modeling with frequency-decoupled perception. To address physical degradation, we design the Water-Conditioned Adaptive Perceptor (WCAP), which employs Riemannian metric tensors to dynamically deform convolutional sampling fields. Furthermore, the Abyssal-Topology Refinement Module (ATRM) is developed to maintain the structural connectivity of spindly targets through skeletal priors. Specifically, we first introduce GBU-UCOD, the first high-resolution (2K) benchmark tailored for marine vertical zonation, filling the data gap for hadal and abyssal zones. Extensive experiments on MAS3K, RMAS, and our proposed GBU-UCOD datasets demonstrate that DeepTopo-Net achieves state-of-the-art performance, particularly in preserving the morphological integrity of complex underwater patterns. The datasets and codes will be released at https://github.com/Wuwenji18/GBU-UCOD.
- Abstract(参考訳): 水中カモフラージュ物体検出(UCOD)は、様々な海洋深度にわたる標的と背景の視覚的類似性のために難しい課題である。
既存の方法は、深海での細い生物のトポロジカルな断片化と、透明な生物の微妙な特徴抽出にしばしば苦労する。
本稿では,位相認識モデルと周波数分離認識を統合した新しいフレームワークであるDeepTopo-Netを提案する。
物理劣化に対処するために, リーマン計量テンソルを用いて, 畳み込みサンプリング場を動的に変形させるWCAP(Water-Conditioned Adaptive Perceptor)を設計する。
さらに,Abyssal-Topology Refinement Module (ATRM) は骨格前駆体を介してスピン目標の構造的接続を維持するために開発された。
具体的には,GBU-UCODを初めて紹介する。これは,海面垂直偏差に合わせた最初の高分解能(2K)ベンチマークで,ハダルゾーンとアビッサルゾーンのデータギャップを埋める。
MAS3K,RMAS,および提案したGBU-UCODデータセットの大規模な実験により,DeepTopo-Netは,特に複雑な水中パターンの形態的整合性を維持する上で,最先端の性能を発揮することが示された。
データセットとコードはhttps://github.com/Wuwenji18/GBU-UCODで公開される。
関連論文リスト
- Dynamic Topology Awareness: Breaking the Granularity Rigidity in Vision-Language Navigation [22.876516699004814]
VLN-CE(Vision-Language Navigation in Continuous Environments)は、高レベルの言語命令を正確で安全で長期の空間行動に基礎付けるという、中核的な課題を提示している。
露骨なトポロジカルマップは、そのようなタスクにおいて堅牢な空間記憶を提供するための重要な解決策であることが証明されている。
既存のトポロジカルプランニング手法は、"Granularity Rigidity"問題に悩まされている。
本研究では,動的トポロジカルナビゲーションのためのフレームワークであるDGNavを提案する。
論文 参考訳(メタデータ) (2026-01-29T14:06:23Z) - UDPNet: Unleashing Depth-based Priors for Robust Image Dehazing [77.10640210751981]
UDPNetは、大規模で事前訓練された深度推定モデルDepthAnything V2から深度に基づく事前情報を活用する一般的なフレームワークである。
提案手法は,様々なシナリオにまたがる深度認識デハージングのための新しいベンチマークを確立する。
論文 参考訳(メタデータ) (2026-01-11T13:29:02Z) - APGNet: Adaptive Prior-Guided for Underwater Camouflaged Object Detection [22.097955383220143]
本研究では,水中環境下でカモフラージュされた物体を検出するために,APGNet(Adaptive Prior-Guided Network)を提案する。
APGNetは、ロバスト性と検出精度を高めるために、シームズアーキテクチャと新しい事前誘導機構を統合する。
提案手法は,広く用いられている評価基準の下で,15の最先端手法より優れていた。
論文 参考訳(メタデータ) (2025-10-14T01:51:44Z) - SLENet: A Guidance-Enhanced Network for Underwater Camouflaged Object Detection [22.78768403870293]
UCODタスクと、このドメイン用に設計されたベンチマークデータセットであるDeepCamoを紹介する。
また,UCODの新しいフレームワークであるセマンティック・ローカライゼーション・エンハンスメント・ネットワーク(SLENet)を提案する。
DeepCamoデータセットと3つのベンチマークCODデータセットの実験により、SLENetのSOTAメソッドよりも優れたパフォーマンスが確認された。
論文 参考訳(メタデータ) (2025-09-04T00:44:32Z) - Underwater Monocular Metric Depth Estimation: Real-World Benchmarks and Synthetic Fine-Tuning with Vision Foundation Models [0.0]
実世界の水中データセットを用いたゼロショットおよび微調整単分子メートル法深度推定モデルのベンチマークを示す。
その結果,地上データ(実データや合成データ)に基づいて訓練した大規模モデルでは,水中での作業は不十分であることがわかった。
本研究では,水中における単分子距離深度推定の詳細な評価と可視化を行う。
論文 参考訳(メタデータ) (2025-07-02T21:06:39Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - DepthFormer: Exploiting Long-Range Correlation and Local Information for
Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。
我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。
提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文 参考訳(メタデータ) (2022-03-27T05:03:56Z) - Dense Attention Fluid Network for Salient Object Detection in Optical
Remote Sensing Images [193.77450545067967]
光リモートセンシング画像(RSI)における有意物体検出のためのエンド・ツー・エンドDense Attention Fluid Network(DAFNet)を提案する。
GCA(Global Context-Aware Attention)モジュールは、長距離の意味的関係を適応的にキャプチャするために提案される。
我々は、2000枚の画像とピクセルワイドなサリエンシアノテーションを含むSODのための新しい、挑戦的な光学RSIデータセットを構築した。
論文 参考訳(メタデータ) (2020-11-26T06:14:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。