論文の概要: SLENet: A Guidance-Enhanced Network for Underwater Camouflaged Object Detection
- arxiv url: http://arxiv.org/abs/2509.03786v2
- Date: Fri, 05 Sep 2025 01:54:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 12:28:42.593627
- Title: SLENet: A Guidance-Enhanced Network for Underwater Camouflaged Object Detection
- Title(参考訳): SLENet:水中カモフラージュ物体検出のためのガイダンス強化ネットワーク
- Authors: Xinxin Huang, Han Sun, Ningzhong Liu, Huiyu Zhou, Yinan Yao,
- Abstract要約: UCODタスクと、このドメイン用に設計されたベンチマークデータセットであるDeepCamoを紹介する。
また,UCODの新しいフレームワークであるセマンティック・ローカライゼーション・エンハンスメント・ネットワーク(SLENet)を提案する。
DeepCamoデータセットと3つのベンチマークCODデータセットの実験により、SLENetのSOTAメソッドよりも優れたパフォーマンスが確認された。
- 参考スコア(独自算出の注目度): 22.78768403870293
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Underwater Camouflaged Object Detection (UCOD) aims to identify objects that blend seamlessly into underwater environments. This task is critically important to marine ecology. However, it remains largely underexplored and accurate identification is severely hindered by optical distortions, water turbidity, and the complex traits of marine organisms. To address these challenges, we introduce the UCOD task and present DeepCamo, a benchmark dataset designed for this domain. We also propose Semantic Localization and Enhancement Network (SLENet), a novel framework for UCOD. We first benchmark state-of-the-art COD models on DeepCamo to reveal key issues, upon which SLENet is built. In particular, we incorporate Gamma-Asymmetric Enhancement (GAE) module and a Localization Guidance Branch (LGB) to enhance multi-scale feature representation while generating a location map enriched with global semantic information. This map guides the Multi-Scale Supervised Decoder (MSSD) to produce more accurate predictions. Experiments on our DeepCamo dataset and three benchmark COD datasets confirm SLENet's superior performance over SOTA methods, and underscore its high generality for the broader COD task.
- Abstract(参考訳): 水中カモフラージュ物体検出(UCOD)は、水中環境にシームレスに溶け込む物体を識別することを目的としている。
この仕事は海洋生態学にとって極めて重要である。
しかし、光学的歪み、水の濁度、海洋生物の複雑な性質などにより、発見が過小評価され、正確な識別が著しく妨げられている。
これらの課題に対処するために、UCODタスクと、このドメイン用に設計されたベンチマークデータセットであるDeepCamoを紹介します。
また,UCODの新しいフレームワークであるセマンティック・ローカライゼーション・エンハンスメント・ネットワーク(SLENet)を提案する。
我々はDeepCamoで最先端のCODモデルをベンチマークし、SLENetが構築されている重要な問題を明らかにする。
特に,Gamma-Asymmetric Enhancement (GAE)モジュールとLocalization Guidance Branch (LGB)を組み込んで,グローバルな意味情報に富んだ位置情報を生成しながら,マルチスケールの特徴表現を強化する。
このマップは、Multi-Scale Supervised Decoder (MSSD) をガイドし、より正確な予測を生成する。
DeepCamoデータセットと3つのベンチマークCODデータセットの実験により、SLENetのSOTAメソッドよりも優れたパフォーマンスが確認され、より広範なCODタスクに対するその高い一般化が裏付けられている。
関連論文リスト
- High-Resolution Underwater Camouflaged Object Detection: GBU-UCOD Dataset and Topology-Aware and Frequency-Decoupled Networks [32.76569239634241]
本稿では,位相認識モデルと周波数分離認識を統合した新しいフレームワークを提案する。
DeepTopo-Netは、特に複雑な水中パターンの形態的整合性を維持する上で、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-02-03T14:41:27Z) - DGA-Net: Enhancing SAM with Depth Prompting and Graph-Anchor Guidance for Camouflaged Object Detection [28.171222957310956]
DGA-NetはSegment Anything Model(SAM)を新しいディーププロセッシングパラダイムで適用するフレームワークである。
具体的には、異種グラフ内のRGB意味論と幾何学的深さを合成するクロスモーダルグラフ拡張(CGE)モジュールを提案する。
また,AGRモジュールを設計し,特徴階層における固有情報減衰に対する対策を行う。
論文 参考訳(メタデータ) (2026-01-06T09:04:23Z) - FOM-Nav: Frontier-Object Maps for Object Goal Navigation [65.76906445210112]
FOM-Navはフロンティアオブジェクトマップと視覚言語モデルによる探索効率を高めるフレームワークである。
FOM-Navをトレーニングするために,実環境から大規模ナビゲーションデータセットを自動構築する。
FOM-NavはMP3DとHM3Dのベンチマーク、特にナビゲーション効率の指標SPLで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-11-30T18:16:09Z) - Expose Camouflage in the Water: Underwater Camouflaged Instance Segmentation and Dataset [76.92197418745822]
カモフラージュされたインスタンスセグメンテーション(CIS)は、周囲と密接に融合したオブジェクトを正確にセグメンテーションする際の大きな課題に直面します。
従来のカモフラージュされたインスタンスセグメンテーション法は、水中のサンプルが限られている地球上で支配的なデータセットに基づいて訓練されており、水中のシーンでは不十分な性能を示す可能性がある。
本研究は,海中カモフラージュされた海洋生物の3,953枚の画像とインスタンスレベルのアノテーションを含む,最初の水中カモフラージュされたインスタンスセグメンテーションデータセットUCIS4Kを紹介する。
論文 参考訳(メタデータ) (2025-10-20T14:34:51Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - MID: A Comprehensive Shore-Based Dataset for Multi-Scale Dense Ship Occlusion and Interaction Scenarios [10.748210940033484]
海上航行行動データセット(MID)は、複雑な海上環境における船舶検出の課題に対処するために設計されている。
MIDには5,673の画像と135,884の微調整されたターゲットインスタンスが含まれており、教師付き学習と半教師付き学習の両方をサポートしている。
MIDの画像は、43の水域を横断する現実世界のナビゲーションの高精細なビデオクリップから得られたもので、天候や照明条件も様々である。
論文 参考訳(メタデータ) (2024-12-08T09:34:23Z) - PGNeXt: High-Resolution Salient Object Detection via Pyramid Grafting Network [24.54269823691119]
本稿では、データセットとネットワークフレームワークの両方の観点から、より難解な高分解能サルエントオブジェクト検出(HRSOD)について述べる。
HRSODデータセットの欠如を補うため、UHRSDと呼ばれる大規模高解像度の高分解能物体検出データセットを慎重に収集した。
すべての画像はピクセルレベルで微妙にアノテートされ、以前の低解像度のSODデータセットをはるかに上回っている。
論文 参考訳(メタデータ) (2024-08-02T09:31:21Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - DepthFormer: Exploiting Long-Range Correlation and Local Information for
Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。
我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。
提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文 参考訳(メタデータ) (2022-03-27T05:03:56Z) - Fast Camouflaged Object Detection via Edge-based Reversible
Re-calibration Network [17.538512222905087]
本稿では,ERRNetと呼ばれるエッジベースの可逆再校正ネットワークを提案する。
Selective Edge Aggregation(SEA)とReversible Re-calibration Unit(RRU)の2つの革新的な設計が特徴である。
実験の結果,ERRNetは3つのCODデータセットと5つの医用画像セグメンテーションデータセットで既存の最先端ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2021-11-05T02:03:54Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - Dense Attention Fluid Network for Salient Object Detection in Optical
Remote Sensing Images [193.77450545067967]
光リモートセンシング画像(RSI)における有意物体検出のためのエンド・ツー・エンドDense Attention Fluid Network(DAFNet)を提案する。
GCA(Global Context-Aware Attention)モジュールは、長距離の意味的関係を適応的にキャプチャするために提案される。
我々は、2000枚の画像とピクセルワイドなサリエンシアノテーションを含むSODのための新しい、挑戦的な光学RSIデータセットを構築した。
論文 参考訳(メタデータ) (2020-11-26T06:14:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。