論文の概要: SLENet: A Guidance-Enhanced Network for Underwater Camouflaged Object Detection
- arxiv url: http://arxiv.org/abs/2509.03786v1
- Date: Thu, 04 Sep 2025 00:44:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-05 20:21:10.000265
- Title: SLENet: A Guidance-Enhanced Network for Underwater Camouflaged Object Detection
- Title(参考訳): SLENet:水中カモフラージュ物体検出のためのガイダンス強化ネットワーク
- Authors: Xinxin Wang, Han Sun, Ningzhong Liu, Huiyu Zhou, Yinan Yao,
- Abstract要約: UCODタスクと、このドメイン用に設計されたベンチマークデータセットであるDeepCamoを紹介する。
また,UCODの新しいフレームワークであるセマンティック・ローカライゼーション・エンハンスメント・ネットワーク(SLENet)を提案する。
DeepCamoデータセットと3つのベンチマークCODデータセットの実験により、SLENetのSOTAメソッドよりも優れたパフォーマンスが確認された。
- 参考スコア(独自算出の注目度): 25.282383911039418
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Underwater Camouflaged Object Detection (UCOD) aims to identify objects that blend seamlessly into underwater environments. This task is critically important to marine ecology. However, it remains largely underexplored and accurate identification is severely hindered by optical distortions, water turbidity, and the complex traits of marine organisms. To address these challenges, we introduce the UCOD task and present DeepCamo, a benchmark dataset designed for this domain. We also propose Semantic Localization and Enhancement Network (SLENet), a novel framework for UCOD. We first benchmark state-of-the-art COD models on DeepCamo to reveal key issues, upon which SLENet is built. In particular, we incorporate Gamma-Asymmetric Enhancement (GAE) module and a Localization Guidance Branch (LGB) to enhance multi-scale feature representation while generating a location map enriched with global semantic information. This map guides the Multi-Scale Supervised Decoder (MSSD) to produce more accurate predictions. Experiments on our DeepCamo dataset and three benchmark COD datasets confirm SLENet's superior performance over SOTA methods, and underscore its high generality for the broader COD task.
- Abstract(参考訳): 水中カモフラージュ物体検出(UCOD)は、水中環境にシームレスに溶け込む物体を識別することを目的としている。
この仕事は海洋生態学にとって極めて重要である。
しかし、光学的歪み、水の濁度、海洋生物の複雑な性質などにより、発見が過小評価され、正確な識別が著しく妨げられている。
これらの課題に対処するために、UCODタスクと、このドメイン用に設計されたベンチマークデータセットであるDeepCamoを紹介します。
また,UCODの新しいフレームワークであるセマンティック・ローカライゼーション・エンハンスメント・ネットワーク(SLENet)を提案する。
我々はDeepCamoで最先端のCODモデルをベンチマークし、SLENetが構築されている重要な問題を明らかにする。
特に,Gamma-Asymmetric Enhancement (GAE)モジュールとLocalization Guidance Branch (LGB)を組み込んで,グローバルな意味情報に富んだ位置情報を生成しながら,マルチスケールの特徴表現を強化する。
このマップは、Multi-Scale Supervised Decoder (MSSD) をガイドし、より正確な予測を生成する。
DeepCamoデータセットと3つのベンチマークCODデータセットの実験により、SLENetのSOTAメソッドよりも優れたパフォーマンスが確認され、より広範なCODタスクに対するその高い一般化が裏付けられている。
関連論文リスト
- MID: A Comprehensive Shore-Based Dataset for Multi-Scale Dense Ship Occlusion and Interaction Scenarios [10.748210940033484]
海上航行行動データセット(MID)は、複雑な海上環境における船舶検出の課題に対処するために設計されている。
MIDには5,673の画像と135,884の微調整されたターゲットインスタンスが含まれており、教師付き学習と半教師付き学習の両方をサポートしている。
MIDの画像は、43の水域を横断する現実世界のナビゲーションの高精細なビデオクリップから得られたもので、天候や照明条件も様々である。
論文 参考訳(メタデータ) (2024-12-08T09:34:23Z) - PGNeXt: High-Resolution Salient Object Detection via Pyramid Grafting Network [24.54269823691119]
本稿では、データセットとネットワークフレームワークの両方の観点から、より難解な高分解能サルエントオブジェクト検出(HRSOD)について述べる。
HRSODデータセットの欠如を補うため、UHRSDと呼ばれる大規模高解像度の高分解能物体検出データセットを慎重に収集した。
すべての画像はピクセルレベルで微妙にアノテートされ、以前の低解像度のSODデータセットをはるかに上回っている。
論文 参考訳(メタデータ) (2024-08-02T09:31:21Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - DepthFormer: Exploiting Long-Range Correlation and Local Information for
Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。
我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。
提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文 参考訳(メタデータ) (2022-03-27T05:03:56Z) - Fast Camouflaged Object Detection via Edge-based Reversible
Re-calibration Network [17.538512222905087]
本稿では,ERRNetと呼ばれるエッジベースの可逆再校正ネットワークを提案する。
Selective Edge Aggregation(SEA)とReversible Re-calibration Unit(RRU)の2つの革新的な設計が特徴である。
実験の結果,ERRNetは3つのCODデータセットと5つの医用画像セグメンテーションデータセットで既存の最先端ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2021-11-05T02:03:54Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - Dense Attention Fluid Network for Salient Object Detection in Optical
Remote Sensing Images [193.77450545067967]
光リモートセンシング画像(RSI)における有意物体検出のためのエンド・ツー・エンドDense Attention Fluid Network(DAFNet)を提案する。
GCA(Global Context-Aware Attention)モジュールは、長距離の意味的関係を適応的にキャプチャするために提案される。
我々は、2000枚の画像とピクセルワイドなサリエンシアノテーションを含むSODのための新しい、挑戦的な光学RSIデータセットを構築した。
論文 参考訳(メタデータ) (2020-11-26T06:14:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。