論文の概要: Edge-guided Representation Learning for Underwater Object Detection
- arxiv url: http://arxiv.org/abs/2306.00440v1
- Date: Thu, 1 Jun 2023 08:29:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 17:31:21.184399
- Title: Edge-guided Representation Learning for Underwater Object Detection
- Title(参考訳): 水中物体検出のためのエッジ誘導表現学習
- Authors: Linhui Dai, Hong Liu, Pinhao Song, Hao Tang, Runwei Ding, Shengquan Li
- Abstract要約: 水中物体検出は海洋経済の発展、環境保護、惑星の持続可能な開発に不可欠である。
このタスクの主な課題は、低コントラスト、小さな物体、水生生物の模倣である。
本稿では,識別的表現学習とアグリゲーションの実現を目的としたエッジ誘導型表現学習ネットワークERL-Netを提案する。
- 参考スコア(独自算出の注目度): 15.832646455660278
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater object detection (UOD) is crucial for marine economic development,
environmental protection, and the planet's sustainable development. The main
challenges of this task arise from low-contrast, small objects, and mimicry of
aquatic organisms. The key to addressing these challenges is to focus the model
on obtaining more discriminative information. We observe that the edges of
underwater objects are highly unique and can be distinguished from low-contrast
or mimicry environments based on their edges. Motivated by this observation, we
propose an Edge-guided Representation Learning Network, termed ERL-Net, that
aims to achieve discriminative representation learning and aggregation under
the guidance of edge cues. Firstly, we introduce an edge-guided attention
module to model the explicit boundary information, which generates more
discriminative features. Secondly, a feature aggregation module is proposed to
aggregate the multi-scale discriminative features by regrouping them into three
levels, effectively aggregating global and local information for locating and
recognizing underwater objects. Finally, we propose a wide and asymmetric
receptive field block to enable features to have a wider receptive field,
allowing the model to focus on more small object information. Comprehensive
experiments on three challenging underwater datasets show that our method
achieves superior performance on the UOD task.
- Abstract(参考訳): 水中物体検出(UOD)は海洋経済の発展、環境保護、惑星の持続可能な開発に不可欠である。
このタスクの主な課題は、低コントラスト、小さな物体、水生生物の模倣である。
これらの課題に対処する鍵は、より識別的な情報を得るためにモデルを集中させることである。
水中の物体の縁は非常にユニークであり、その縁に基づいて低コントラストや模倣環境と区別できる。
そこで本研究では,エッジキューの指導の下で識別表現学習とアグリゲーションを実現することを目的とした,エッジガイド表現学習ネットワークerl-netを提案する。
まず,明示的な境界情報をモデル化するためにエッジガイドアテンションモジュールを導入し,より識別的な特徴を生成する。
第2に, 特徴集約モジュールは, 3つのレベルに分類して, 水中物体の位置と認識のためのグローバルおよびローカル情報を効果的に集約することで, マルチスケールの識別的特徴を集約する。
最後に、より広い受容野を持つ機能を実現するために、より小さなオブジェクト情報に集中できるように、広く非対称な受容野ブロックを提案する。
3つの挑戦的な水中データセットに対する総合的な実験により,本手法はUODタスクにおいて優れた性能を発揮することが示された。
関連論文リスト
- Label-Efficient 3D Object Detection For Road-Side Units [10.663986706501188]
協調的知覚は、インテリジェント・ロードサイド・ユニット(RSU)との深部情報融合による自動運転車の知覚を高める
これらの手法は、特に注釈付きRSUデータを必要とするため、実際のデプロイメントにおいて大きなハードルを生んでいる。
教師なしオブジェクト発見に基づくRSUのためのラベル効率の高いオブジェクト検出手法を考案する。
論文 参考訳(メタデータ) (2024-04-09T12:29:16Z) - MuLA-GAN: Multi-Level Attention GAN for Enhanced Underwater Visibility [1.9272863690919875]
本稿では,総合的な水中画像強調のためのGAN(Geneversarative Adrial Networks)とマルチレベルアテンション機構の相乗効果を利用した新しいアプローチであるMuLA-GANを紹介する。
本モデルは,水中画像の複雑な細部を捉え保存することに優れており,様々な用途に欠かせない。
この研究は、水中画像の強調における重要な研究ギャップに対処するだけでなく、GANの強化におけるマルチレベル注意の重要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2023-12-25T07:33:47Z) - ADOD: Adaptive Domain-Aware Object Detection with Residual Attention for
Underwater Environments [1.2624532490634643]
本研究では,水中物体検出における領域一般化のための新しいアプローチであるADODを提案する。
本手法は, 様々な水中環境下での堅牢性を確保するため, 多様な領域にまたがってモデルを一般化する能力を高める。
論文 参考訳(メタデータ) (2023-12-11T19:20:56Z) - Bidirectional Knowledge Reconfiguration for Lightweight Point Cloud
Analysis [74.00441177577295]
ポイントクラウド分析は計算システムのオーバーヘッドに直面し、モバイルやエッジデバイスでの利用を制限する。
本稿では,軽量点雲モデルのための特徴蒸留について検討する。
本研究では,教師から生徒への情報的文脈的知識を抽出するための双方向知識再構成を提案する。
論文 参考訳(メタデータ) (2023-10-08T11:32:50Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Cycle Consistency Driven Object Discovery [75.60399804639403]
本研究では,シーンの各オブジェクトが異なるスロットに関連付けられなければならない制約を明示的に最適化する手法を提案する。
これらの一貫性目標を既存のスロットベースのオブジェクト中心手法に統合することにより、オブジェクト発見性能を大幅に改善することを示す。
提案手法は,オブジェクト発見を改善するだけでなく,下流タスクのよりリッチな機能も提供することを示唆している。
論文 参考訳(メタデータ) (2023-06-03T21:49:06Z) - SIENet: Spatial Information Enhancement Network for 3D Object Detection
from Point Cloud [20.84329063509459]
LiDARベースの3Dオブジェクト検出は、自動運転車に大きな影響を与える。
LiDARの固有特性の制限により、センサーから遠く離れた物体において、より少ない点が収集される。
そこで本研究では,SIENetという2段階の3次元物体検出フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-29T07:45:09Z) - Salient Object Detection via Integrity Learning [104.13483971954233]
整合性とは、ある有能な対象に属するすべての部分を強調する概念である。
ICON(Inteinity Cognition Network)の設計により,高感度物体検出のための整合性学習を容易にする。
ICONは3つの重要なコンポーネントを探索し、強力な整合性機能を学びます。
論文 参考訳(メタデータ) (2021-01-19T14:53:12Z) - Reinforcement Learning for Sparse-Reward Object-Interaction Tasks in a
First-person Simulated 3D Environment [73.9469267445146]
高忠実な3Dシミュレーション環境において、AI2Thorのような一対一のオブジェクトインタラクションタスクは、強化学習エージェントに顕著なサンプル効率の課題をもたらす。
補助的なタスクとして注意的オブジェクトモデルを学ぶことで、監督なしに、ゼロからオブジェクトインタラクションタスクを学習できることが示される。
論文 参考訳(メタデータ) (2020-10-28T19:27:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。