論文の概要: MarineDet: Towards Open-Marine Object Detection
- arxiv url: http://arxiv.org/abs/2310.01931v1
- Date: Tue, 3 Oct 2023 10:13:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-10-04 15:00:22.087703
- Title: MarineDet: Towards Open-Marine Object Detection
- Title(参考訳): MarineDet: オープンマリンオブジェクト検出を目指す
- Authors: Liang Haixin, Zheng Ziqiang, Ma Zeyu, Sai-Kit Yeung
- Abstract要約: オープンマリン物体検出(OMOD: Open-marine object detection)は、多種多様で目に見えない海洋物体を検知し、分類と局所化を同時に行うために必要である。
我々は、事前訓練を通じて共同視覚テキスト意味空間を定式化し、その後、海洋固有の訓練を行い、航空から海への知識伝達を実現する。
実験により、既存のジェネラリストや専門オブジェクト検出アルゴリズムよりも、MarineDetの方が優れた性能を示した。
- 参考スコア(独自算出の注目度): 13.58409623192008
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Marine object detection has gained prominence in marine research, driven by
the pressing need to unravel oceanic mysteries and enhance our understanding of
invaluable marine ecosystems. There is a profound requirement to efficiently
and accurately identify and localize diverse and unseen marine entities within
underwater imagery. The open-marine object detection (OMOD for short) is
required to detect diverse and unseen marine objects, performing categorization
and localization simultaneously. To achieve OMOD, we present
\textbf{MarineDet}. We formulate a joint visual-text semantic space through
pre-training and then perform marine-specific training to achieve
in-air-to-marine knowledge transfer. Considering there is no specific dataset
designed for OMOD, we construct a \textbf{MarineDet dataset} consisting of 821
marine-relative object categories to promote and measure OMOD performance. The
experimental results demonstrate the superior performance of MarineDet over
existing generalist and specialist object detection algorithms. To the best of
our knowledge, we are the first to present OMOD, which holds a more valuable
and practical setting for marine ecosystem monitoring and management. Our
research not only pushes the boundaries of marine understanding but also offers
a standard pipeline for OMOD.
- Abstract(参考訳): 海洋の物体検出は、海洋の謎を解き明かし、貴重な海洋生態系の理解を深める必要性によって、海洋研究で注目されている。
水中画像中の多様な海洋生物を効率よく、正確に同定し、局在させることが求められている。
オープンマリン物体検出(OMOD:open-marine object detection)は、多様な海洋物体を検知し、分類と局所化を同時に行うために必要である。
OMOD を達成するために、textbf{MarineDet} を示す。
我々は、事前訓練を通じて共同視覚テキスト意味空間を定式化し、海洋固有の訓練を行い、航空から海への知識伝達を実現する。
OMOD用に設計された特定のデータセットが存在しないことを考慮し、OMODのパフォーマンスを促進・測定するために、821の海洋相対オブジェクトカテゴリからなる \textbf{MarineDet データセットを構築した。
実験の結果,marinedetは,既存のジェネラリストおよびスペシャリスト検出アルゴリズムよりも優れた性能を示した。
このOMODは,海洋生態系のモニタリングと管理を行う上で,より価値が高く実践的な環境である。
我々の研究は海洋理解の境界を推し進めるだけでなく、OMODの標準パイプラインも提供しています。
関連論文リスト
- ORCA: Object Recognition and Comprehension for Archiving Marine Species [19.88077587860992]
ORCAは478種の14,647枚の画像からなる海洋研究のためのマルチモーダルベンチマークである。
このデータセットは、様々な海洋種にまたがる形態学指向の属性をキャプチャする、きめ細かい視覚的およびテキスト的アノテーションを提供する。
結果は、種多様性、形態学的重複、専門領域要求など、重要な課題を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-12-24T12:36:57Z) - NAUTILUS: A Large Multimodal Model for Underwater Scene Understanding [60.76337064425815]
本研究では,水中の自動探査を目的とした水中シーン理解手法について検討する。
NautDataは、8つの水中シーン理解タスクをサポートする1.45Mイメージテキストペアを含むデータセットである。
本稿では,透明な水中情報を明示的に復元するVFEモジュールを提案する。
論文 参考訳(メタデータ) (2025-10-31T14:00:35Z) - UWBench: A Comprehensive Vision-Language Benchmark for Underwater Understanding [54.16709436340606]
視覚言語モデル(VLM)は自然界の理解において顕著な成功を収めた。
水中画像は、厳しい光の減衰、色歪み、懸濁粒子散乱などの固有の課題を呈している。
水中視覚言語理解のためのベンチマークであるUWBenchを紹介する。
論文 参考訳(メタデータ) (2025-10-21T03:32:15Z) - Expose Camouflage in the Water: Underwater Camouflaged Instance Segmentation and Dataset [76.92197418745822]
カモフラージュされたインスタンスセグメンテーション(CIS)は、周囲と密接に融合したオブジェクトを正確にセグメンテーションする際の大きな課題に直面します。
従来のカモフラージュされたインスタンスセグメンテーション法は、水中のサンプルが限られている地球上で支配的なデータセットに基づいて訓練されており、水中のシーンでは不十分な性能を示す可能性がある。
本研究は,海中カモフラージュされた海洋生物の3,953枚の画像とインスタンスレベルのアノテーションを含む,最初の水中カモフラージュされたインスタンスセグメンテーションデータセットUCIS4Kを紹介する。
論文 参考訳(メタデータ) (2025-10-20T14:34:51Z) - MARIS: Marine Open-Vocabulary Instance Segmentation with Geometric Enhancement and Semantic Alignment [56.88334234553316]
我々は,水中オープンボキャブラリ(OV)セグメンテーションのための大規模なベンチマークであるtextbfMARIS (underlineMarine Open-Vocabulary underlineInstance underlineSegmentation)を紹介した。
当社のフレームワークは、既存のOVベースラインであるIn-DomainとCross-Domainの両方を一貫して上回ります。
論文 参考訳(メタデータ) (2025-10-17T07:50:58Z) - OceanGym: A Benchmark Environment for Underwater Embodied Agents [69.56465775825275]
OceanGymは、海洋水中のエンボディエージェントに関する最初の総合的なベンチマークである。
それは、最も要求の多い現実世界環境の1つでAIを前進させるように設計されている。
高忠実で厳格に設計されたプラットフォームを提供することで、OceanGymは堅牢なエンボディAIを開発するためのテストベッドを確立する。
論文 参考訳(メタデータ) (2025-09-30T17:09:32Z) - Neptune-X: Active X-to-Maritime Generation for Universal Maritime Object Detection [54.1960918379255]
Neptune-Xは、海洋オブジェクト検出のためのデータ中心の生成-選択フレームワークである。
X-to-Maritime(X-to-Maritime)は、多様で現実的な海洋シーンを合成する多モード条件生成モデルである。
提案手法は,海上シーン合成における新しいベンチマークを設定し,検出精度を大幅に向上させる。
論文 参考訳(メタデータ) (2025-09-25T04:59:02Z) - SLENet: A Guidance-Enhanced Network for Underwater Camouflaged Object Detection [22.78768403870293]
UCODタスクと、このドメイン用に設計されたベンチマークデータセットであるDeepCamoを紹介する。
また,UCODの新しいフレームワークであるセマンティック・ローカライゼーション・エンハンスメント・ネットワーク(SLENet)を提案する。
DeepCamoデータセットと3つのベンチマークCODデータセットの実験により、SLENetのSOTAメソッドよりも優れたパフォーマンスが確認された。
論文 参考訳(メタデータ) (2025-09-04T00:44:32Z) - Tree-Mamba: A Tree-Aware Mamba for Underwater Monocular Depth Estimation [85.17735565146106]
水中単眼深度推定(UMDE)は水中劣化画像から高精度深度マップを推定することを目的とした重要な課題である。
我々は,水中の劣化画像から正確な単分子深度マップを推定するための,木を意識した新しいマンバ手法であるTree-Mambaを開発した。
海底深度推定ベンチマーク (BlueDepth) を構築し, 深度ラベルが信頼できる海底画像ペア38,162枚を構築した。
論文 参考訳(メタデータ) (2025-07-10T12:10:51Z) - Marine Saliency Segmenter: Object-Focused Conditional Diffusion with Region-Level Semantic Knowledge Distillation [44.50637633194709]
海洋衛生(MSS)は、様々な視覚に基づく海洋探査において重要な役割を担っている。
拡散モデルに基づく新しい海洋塩分セグメンタDiffMSSを提案する。
我々は、過度に信頼された誤認識を抑制するために、専用決定論的コンセンサスサンプリングを開発する。
論文 参考訳(メタデータ) (2025-04-03T08:31:36Z) - FAFA: Frequency-Aware Flow-Aided Self-Supervision for Underwater Object Pose Estimation [65.01601309903971]
無人水中車両(UUV)の6次元ポーズ推定のための周波数認識フロー支援フレームワークであるFAFAを紹介する。
我々のフレームワークは、3DモデルとRGB画像のみに依存しており、実際のポーズアノテーションや奥行きのような非モダリティデータの必要性を軽減しています。
本研究では,一般的な水中オブジェクトポーズベンチマークにおけるFAFAの有効性を評価し,最先端手法と比較して顕著な性能向上を示した。
論文 参考訳(メタデータ) (2024-09-25T03:54:01Z) - Introducing VaDA: Novel Image Segmentation Model for Maritime Object Segmentation Using New Dataset [3.468621550644668]
海上輸送産業はコンピュータビジョン人工知能(AI)の進歩によって急速に進化している
海洋環境における物体認識は、光の反射、干渉、激しい照明、様々な気象条件といった課題に直面します。
既存のAI認識モデルとデータセットは、自律ナビゲーションシステムを構成するのに限定的に適している。
論文 参考訳(メタデータ) (2024-07-12T05:48:53Z) - A Computer Vision Approach to Estimate the Localized Sea State [45.498315114762484]
本研究は, 船橋に設置した静止カメラ1台が捉えた運用用封筒内の海像の活用に焦点を当てた。
収集した画像は、深層学習モデルを訓練し、ビューフォートスケールに基づいて海の状態を自動的に認識する。
論文 参考訳(メタデータ) (2024-07-04T09:07:25Z) - Fantastic Animals and Where to Find Them: Segment Any Marine Animal with Dual SAM [62.85895749882285]
海洋動物(英: Marine Animal、MAS)は、海洋環境に生息する動物を分類する動物である。
高性能MASのための新しい特徴学習フレームワークDual-SAMを提案する。
提案手法は,広く使用されている5つのMASデータセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-04-07T15:34:40Z) - WhaleNet: a Novel Deep Learning Architecture for Marine Mammals Vocalizations on Watkins Marine Mammal Sound Database [49.1574468325115]
textbfWhaleNet (Wavelet Highly Adaptive Learning Ensemble Network) は海洋哺乳動物の発声を分類するための高度な深層アンサンブルアーキテクチャである。
既存のアーキテクチャよりも8-10%の精度で分類精度を向上し、分類精度は9,7.61%である。
論文 参考訳(メタデータ) (2024-02-20T11:36:23Z) - Deep Learning-Based Object Detection in Maritime Unmanned Aerial Vehicle
Imagery: Review and Experimental Comparisons [10.75221614844458]
まず,海洋UAVにおける物体検出に関する4つの課題,すなわち,対象特性の多様性,デバイス制限,海洋環境の多様性,データセットの不足について要約する。
次に,UAVの航空画像・映像データセットを概観し,MS2ship という海洋UAV航空データセットを船体検出のために提案する。
論文 参考訳(メタデータ) (2023-11-14T07:20:38Z) - MarineGPT: Unlocking Secrets of Ocean to the Public [32.17362940242431]
大規模言語モデル(LLM)は、AIアシスタントとしてのユーザエクスペリエンスを促進する強力なツールであることが証明されている。
我々は,海洋ドメイン用に特別に設計された最初の視覚言語モデルである textbfMarineGPT を提案し,海洋の秘密を一般に公開する。
論文 参考訳(メタデータ) (2023-10-20T15:45:39Z) - MarineVRS: Marine Video Retrieval System with Explainability via
Semantic Understanding [11.878077736295863]
MarineVRSは、海洋ドメイン用に明示的に設計された、新しく柔軟なビデオ検索システムである。
MarineVRSは、視覚的および言語的オブジェクト表現のための最先端の手法を統合し、大量の水中ビデオデータの効率的かつ正確な検索と分析を可能にする。
MarineVRSは、海洋研究者や科学者が大量のデータを効率的に正確に処理し、海洋生物の行動や動きについて深い洞察を得るための強力なツールである。
論文 参考訳(メタデータ) (2023-06-07T16:46:44Z) - 1st Workshop on Maritime Computer Vision (MaCVi) 2023: Challenge Results [152.54137779547068]
本報告では、個々のサブチャンジの主な発見を要約し、SeaDronesSee Object Detection v2と呼ばれる新しいベンチマークを導入する。
データセット、評価コード、リーダーボードはhttps://seadronessee.cs.uni-tuebingen.de/macvi.comで公開されている。
論文 参考訳(メタデータ) (2022-11-24T09:59:13Z) - SEA: Bridging the Gap Between One- and Two-stage Detector Distillation
via SEmantic-aware Alignment [76.80165589520385]
細粒度情報を抽象化する性質から,SEA (SEmantic-Aware Alignment) 蒸留法を命名した。
1段検出器と2段検出器の両方において、挑戦的な物体検出タスクにおいて、最先端の新たな結果が得られる。
論文 参考訳(メタデータ) (2022-03-02T04:24:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。