Fugu-MT 論文翻訳(概要): MarineDet: Towards Open-Marine Object Detection

論文の概要: MarineDet: Towards Open-Marine Object Detection

arxiv url: http://arxiv.org/abs/2310.01931v1
Date: Tue, 3 Oct 2023 10:13:42 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-04 15:00:22.087703
Title: MarineDet: Towards Open-Marine Object Detection
Title（参考訳）: MarineDet: オープンマリンオブジェクト検出を目指す
Authors: Liang Haixin, Zheng Ziqiang, Ma Zeyu, Sai-Kit Yeung
Abstract要約: オープンマリン物体検出(OMOD: Open-marine object detection)は、多種多様で目に見えない海洋物体を検知し、分類と局所化を同時に行うために必要である。我々は、事前訓練を通じて共同視覚テキスト意味空間を定式化し、その後、海洋固有の訓練を行い、航空から海への知識伝達を実現する。実験により、既存のジェネラリストや専門オブジェクト検出アルゴリズムよりも、MarineDetの方が優れた性能を示した。
参考スコア（独自算出の注目度）: 13.58409623192008
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Marine object detection has gained prominence in marine research, driven by the pressing need to unravel oceanic mysteries and enhance our understanding of invaluable marine ecosystems. There is a profound requirement to efficiently and accurately identify and localize diverse and unseen marine entities within underwater imagery. The open-marine object detection (OMOD for short) is required to detect diverse and unseen marine objects, performing categorization and localization simultaneously. To achieve OMOD, we present \textbf{MarineDet}. We formulate a joint visual-text semantic space through pre-training and then perform marine-specific training to achieve in-air-to-marine knowledge transfer. Considering there is no specific dataset designed for OMOD, we construct a \textbf{MarineDet dataset} consisting of 821 marine-relative object categories to promote and measure OMOD performance. The experimental results demonstrate the superior performance of MarineDet over existing generalist and specialist object detection algorithms. To the best of our knowledge, we are the first to present OMOD, which holds a more valuable and practical setting for marine ecosystem monitoring and management. Our research not only pushes the boundaries of marine understanding but also offers a standard pipeline for OMOD.
Abstract（参考訳）: 海洋の物体検出は、海洋の謎を解き明かし、貴重な海洋生態系の理解を深める必要性によって、海洋研究で注目されている。水中画像中の多様な海洋生物を効率よく、正確に同定し、局在させることが求められている。オープンマリン物体検出(OMOD:open-marine object detection)は、多様な海洋物体を検知し、分類と局所化を同時に行うために必要である。 OMOD を達成するために、textbf{MarineDet} を示す。我々は、事前訓練を通じて共同視覚テキスト意味空間を定式化し、海洋固有の訓練を行い、航空から海への知識伝達を実現する。 OMOD用に設計された特定のデータセットが存在しないことを考慮し、OMODのパフォーマンスを促進・測定するために、821の海洋相対オブジェクトカテゴリからなる \textbf{MarineDet データセットを構築した。実験の結果,marinedetは,既存のジェネラリストおよびスペシャリスト検出アルゴリズムよりも優れた性能を示した。このOMODは,海洋生態系のモニタリングと管理を行う上で,より価値が高く実践的な環境である。我々の研究は海洋理解の境界を推し進めるだけでなく、OMODの標準パイプラインも提供しています。

関連論文リスト

Tree-Mamba: A Tree-Aware Mamba for Underwater Monocular Depth Estimation [85.17735565146106]
水中単眼深度推定(UMDE)は水中劣化画像から高精度深度マップを推定することを目的とした重要な課題である。我々は,水中の劣化画像から正確な単分子深度マップを推定するための,木を意識した新しいマンバ手法であるTree-Mambaを開発した。海底深度推定ベンチマーク (BlueDepth) を構築し, 深度ラベルが信頼できる海底画像ペア38,162枚を構築した。
論文参考訳（メタデータ） (2025-07-10T12:10:51Z)
Marine Saliency Segmenter: Object-Focused Conditional Diffusion with Region-Level Semantic Knowledge Distillation [44.50637633194709]
海洋衛生(MSS)は、様々な視覚に基づく海洋探査において重要な役割を担っている。拡散モデルに基づく新しい海洋塩分セグメンタDiffMSSを提案する。我々は、過度に信頼された誤認識を抑制するために、専用決定論的コンセンサスサンプリングを開発する。
論文参考訳（メタデータ） (2025-04-03T08:31:36Z)
FAFA: Frequency-Aware Flow-Aided Self-Supervision for Underwater Object Pose Estimation [65.01601309903971]
無人水中車両(UUV)の6次元ポーズ推定のための周波数認識フロー支援フレームワークであるFAFAを紹介する。我々のフレームワークは、3DモデルとRGB画像のみに依存しており、実際のポーズアノテーションや奥行きのような非モダリティデータの必要性を軽減しています。本研究では,一般的な水中オブジェクトポーズベンチマークにおけるFAFAの有効性を評価し,最先端手法と比較して顕著な性能向上を示した。
論文参考訳（メタデータ） (2024-09-25T03:54:01Z)
Introducing VaDA: Novel Image Segmentation Model for Maritime Object Segmentation Using New Dataset [3.468621550644668]
海上輸送産業はコンピュータビジョン人工知能(AI)の進歩によって急速に進化している海洋環境における物体認識は、光の反射、干渉、激しい照明、様々な気象条件といった課題に直面します。既存のAI認識モデルとデータセットは、自律ナビゲーションシステムを構成するのに限定的に適している。
論文参考訳（メタデータ） (2024-07-12T05:48:53Z)
A Computer Vision Approach to Estimate the Localized Sea State [45.498315114762484]
本研究は, 船橋に設置した静止カメラ1台が捉えた運用用封筒内の海像の活用に焦点を当てた。収集した画像は、深層学習モデルを訓練し、ビューフォートスケールに基づいて海の状態を自動的に認識する。
論文参考訳（メタデータ） (2024-07-04T09:07:25Z)
Fantastic Animals and Where to Find Them: Segment Any Marine Animal with Dual SAM [62.85895749882285]
海洋動物(英: Marine Animal、MAS)は、海洋環境に生息する動物を分類する動物である。高性能MASのための新しい特徴学習フレームワークDual-SAMを提案する。提案手法は,広く使用されている5つのMASデータセットの最先端性能を実現する。
論文参考訳（メタデータ） (2024-04-07T15:34:40Z)
WhaleNet: a Novel Deep Learning Architecture for Marine Mammals Vocalizations on Watkins Marine Mammal Sound Database [49.1574468325115]
textbfWhaleNet (Wavelet Highly Adaptive Learning Ensemble Network) は海洋哺乳動物の発声を分類するための高度な深層アンサンブルアーキテクチャである。既存のアーキテクチャよりも8-10%の精度で分類精度を向上し、分類精度は9,7.61%である。
論文参考訳（メタデータ） (2024-02-20T11:36:23Z)
Deep Learning-Based Object Detection in Maritime Unmanned Aerial Vehicle Imagery: Review and Experimental Comparisons [10.75221614844458]
まず,海洋UAVにおける物体検出に関する4つの課題,すなわち,対象特性の多様性,デバイス制限,海洋環境の多様性,データセットの不足について要約する。次に,UAVの航空画像・映像データセットを概観し,MS2ship という海洋UAV航空データセットを船体検出のために提案する。
論文参考訳（メタデータ） (2023-11-14T07:20:38Z)
MarineGPT: Unlocking Secrets of Ocean to the Public [32.17362940242431]
大規模言語モデル(LLM)は、AIアシスタントとしてのユーザエクスペリエンスを促進する強力なツールであることが証明されている。我々は,海洋ドメイン用に特別に設計された最初の視覚言語モデルである textbfMarineGPT を提案し,海洋の秘密を一般に公開する。
論文参考訳（メタデータ） (2023-10-20T15:45:39Z)
MarineVRS: Marine Video Retrieval System with Explainability via Semantic Understanding [11.878077736295863]
MarineVRSは、海洋ドメイン用に明示的に設計された、新しく柔軟なビデオ検索システムである。 MarineVRSは、視覚的および言語的オブジェクト表現のための最先端の手法を統合し、大量の水中ビデオデータの効率的かつ正確な検索と分析を可能にする。 MarineVRSは、海洋研究者や科学者が大量のデータを効率的に正確に処理し、海洋生物の行動や動きについて深い洞察を得るための強力なツールである。
論文参考訳（メタデータ） (2023-06-07T16:46:44Z)
1st Workshop on Maritime Computer Vision (MaCVi) 2023: Challenge Results [152.54137779547068]
本報告では、個々のサブチャンジの主な発見を要約し、SeaDronesSee Object Detection v2と呼ばれる新しいベンチマークを導入する。データセット、評価コード、リーダーボードはhttps://seadronessee.cs.uni-tuebingen.de/macvi.comで公開されている。
論文参考訳（メタデータ） (2022-11-24T09:59:13Z)
SEA: Bridging the Gap Between One- and Two-stage Detector Distillation via SEmantic-aware Alignment [76.80165589520385]
細粒度情報を抽象化する性質から,SEA (SEmantic-Aware Alignment) 蒸留法を命名した。 1段検出器と2段検出器の両方において、挑戦的な物体検出タスクにおいて、最先端の新たな結果が得られる。
論文参考訳（メタデータ） (2022-03-02T04:24:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。