論文の概要: Beluga Whale Detection from Satellite Imagery with Point Labels
- arxiv url: http://arxiv.org/abs/2505.12066v1
- Date: Sat, 17 May 2025 16:13:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.019369
- Title: Beluga Whale Detection from Satellite Imagery with Point Labels
- Title(参考訳): 点ラベルによる衛星画像からのベルガクジラ検出
- Authors: Yijie Zheng, Jinxuan Yang, Yu Chen, Yaxuan Wang, Yihang Lu, Guoqing Li,
- Abstract要約: 本研究は,VHR衛星画像におけるベルガクジラとハープシールの自動検出パイプラインを提案する。
パイプラインはポイントアノテーションとSegment Anything Model(SAM)を利用して、正確なバウンディングボックスアノテーションを生成する。
SAM-labeledボックスで訓練されたYOLOv8は、全体的な$textF_text1$-scoreが72.2%、ハープシールが70.3%に達した。
- 参考スコア(独自算出の注目度): 8.461883879383517
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Very high-resolution (VHR) satellite imagery has emerged as a powerful tool for monitoring marine animals on a large scale. However, existing deep learning-based whale detection methods usually require manually created, high-quality bounding box annotations, which are labor-intensive to produce. Moreover, existing studies often exclude ``uncertain whales'', individuals that have ambiguous appearances in satellite imagery, limiting the applicability of these models in real-world scenarios. To address these limitations, this study introduces an automated pipeline for detecting beluga whales and harp seals in VHR satellite imagery. The pipeline leverages point annotations and the Segment Anything Model (SAM) to generate precise bounding box annotations, which are used to train YOLOv8 for multiclass detection of certain whales, uncertain whales, and harp seals. Experimental results demonstrated that SAM-generated annotations significantly improved detection performance, achieving higher $\text{F}_\text{1}$-scores compared to traditional buffer-based annotations. YOLOv8 trained on SAM-labeled boxes achieved an overall $\text{F}_\text{1}$-score of 72.2% for whales overall and 70.3% for harp seals, with superior performance in dense scenes. The proposed approach not only reduces the manual effort required for annotation but also enhances the detection of uncertain whales, offering a more comprehensive solution for marine animal monitoring. This method holds great potential for extending to other species, habitats, and remote sensing platforms, as well as for estimating whale biometrics, thereby advancing ecological monitoring and conservation efforts. The codes for our label and detection pipeline are publicly available at http://github.com/voyagerxvoyagerx/beluga-seeker .
- Abstract(参考訳): 超高解像度(VHR)衛星画像は、海洋動物を大規模に監視するための強力なツールとして登場した。
しかし、既存の深層学習に基づくクジラ検出法は、通常、手作業で作成される、高品質なバウンディングボックスアノテーションを必要とする。
さらに、既存の研究では、衛星画像に不明瞭な外観を持つ「不確実なクジラ」を除外し、現実のシナリオにおけるこれらのモデルの適用性を制限している。
これらの制約に対処するため,本研究では,VHR衛星画像におけるベルーガクジラとハープシールの自動検出パイプラインを導入する。
このパイプラインはポイントアノテーションとSAM(Segment Anything Model)を利用して正確なバウンディングボックスアノテーションを生成する。
実験の結果,SAM生成アノテーションは検出性能を大幅に向上し,従来のバッファベースのアノテーションと比較して$\text{F}_\text{1}$-scoresが高くなった。
SAM-labeledボックスで訓練されたYOLOv8は、全体的な$\text{F}_\text{1}$スコア72.2%、ハープシール70.3%を達成し、密集したシーンでは優れたパフォーマンスを示した。
提案手法は、アノテーションに必要な手作業を削減するだけでなく、不確実なクジラの発見も促進し、海洋動物モニタリングのより包括的なソリューションを提供する。
この方法は、他の種、生息地、リモートセンシングプラットフォームにまで拡大し、クジラのバイオメトリックスを推定し、生態モニタリングと保全の努力を促進する大きな可能性を秘めている。
私たちのラベルと検出パイプラインのコードはhttp://github.com/voyagerxvoyagerx/beluga-seekerで公開されています。
関連論文リスト
- Automated Detection of Salvin's Albatrosses: Improving Deep Learning Tools for Aerial Wildlife Surveys [4.936287307711449]
無人航空機(UAV)は高解像度画像を撮影する費用効率のよい手段を提供する。
ニュージーランドのバウンティ諸島におけるサルビンのアルバトロス(Thalassarche salvini)の繁殖個体数を推定するための汎用鳥類検出モデルBirdDetectorの性能評価を行った。
論文 参考訳(メタデータ) (2025-05-15T22:42:44Z) - Weakly Supervised Multiple Instance Learning for Whale Call Detection and Localization in Long-Duration Passive Acoustic Monitoring [2.7418627495572134]
DSMIL-LocNetは,袋レベルのラベルのみを用いて,クジラの呼検出と位置決めを行うフレームワークである。
我々のデュアルストリームモデルは2~30分間の音声セグメントを処理し、スペクトルと時間的特徴と注意に基づくインスタンス選択を利用する。
論文 参考訳(メタデータ) (2025-02-28T08:34:12Z) - Underwater Camouflaged Object Tracking Meets Vision-Language SAM2 [60.47622353256502]
本研究は,UW-COT220という大規模水中カモフラージュ型物体追跡データセットを提案する。
提案したデータセットに基づいて、本研究はまず、水中環境に挑戦するSAMとSAM2ベースのトラッカーを含む、現在の高度な視覚オブジェクト追跡手法を評価する。
本研究はSAM2よりもSAM2を改良し,水中カモフラージュ物体の複雑度を処理できることを実証した。
論文 参考訳(メタデータ) (2024-09-25T13:10:03Z) - SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。
様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - Detecting Endangered Marine Species in Autonomous Underwater Vehicle Imagery Using Point Annotations and Few-Shot Learning [5.439798554380394]
AUV(Autonomous Underwater Vehicles)が収集した海底画像は、より広い生息環境の中で個人を特定するために利用することができる。
機械学習モデルは、訓練されたオブジェクト検出器を使用して、画像中の特定の種の存在を特定するために使用することができる。
本論文は, 数発学習における最近の研究に触発され, 一般的な海洋生物のイメージやアノテーションを利用して, 希少種と秘密種を識別する能力を高める。
論文 参考訳(メタデータ) (2024-06-04T03:31:42Z) - Lazy Layers to Make Fine-Tuned Diffusion Models More Traceable [70.77600345240867]
新たな任意の任意配置(AIAO)戦略は、微調整による除去に耐性を持たせる。
拡散モデルの入力/出力空間のバックドアを設計する既存の手法とは異なり,本手法では,サンプルサブパスの特徴空間にバックドアを埋め込む方法を提案する。
MS-COCO,AFHQ,LSUN,CUB-200,DreamBoothの各データセットに関する実証研究により,AIAOの堅牢性が確認された。
論文 参考訳(メタデータ) (2024-05-01T12:03:39Z) - Whale Detection Enhancement through Synthetic Satellite Images [13.842008598751445]
実際のデータのみをトレーニングに使用した場合と比較して,捕鯨の検出において15%の性能向上が達成できることが示されている。
シミュレーションプラットフォームSeaDroneSim2のコードをオープンソースとして公開しています。
論文 参考訳(メタデータ) (2023-08-15T13:35:29Z) - SOOD: Towards Semi-Supervised Oriented Object Detection [57.05141794402972]
本稿では, 主流の擬似ラベリングフレームワーク上に構築された, SOOD と呼ばれる, 半教師付きオブジェクト指向物体検出モデルを提案する。
提案した2つの損失をトレーニングした場合,SOODはDOTA-v1.5ベンチマークの様々な設定下で,最先端のSSOD法を超越することを示した。
論文 参考訳(メタデータ) (2023-04-10T11:10:42Z) - TempNet: Temporal Attention Towards the Detection of Animal Behaviour in
Videos [63.85815474157357]
本稿では,映像中の生物学的行動を検出するための,効率的なコンピュータビジョンと深層学習に基づく手法を提案する。
TempNetはエンコーダブリッジと残留ブロックを使用して、2段階の空間的、そして時間的、エンコーダでモデル性能を維持する。
本研究では,サブルフィッシュ (Anoplopoma fimbria) 幼虫の検出への応用を実証する。
論文 参考訳(メタデータ) (2022-11-17T23:55:12Z) - Detecting Cattle and Elk in the Wild from Space [6.810164473908359]
衛星画像中の大きな黄体を位置決めし、数えることが生態学研究を支える重要な課題である。
画像中の動物数(カウント)を同時に推定し,その位置をピクセルレベルで(ローカライズ)予測するベースライン手法であるCowNetを提案する。
本稿では,カリフォルニア州ポイント・レーズ海浜の大規模景観における結果モデルの時間的一般化を特に検証する。
論文 参考訳(メタデータ) (2021-06-29T14:35:23Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。