論文の概要: Positive-Unlabelled Active Learning to Curate a Dataset for Orca Resident Interpretation
- arxiv url: http://arxiv.org/abs/2602.09295v1
- Date: Tue, 10 Feb 2026 00:25:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-11 20:17:43.294205
- Title: Positive-Unlabelled Active Learning to Curate a Dataset for Orca Resident Interpretation
- Title(参考訳): 正アンラベル型能動学習によるオルカ住民解釈のためのデータセットの算出
- Authors: Bret Nestor, Bohan Yao, Jasmine Moore, Jasper Kanes,
- Abstract要約: この研究は、サザン・レジデント・キラー鯨 (SRKW) の音響データの最大のキュレーションを行っている。
探索は、海洋哺乳類のすべての事例を特定するために、弱く監督された、ポジティブな、活発な学習戦略から成り立っている。
919時間のSRKWデータ、230時間のBiggのオルカデータ、1374時間のエコタイプからのオルカデータ、1501時間のハンプバックデータ、88時間の海ライオンデータ、246時間の白面イルカデータ、そして784時間の海哺乳類データを生成しました。
- 参考スコア(独自算出の注目度): 1.7499351967216341
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This work presents the largest curation of Southern Resident Killer Whale (SRKW) acoustic data to date, also containing other marine mammals in their environment. We systematically search all available public archival hydrophone data within the SRKW habitat (over 30 years of audio data). The search consists of a weakly-supervised, positive-unlabelled, active learning strategy to identify all instances of marine mammals. The resulting transformer-based detectors outperform state-of-the-art detectors on the DEEPAL, DCLDE-2026, and two newly introduced expert-annotated datasets in terms of accuracy, energy efficiency, and speed. The detection model has a specificity of 0-28.8% at 95% sensitivity. Our multiclass species classifier obtains a top-1 accuracy of 42.1% (11 train classes, 4 test classes) and our ecotype classifier obtains a top-1 accuracy of 43.0% (4 train classes, 5 test classes) on the DCLDE-2026 dataset. We yield 919 hours of SRKW data, 230 hours of Bigg's orca data, 1374 hours of orca data from unlabelled ecotypes, 1501 hours of humpback data, 88 hours of sea lion data, 246 hours of pacific white-sided dolphin data, and over 784 hours of unspecified marine mammal data. This SRKW dataset is larger than DCLDE-2026, Ocean Networks Canada, and OrcaSound combined. The curated species labels are available under CC-BY 4.0 license, and the corresponding audio data are available under the licenses of the original owners. The comprehensive nature of this dataset makes it suitable for unsupervised machine translation, habitat usage surveys, and conservation endeavours for this critically endangered ecotype.
- Abstract(参考訳): この研究は、サザン・レジデント・キラー鯨 (SRKW) の音響データの中で最も大きなキュレーションを行い、その環境に他の海洋哺乳動物も含んでいる。
SRKWの生息域内(30年以上のオーディオデータ)で利用可能なすべての公用アーカイブ・ハイドロフォンデータを体系的に検索する。
調査は、海洋哺乳類のすべての事例を特定するために、弱く監督された、ポジティブな、活発な学習戦略から成っている。
得られた変換器ベースの検出器は、DEEPAL、DCLDE-2026、および新たに導入された2つの専門家アノテートデータセットの精度、エネルギー効率、速度において、最先端の検出器を上回っている。
検出モデルは95%感度で0-28.8%の特異性を有する。
種別分類器は42.1%(列車クラス11種,試験クラス4種),エコタイプ分類器は43.0%(列車クラス4種,試験クラス5種)をDCLDE-2026データセット上で取得した。
919時間のSRKWデータ、230時間のBiggのオルカデータ、1374時間のエコタイプからのオルカデータ、1501時間のハンプバックデータ、88時間の海ライオンデータ、246時間の白面イルカデータ、そして784時間の海哺乳類データを生成しました。
このSRKWデータセットは、DCLDE-2026、Ocean Networks Canada、OrcaSoundの組み合わせよりも大きい。
キュレートされた種ラベルはCC-BY 4.0ライセンスで利用可能であり、対応するオーディオデータは元の所有者のライセンスで利用可能である。
このデータセットの包括的性質は、教師なし機械翻訳、生息地利用調査、およびこの危機的危険に曝されたエコタイプのための保全努力に適している。
関連論文リスト
- NASTaR: NovaSAR Automated Ship Target Recognition Dataset [1.8957631297817699]
このデータセットは、NovaSAR Sバンド画像から抽出された3415個の船のパッチからなる。
23のユニークなクラス、海岸/オフショアの分離、および船のウェイクが見えるパッチのための補助的なウェイクデータセットなどが含まれる。
ベンチマーク深層学習モデルを用いて,船型分類シナリオにおけるデータセットの適用性を検証した。
論文 参考訳(メタデータ) (2025-12-20T20:42:30Z) - PriVi: Towards A General-Purpose Video Model For Primate Behavior In The Wild [50.656578456979496]
大規模な霊長類中心のビデオ事前トレーニングデータセットであるPriViを紹介する。
大規模ビデオモデルであるV-JEPAをPriVi上でプレトレーニングし、霊長類固有の表現を学習する。
その結果、霊長類中心の事前学習はデータ効率と一般化を大幅に改善することが示された。
論文 参考訳(メタデータ) (2025-11-12T19:27:40Z) - The iNaturalist Sounds Dataset [60.157076990024606]
iNatSoundsは、5500種以上の音をキャプチャする23万のオーディオファイルのコレクションで、世界中で27,000人以上のレコーダーが貢献している。
このデータセットは、鳥類、哺乳類、昆虫、虫類、両生類からの音を包含し、iNaturalistに提出された観察から得られたオーディオおよび種名を含む。
我々は、次世代の公的なエンゲージメントアプリケーションを支えるこのデータに基づいて訓練されたモデルを構想し、大規模なオーディオコレクションの処理において生物学者、生態学者、土地利用管理者を支援する。
論文 参考訳(メタデータ) (2025-05-31T02:07:37Z) - ECOSoundSet: a finely annotated dataset for the automated acoustic identification of Orthoptera and Cicadidae in North, Central and temperate Western Europe [51.82780272068934]
ECOSoundSet (European Cicadidae and Orthoptera Sound dataSet) は,北欧,中央ヨーロッパ,温帯西ヨーロッパに分布する200種,24種(亜種を含む場合,それぞれ217種,26種)から10,653種を収録したデータセットである。
このデータセットは、北ヨーロッパ、中央ヨーロッパ、温帯ヨーロッパにおけるオルソプターとシカダの音響分類のための深層学習アルゴリズムの訓練のために、既にオンラインで入手可能な記録に意味のある補完となる可能性がある。
論文 参考訳(メタデータ) (2025-04-29T13:53:33Z) - NBM: an Open Dataset for the Acoustic Monitoring of Nocturnal Migratory Birds in Europe [0.0]
この研究は、西太平洋の117種から13,359種の注釈付き発声を収集した夜行性鳥類移動データセットを提示する。
このデータセットには正確な時間と頻度のアノテーションが含まれており、フランス全土の何十人もの鳥愛好家によって集められている。
特に,音声データの処理に適した2段階の深層物体検出モデルを訓練することにより,本データベースの有用性を実証する。
論文 参考訳(メタデータ) (2024-12-04T18:55:45Z) - MosquitoFusion: A Multiclass Dataset for Real-Time Detection of Mosquitoes, Swarms, and Breeding Sites Using Deep Learning [0.0]
1204種類の画像を含むマルチクラスデータセット(MosquitoFusion)を用いたリアルタイム蚊検出への統合的アプローチを提案する。
トレーニング済みのYOLOv8モデルは、このデータセットに基づいてトレーニングされ、平均平均精度(mAP@50)が57.1%、精度73.4%、リコール50.5%に達した。
論文 参考訳(メタデータ) (2024-04-01T21:49:05Z) - WhaleNet: a Novel Deep Learning Architecture for Marine Mammals Vocalizations on Watkins Marine Mammal Sound Database [49.1574468325115]
textbfWhaleNet (Wavelet Highly Adaptive Learning Ensemble Network) は海洋哺乳動物の発声を分類するための高度な深層アンサンブルアーキテクチャである。
既存のアーキテクチャよりも8-10%の精度で分類精度を向上し、分類精度は9,7.61%である。
論文 参考訳(メタデータ) (2024-02-20T11:36:23Z) - Oceanship: A Large-Scale Dataset for Underwater Audio Target Recognition [22.890584326036976]
大規模かつ多様な水中オーディオデータセットであるOceanshipを提案する。
このデータセットは15のカテゴリで構成され、総期間は121時間であり、座標、速度、船舶タイプ、タイムスタンプといった包括的なアノテーション情報を含んでいる。
水中オーディオ検索のためのベースラインモデルであるOceannetを導入する。このモデルでは、67.11%の精度で1(R@1)、Deepshipデータセットで5(R@5)の精度で99.13%のリコールを実現している。
論文 参考訳(メタデータ) (2024-01-04T07:11:16Z) - SatBird: Bird Species Distribution Modeling with Remote Sensing and
Citizen Science Data [68.2366021016172]
本稿では,市民科学データベース eBird の観測データから得られたラベルを用いた,米国内の位置情報のサテライトデータセットである SatBird について述べる。
ケニアでは低データのレシエーションを表すデータセットも提供しています。
リモートセンシングタスクのためのSOTAモデルを含む、データセットのベースラインセットをベンチマークします。
論文 参考訳(メタデータ) (2023-11-02T02:00:27Z) - Deep object detection for waterbird monitoring using aerial imagery [56.1262568293658]
本研究では,商用ドローンで収集した空中画像を用いて,水鳥の正確な検出,数え,監視に使用できる深層学習パイプラインを提案する。
畳み込み型ニューラルネットワークを用いた物体検出装置を用いて,テキサス沿岸の植民地性営巣島でよく見られる16種類の水鳥を検出できることを示す。
論文 参考訳(メタデータ) (2022-10-10T17:37:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。