論文の概要: An Automated Pipeline for Few-Shot Bird Call Classification: A Case Study with the Tooth-Billed Pigeon
- arxiv url: http://arxiv.org/abs/2504.16276v1
- Date: Tue, 22 Apr 2025 21:21:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:52.93925
- Title: An Automated Pipeline for Few-Shot Bird Call Classification: A Case Study with the Tooth-Billed Pigeon
- Title(参考訳): Few-Shot Bird Call 分類のための自動パイプラインの試作
- Authors: Abhishek Jana, Moeumu Uili, James Atherton, Mark O'Brien, Joe Wood, Leandra Brickson,
- Abstract要約: 本稿では,BirdNETやPerchのような大規模公開分類器から欠落した希少種を対象としたワンショットバードコール自動分類パイプラインを提案する。
我々は,大型鳥類分類網の埋め込み空間を活用し,コサイン類似性を用いた分類器を開発し,フィルタリングと事前処理技術を組み合わせた。
最終モデルは1.0リコールと0.95の精度で歯を磨いたハトの鳴き声を検知し、現場での使用が現実的になった。
- 参考スコア(独自算出の注目度): 0.6282171844772422
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper presents an automated one-shot bird call classification pipeline designed for rare species absent from large publicly available classifiers like BirdNET and Perch. While these models excel at detecting common birds with abundant training data, they lack options for species with only 1-3 known recordings-a critical limitation for conservationists monitoring the last remaining individuals of endangered birds. To address this, we leverage the embedding space of large bird classification networks and develop a classifier using cosine similarity, combined with filtering and denoising preprocessing techniques, to optimize detection with minimal training data. We evaluate various embedding spaces using clustering metrics and validate our approach in both a simulated scenario with Xeno-Canto recordings and a real-world test on the critically endangered tooth-billed pigeon (Didunculus strigirostris), which has no existing classifiers and only three confirmed recordings. The final model achieved 1.0 recall and 0.95 accuracy in detecting tooth-billed pigeon calls, making it practical for use in the field. This open-source system provides a practical tool for conservationists seeking to detect and monitor rare species on the brink of extinction.
- Abstract(参考訳): 本稿では,BirdNETやPerchのような大規模公開分類器から欠落した希少種を対象としたワンショットバードコール自動分類パイプラインを提案する。
これらのモデルは、多くの訓練データで一般的な鳥類を検知する能力に優れていますが、既知の記録は1-3種しかなく、絶滅危惧鳥類の生き残りを観察する保護主義者にとって重要な制限です。
そこで我々は,大規模な鳥の分類網の埋め込み空間を活用し,コサイン類似性を用いた分類器を開発し,フィルタリングと事前処理技術を組み合わせて,最小限の訓練データによる検出を最適化する。
我々は,クラスタリング指標を用いて各種埋没空間の評価を行い,Xeno-Canto 記録を用いたシミュレーションシナリオと,既存の分類器と確認された3つの記録しか持たない絶滅危惧種 (Didunculus strigirostris) の実世界試験の両方において,我々のアプローチを検証した。
最終モデルは1.0リコールと0.95の精度で歯を磨いたハトの鳴き声を検知し、現場での使用が現実的になった。
このオープンソースのシステムは、絶滅の瀬戸際で希少種を検知し、監視しようとする保護主義者に実用的なツールを提供する。
関連論文リスト
- Unsupervised outlier detection to improve bird audio dataset labels [0.0]
非標的の鳥類の音は、ラベルノイズと呼ばれる相違点をデータセットにラベル付けする。
本稿では,オーディオ前処理とデメンタリティ低減と教師なし外乱検出を併用したクリーニングプロセスを提案する。
論文 参考訳(メタデータ) (2025-04-25T19:04:40Z) - A Bird Song Detector for improving bird identification through Deep Learning: a case study from Doñana [2.7924253850013416]
ドナ国立公園(西スペイン)における鳥声自動識別パイプラインの開発
9ヶ所の生息地から461分間の音声を手動でアノテートし,34の授業で3,749のアノテーションを得た。
分類前のバード・ソング・ディテクターの適用により種識別が向上し、鳥類が検出されたセグメントのみを分析する場合、すべての分類モデルが改善された。
論文 参考訳(メタデータ) (2025-03-19T13:19:06Z) - Few-shot Species Range Estimation [61.60698161072356]
特定の種が地球上でどこで発見できるかを知ることは、生態学の研究と保全に不可欠である。
我々は、限られたデータから種の範囲を正確に推定することの難しさに対処するために、数発の種範囲推定の新しいアプローチを概説する。
推測において,本モデルでは,テキストや画像などの任意のメタデータとともに,空間的位置のセットを入力として取り,フィードフォワード方式で未確認種の範囲を予測できる種を出力する。
論文 参考訳(メタデータ) (2025-02-20T19:13:29Z) - Semi-supervised classification of bird vocalizations [0.0]
鳥類の個体数の変化は生態系の広範な変化を示す可能性がある。
時間重なり合う鳴き声を検出するための半教師付き音響鳥検知器を提案する。
平均F0.5スコアは315のクラスで0.701で、110種の鳥類をホールドアウトテストセットで記録する。
論文 参考訳(メタデータ) (2025-02-19T05:31:13Z) - NBM: an Open Dataset for the Acoustic Monitoring of Nocturnal Migratory Birds in Europe [0.0]
この研究は、西太平洋の117種から13,359種の注釈付き発声を収集した夜行性鳥類移動データセットを提示する。
このデータセットには正確な時間と頻度のアノテーションが含まれており、フランス全土の何十人もの鳥愛好家によって集められている。
特に,音声データの処理に適した2段階の深層物体検出モデルを訓練することにより,本データベースの有用性を実証する。
論文 参考訳(メタデータ) (2024-12-04T18:55:45Z) - Automated Bioacoustic Monitoring for South African Bird Species on Unlabeled Data [1.3506669466260703]
このフレームワークは、選択された鳥類種の利用可能なプラットフォームからラベル付きデータを自動抽出する。
ラベル付きデータは、環境音やノイズを含む録音に埋め込まれ、畳み込みリカレントニューラルネットワーク(CRNN)モデルのトレーニングに使用された。
適応SED-CRNNモデルはF1スコア0.73に達し、ノイズの多い実世界の条件下で効率を実証した。
論文 参考訳(メタデータ) (2024-06-19T14:14:24Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z) - TempNet: Temporal Attention Towards the Detection of Animal Behaviour in
Videos [63.85815474157357]
本稿では,映像中の生物学的行動を検出するための,効率的なコンピュータビジョンと深層学習に基づく手法を提案する。
TempNetはエンコーダブリッジと残留ブロックを使用して、2段階の空間的、そして時間的、エンコーダでモデル性能を維持する。
本研究では,サブルフィッシュ (Anoplopoma fimbria) 幼虫の検出への応用を実証する。
論文 参考訳(メタデータ) (2022-11-17T23:55:12Z) - Deep object detection for waterbird monitoring using aerial imagery [56.1262568293658]
本研究では,商用ドローンで収集した空中画像を用いて,水鳥の正確な検出,数え,監視に使用できる深層学習パイプラインを提案する。
畳み込み型ニューラルネットワークを用いた物体検出装置を用いて,テキサス沿岸の植民地性営巣島でよく見られる16種類の水鳥を検出できることを示す。
論文 参考訳(メタデータ) (2022-10-10T17:37:56Z) - Intersection Regularization for Extracting Semantic Attributes [72.53481390411173]
本稿では,ネットワーク抽出した特徴が意味属性のセットと一致するように,教師付き分類の問題を考える。
例えば、鳥類のイメージを種に分類することを学ぶとき、動物学者が鳥類を分類するために使用する特徴の出現を観察したい。
本稿では,複数層パーセプトロン(MLP)と並列決定木を併用した,離散的なトップレベルアクティベーションを持つニューラルネットワークのトレーニングを提案する。
論文 参考訳(メタデータ) (2021-03-22T14:32:44Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。