論文の概要: A strongly annotated passive acoustic dataset for tropical bird monitoring
- arxiv url: http://arxiv.org/abs/2605.20578v2
- Date: Thu, 21 May 2026 16:34:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:41.908228
- Title: A strongly annotated passive acoustic dataset for tropical bird monitoring
- Title(参考訳): 熱帯鳥モニタリングのための強アノテート受動的音響データセット
- Authors: Daniela Ruiz, Juan Sebastián Ulloa, Zhongqi Miao, Nicolás Betancourt, Maria Paula Toro-Gómez, Andrés Hernández, Bruno Demuro, Eliana Barona-Cortés, Angela Mendoza-Henao, Andrés Sierra-Ricaurte, Sebastián Pérez-Peña, Rahul Dodhia, Pablo Arbeláez, Juan M. Lavista Ferres,
- Abstract要約: PteroSetは,コロンビアのプエルト・アシス(プトゥマヨ)とピビジェイ(マグダレーナ)で記録された,注釈付き異方性鳥の声化のデータベースである。
データセットは、563の記録(73.62h)と15,372の時間周波数アノテーションを含む。
我々はPteroSetのユーザビリティとそれがもたらす課題を実証し、二分鳥検出のためのディープラーニングベースラインを提供する。
- 参考スコア(独自算出の注目度): 6.027371023426081
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Passive acoustic monitoring enables continuous, non-invasive biodiversity assessment across diverse ecosystems. The scale of these datasets has driven the adoption of machine learning, with supervised approaches showing strong performance. However, supervised methods require time-resolved annotated datasets, which remain scarce, especially in complex tropical soundscapes. We present PteroSet, a curated dataset of strongly annotated Neotropical bird vocalizations recorded in Puerto Asis (Putumayo) and Pivijay (Magdalena), Colombia, between 2023 and 2025. The dataset comprises 563 recordings (73.62 h) and 15,372 time-frequency annotations, including 6,702 events identified to the species level across 168 species. We release the annotations in a COCO-inspired JSON schema that unifies audio files, taxonomic categories, and labels for machine learning workflows. Beyond providing annotated data, PteroSet serves as a realistic benchmark that highlights key characteristics of tropical soundscapes, including acoustic co-occurrence and domain shift across recording sites. We provide a deep learning baseline for binary bird detection, demonstrating PteroSet's usability and the challenges it presents.
- Abstract(参考訳): パッシブ・アコースティック・モニタリングは、多様な生態系にわたって継続的に非侵襲的な生物多様性の評価を可能にする。
これらのデータセットの規模は、強力なパフォーマンスを示す教師付きアプローチによって、マシンラーニングの採用を促している。
しかし、教師付き手法では、特に複雑な熱帯の音環境において、時間分解された注釈付きデータセットが不足している。
2023年から2025年の間にプエルトリコのプエルト・アシス(Putumayo)とコロンビアのピビジャイ(Magdalena)で記録された、強く注釈付けされた負方性鳥の声のデータセットであるPteroSetについて紹介する。
データセットは563の記録 (73.62 h) と15,372の時間周波数アノテーションで構成され、そのうち6,702のイベントは168種にわたって種レベルで識別される。
アノテーションをCOCOにインスパイアされたJSONスキーマでリリースし、オーディオファイル、分類学的カテゴリ、マシンラーニングワークフロー用のラベルを統一します。
注釈付きデータの提供以外にも、PteroSetは熱帯のサウンドスケープの重要な特徴を強調するリアルなベンチマークとして機能する。
我々はPteroSetのユーザビリティとそれがもたらす課題を実証し、二分鳥検出のためのディープラーニングベースラインを提供する。
関連論文リスト
- CoarseSoundNet: Building a reliable model for ecological soundscape analysis [73.44688723989053]
サウンドスケープは、生物音(動物音)、地球音(自然無生物音)、人類音(人間音)の3種類からなる。
論文 参考訳(メタデータ) (2026-05-20T13:18:11Z) - The iNaturalist Sounds Dataset [60.157076990024606]
iNatSoundsは、5500種以上の音をキャプチャする23万のオーディオファイルのコレクションで、世界中で27,000人以上のレコーダーが貢献している。
このデータセットは、鳥類、哺乳類、昆虫、虫類、両生類からの音を包含し、iNaturalistに提出された観察から得られたオーディオおよび種名を含む。
我々は、次世代の公的なエンゲージメントアプリケーションを支えるこのデータに基づいて訓練されたモデルを構想し、大規模なオーディオコレクションの処理において生物学者、生態学者、土地利用管理者を支援する。
論文 参考訳(メタデータ) (2025-05-31T02:07:37Z) - ECOSoundSet: a finely annotated dataset for the automated acoustic identification of Orthoptera and Cicadidae in North, Central and temperate Western Europe [51.82780272068934]
ECOSoundSet (European Cicadidae and Orthoptera Sound dataSet) は,北欧,中央ヨーロッパ,温帯西ヨーロッパに分布する200種,24種(亜種を含む場合,それぞれ217種,26種)から10,653種を収録したデータセットである。
このデータセットは、北ヨーロッパ、中央ヨーロッパ、温帯ヨーロッパにおけるオルソプターとシカダの音響分類のための深層学習アルゴリズムの訓練のために、既にオンラインで入手可能な記録に意味のある補完となる可能性がある。
論文 参考訳(メタデータ) (2025-04-29T13:53:33Z) - Semi-supervised classification of bird vocalizations [0.0]
鳥類の個体数の変化は生態系の広範な変化を示す可能性がある。
時間重なり合う鳴き声を検出するための半教師付き音響鳥検知器を提案する。
平均F0.5スコアは315のクラスで0.701で、110種の鳥類をホールドアウトテストセットで記録する。
論文 参考訳(メタデータ) (2025-02-19T05:31:13Z) - NBM: an Open Dataset for the Acoustic Monitoring of Nocturnal Migratory Birds in Europe [0.0]
この研究は、西太平洋の117種から13,359種の注釈付き発声を収集した夜行性鳥類移動データセットを提示する。
このデータセットには正確な時間と頻度のアノテーションが含まれており、フランス全土の何十人もの鳥愛好家によって集められている。
特に,音声データの処理に適した2段階の深層物体検出モデルを訓練することにより,本データベースの有用性を実証する。
論文 参考訳(メタデータ) (2024-12-04T18:55:45Z) - Exploring Meta Information for Audio-based Zero-shot Bird Classification [113.17261694996051]
本研究では,メタ情報を用いてゼロショット音声分類を改善する方法について検討する。
我々は,多種多様なメタデータが利用可能であることから,鳥種を例として用いている。
論文 参考訳(メタデータ) (2023-09-15T13:50:16Z) - AnuraSet: A dataset for benchmarking Neotropical anuran calls
identification in passive acoustic monitoring [0.0]
本稿では,パッシブ・アコースティック・モニタリング(PAM)により記録されたアヌラン呼の大規模データセットを提案する。
我々は、生記録、実験的なセットアップコード、細粒度分類問題のベースラインモデルを用いたベンチマークを含むデータセットへのオープンアクセスを提供する。
このデータセットの課題は、機械学習研究者が保護政策に向けたオーランコール識別の問題を解決することを奨励することにある。
論文 参考訳(メタデータ) (2023-07-11T22:25:21Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。