論文の概要: Identifying birdsong syllables without labelled data
- arxiv url: http://arxiv.org/abs/2509.18412v1
- Date: Mon, 22 Sep 2025 20:54:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.581931
- Title: Identifying birdsong syllables without labelled data
- Title(参考訳): ラベル付きデータによる鳥音節の同定
- Authors: Mélisande Teng, Julien Boussard, David Rolnick, Hugo Larochelle,
- Abstract要約: 鳥の鳴き声を音節列に分解する,教師なしのアルゴリズムを初めて構築する。
ベンガルのフィンチ曲のデータセットを用いて,人間のラベルに対する自動アノテーションを評価した。
- 参考スコア(独自算出の注目度): 23.41137933942656
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Identifying sequences of syllables within birdsongs is key to tackling a wide array of challenges, including bird individual identification and better understanding of animal communication and sensory-motor learning. Recently, machine learning approaches have demonstrated great potential to alleviate the need for experts to label long audio recordings by hand. However, they still typically rely on the availability of labelled data for model training, restricting applicability to a few species and datasets. In this work, we build the first fully unsupervised algorithm to decompose birdsong recordings into sequences of syllables. We first detect syllable events, then cluster them to extract templates --syllable representations-- before performing matching pursuit to decompose the recording as a sequence of syllables. We evaluate our automatic annotations against human labels on a dataset of Bengalese finch songs and find that our unsupervised method achieves high performance. We also demonstrate that our approach can distinguish individual birds within a species through their unique vocal signatures, for both Bengalese finches and another species, the great tit.
- Abstract(参考訳): 鳥の個体識別や動物のコミュニケーションの理解の向上、感覚運動学習など、さまざまな課題に取り組む上で、鳥の音節列の同定が鍵となる。
近年、機械学習のアプローチは、専門家が手動で長い音声録音をラベル付けする必要性を緩和する大きな可能性を証明している。
しかしながら、モデルトレーニングにはラベル付きデータの可用性に依存しており、いくつかの種やデータセットの適用性を制限する。
本研究では,鳥の音節を音節列に分解するアルゴリズムを初めて構築する。
まず、まず音節イベントを検出し、それらをクラスタ化してテンプレート(音節表現)を抽出し、その後、一致した追跡を行い、音節の列として録音を分解する。
ベンガルのフィンチ曲のデータセット上で,人間のラベルに対する自動アノテーションを評価し,教師なしの手法が高い性能を達成することを確認した。
我々はまた、ベンガルのフィンチと他の種であるグレート・ティットについて、固有な声の署名によって、種内の個々の鳥類を識別できることを実証した。
関連論文リスト
- The iNaturalist Sounds Dataset [60.157076990024606]
iNatSoundsは、5500種以上の音をキャプチャする23万のオーディオファイルのコレクションで、世界中で27,000人以上のレコーダーが貢献している。
このデータセットは、鳥類、哺乳類、昆虫、虫類、両生類からの音を包含し、iNaturalistに提出された観察から得られたオーディオおよび種名を含む。
我々は、次世代の公的なエンゲージメントアプリケーションを支えるこのデータに基づいて訓練されたモデルを構想し、大規模なオーディオコレクションの処理において生物学者、生態学者、土地利用管理者を支援する。
論文 参考訳(メタデータ) (2025-05-31T02:07:37Z) - Unsupervised outlier detection to improve bird audio dataset labels [0.0]
非標的の鳥類の音は、ラベルノイズと呼ばれる相違点をデータセットにラベル付けする。
本稿では,オーディオ前処理とデメンタリティ低減と教師なし外乱検出を併用したクリーニングプロセスを提案する。
論文 参考訳(メタデータ) (2025-04-25T19:04:40Z) - An Automated Pipeline for Few-Shot Bird Call Classification: A Case Study with the Tooth-Billed Pigeon [0.6282171844772422]
本稿では,BirdNETやPerchのような大規模公開分類器から欠落した希少種を対象としたワンショットバードコール自動分類パイプラインを提案する。
我々は,大型鳥類分類網の埋め込み空間を活用し,コサイン類似性を用いた分類器を開発し,フィルタリングと事前処理技術を組み合わせた。
最終モデルは1.0リコールと0.95の精度で歯を磨いたハトの鳴き声を検知し、現場での使用が現実的になった。
論文 参考訳(メタデータ) (2025-04-22T21:21:41Z) - A Bird Song Detector for improving bird identification through Deep Learning: a case study from Doñana [2.7924253850013416]
鳥類の種を識別する上で重要な課題は、多くの録音が対象の種を欠いているか、重複する発声を含んでいることである。
ドナ国立公園(西スペイン)における鳥声自動識別のための多段階パイプラインを開発した。
そこで,我々はまず,スペクトログラムによる画像処理を用いて鳥の発声を分離するために鳥の歌検出器を適用した。その後,局所的に訓練されたカスタムモデルを用いて種を分類した。
論文 参考訳(メタデータ) (2025-03-19T13:19:06Z) - CAPro: Webly Supervised Learning with Cross-Modality Aligned Prototypes [93.71909293023663]
クロスモダリティ・アライテッド・プロトタイプ(CAPro)は、視覚表現を正しい意味論で学習する統合コントラスト学習フレームワークである。
CAProは、新しい最先端のパフォーマンスを実現し、オープンセット認識に対する堅牢性を示す。
論文 参考訳(メタデータ) (2023-10-15T07:20:22Z) - Unsupervised 3D registration through optimization-guided cyclical
self-training [71.75057371518093]
最先端のディープラーニングベースの登録方法は、3つの異なる学習戦略を採用している。
本稿では,教師なし登録のための自己指導型学習パラダイムを提案する。
腹部, 肺の登録方法の評価を行い, 測定基準に基づく監督を一貫して上回り, 最先端の競争相手よりも優れていた。
論文 参考訳(メタデータ) (2023-06-29T14:54:10Z) - Unsupervised classification to improve the quality of a bird song
recording dataset [0.0]
本稿では,時間周波数音声単位のセグメンテーション,各音単位の特徴計算,各音単位を鳥の歌や雑音として分類する3つのステップからなる,データ中心の新規ラベリング機能を提案する。
ラベル付け機能は,データセットに存在する初期ラベルノイズを最大3倍に低減することができた。
論文 参考訳(メタデータ) (2023-02-15T10:01:58Z) - Melody transcription via generative pre-training [86.08508957229348]
メロディの書き起こしの鍵となる課題は、様々な楽器のアンサンブルや音楽スタイルを含む幅広いオーディオを処理できる方法を構築することである。
この課題に対処するために、広帯域オーディオの生成モデルであるJukebox(Dhariwal et al. 2020)の表現を活用する。
広義音楽のクラウドソースアノテーションから50ドル(約5,400円)のメロディ書き起こしを含む新しいデータセットを導出する。
論文 参考訳(メタデータ) (2022-12-04T18:09:23Z) - Resolving label uncertainty with implicit posterior models [71.62113762278963]
本稿では,データサンプルのコレクション間でラベルを共同で推論する手法を提案する。
異なる予測子を後部とする生成モデルの存在を暗黙的に仮定することにより、弱い信念の下での学習を可能にする訓練目標を導出する。
論文 参考訳(メタデータ) (2022-02-28T18:09:44Z) - Learning Not to Learn in the Presence of Noisy Labels [104.7655376309784]
ギャンブラーの損失と呼ばれる新しい種類の損失関数は、様々なレベルの汚職にまたがってノイズをラベル付けするのに強い堅牢性をもたらすことを示す。
この損失関数によるトレーニングは、ノイズのあるラベルを持つデータポイントでの学習を"維持"することをモデルに促すことを示す。
論文 参考訳(メタデータ) (2020-02-16T09:12:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。