論文の概要: Unsupervised classification to improve the quality of a bird song
recording dataset
- arxiv url: http://arxiv.org/abs/2302.07560v1
- Date: Wed, 15 Feb 2023 10:01:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-16 15:24:43.154900
- Title: Unsupervised classification to improve the quality of a bird song
recording dataset
- Title(参考訳): 鳥の歌録音データセットの品質向上のための教師なし分類
- Authors: F\'elix Michaud (ISYEB ), J\'er\^ome Sueur (ISYEB ), Maxime Le Cesne
(ISYEB ), Sylvain Haupert (ISYEB )
- Abstract要約: 本稿では,時間周波数音声単位のセグメンテーション,各音単位の特徴計算,各音単位を鳥の歌や雑音として分類する3つのステップからなる,データ中心の新規ラベリング機能を提案する。
ラベル付け機能は,データセットに存在する初期ラベルノイズを最大3倍に低減することができた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open audio databases such as Xeno-Canto are widely used to build datasets to
explore bird song repertoire or to train models for automatic bird sound
classification by deep learning algorithms. However, such databases suffer from
the fact that bird sounds are weakly labelled: a species name is attributed to
each audio recording without timestamps that provide the temporal localization
of the bird song of interest. Manual annotations can solve this issue, but they
are time consuming, expert-dependent, and cannot run on large datasets. Another
solution consists in using a labelling function that automatically segments
audio recordings before assigning a label to each segmented audio sample.
Although labelling functions were introduced to expedite strong label
assignment, their classification performance remains mostly unknown. To address
this issue and reduce label noise (wrong label assignment) in large bird song
datasets, we introduce a data-centric novel labelling function composed of
three successive steps: 1) time-frequency sound unit segmentation, 2) feature
computation for each sound unit, and 3) classification of each sound unit as
bird song or noise with either an unsupervised DBSCAN algorithm or the
supervised BirdNET neural network. The labelling function was optimized,
validated, and tested on the songs of 44 West-Palearctic common bird species.
We first showed that the segmentation of bird songs alone aggregated from 10%
to 83% of label noise depending on the species. We also demonstrated that our
labelling function was able to significantly reduce the initial label noise
present in the dataset by up to a factor of three. Finally, we discuss
different opportunities to design suitable labelling functions to build
high-quality animal vocalizations with minimum expert annotation effort.
- Abstract(参考訳): Xeno-Cantoのようなオープンオーディオデータベースは、鳥のレパートリーを探索するためのデータセットの構築や、ディープラーニングアルゴリズムによる鳥の音の自動分類のためのモデルのトレーニングに広く利用されている。
しかし、そのようなデータベースは、鳥の鳴き声が弱くラベル付けされているという事実に悩まされている。
手動アノテーションはこの問題を解決できるが、それらは時間を消費し、専門家に依存しており、大規模なデータセットでは実行できない。
別の解決策は、各セグメント音声サンプルにラベルを割り当てる前に自動的に音声録音をセグメント化するラベル機能を使用することである。
強いラベル割り当てを促進するためにラベル機能を導入したが、その分類性能はほとんど不明である。
この問題に対処し、大きな鳥の歌のデータセットにおけるラベルノイズを低減するために、3つのステップからなるデータ中心の新規ラベル機能を導入する。
1)時間周波数音声単位分割
2)各音響ユニットの特徴計算、及び
3)各音単位を教師なしdbscanアルゴリズムまたは教師なしbirdnetニューラルネットワークで鳥の歌または雑音として分類する。
ラベリング機能は最適化され、検証され、44の西-中腕共通鳥類の鳴き声でテストされた。
まず,鳥の鳴き声のみのセグメンテーションが,ラベルノイズの10%から83%に集約されたことを示した。
また,我々のラベル付け機能は,データセットに存在する初期ラベルノイズを最大3倍に低減できることを示した。
最後に,高品質な動物鳴き声を最小限の専門的アノテーションで構築するための適切なラベル付け関数を設計する様々な機会について論じる。
関連論文リスト
- AlleNoise: large-scale text classification benchmark dataset with real-world label noise [40.11095094521714]
我々は、実世界のインスタンス依存ラベルノイズを持つ新しいキュレートされたテキスト分類ベンチマークであるAlleNoiseを提示する。
ノイズの分布は、主要なeコマースマーケットプレースの実際のユーザから来ており、人間のミスの意味を現実的に反映している。
このような実環境騒音に対処するには,雑音ラベルを用いた学習方法の代表的選択が不十分であることを示す。
論文 参考訳(メタデータ) (2024-06-24T09:29:14Z) - Learning from Time Series under Temporal Label Noise [23.39598516168891]
まず、時系列の逐次分類のための未検討問題である時間ラベルノイズを提案し、定式化する。
提案手法は,実データと合成データを用いた多種多様な時間ラベルノイズ関数の存在下での最先端性能につながることを示す。
論文 参考訳(メタデータ) (2024-02-06T20:56:31Z) - Exploring Meta Information for Audio-based Zero-shot Bird Classification [113.17261694996051]
本研究では,メタ情報を用いてゼロショット音声分類を改善する方法について検討する。
我々は,多種多様なメタデータが利用可能であることから,鳥種を例として用いている。
論文 参考訳(メタデータ) (2023-09-15T13:50:16Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z) - ARCA23K: An audio dataset for investigating open-set label noise [48.683197172795865]
本稿では、23,000以上のラベル付きFreesoundクリップからなる自動検索およびキュレートされたオーディオデータセットであるARCA23Kを紹介する。
本稿では,ARCA23Kのラベリング誤りの大部分は語彙外音声クリップによるものであり,このタイプのラベリングノイズをオープンセットラベルノイズと呼ぶ。
論文 参考訳(メタデータ) (2021-09-19T21:10:25Z) - Instance-dependent Label-noise Learning under a Structural Causal Model [92.76400590283448]
ラベルノイズはディープラーニングアルゴリズムの性能を劣化させる。
構造因果モデルを活用することにより,実例依存型ラベルノイズ学習のための新しい生成手法を提案する。
論文 参考訳(メタデータ) (2021-09-07T10:42:54Z) - Learning with Feature-Dependent Label Noise: A Progressive Approach [19.425199841491246]
一般的なi.i.dよりもはるかに一般的である特徴依存ラベルノイズの新しいファミリーを提案する。
ラベルノイズ。
我々は、様々な(未知)ノイズパターンに対して、この戦略で訓練された分類器がベイズ分類器と一致するように収束することを示す理論的保証を提供する。
論文 参考訳(メタデータ) (2021-03-13T17:34:22Z) - Towards Robustness to Label Noise in Text Classification via Noise
Modeling [7.863638253070439]
NLPの大規模なデータセットは、誤った自動および人間のアノテーション手順のために、ノイズの多いラベルに悩まされる。
本稿では,ラベルノイズを用いたテキスト分類の問題について検討し,分類器上での補助雑音モデルを用いてこのノイズを捉えることを目的とする。
論文 参考訳(メタデータ) (2021-01-27T05:41:57Z) - A Second-Order Approach to Learning with Instance-Dependent Label Noise [58.555527517928596]
ラベルノイズの存在は、しばしばディープニューラルネットワークのトレーニングを誤解させる。
人間による注釈付きラベルのエラーは、タスクの難易度レベルに依存する可能性が高いことを示しています。
論文 参考訳(メタデータ) (2020-12-22T06:36:58Z) - Attention-Aware Noisy Label Learning for Image Classification [97.26664962498887]
大規模ラベル付きサンプルで学習した深層畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンにおいて顕著な進歩を遂げている。
大量のラベル付きビジュアルデータを取得する最も安価な方法は、Flickrのようなユーザーが提供するラベルでウェブサイトからクロールすることである。
本稿では,潜在的なラベルノイズのあるデータセットに基づいて学習したネットワークの識別能力を向上させるために,注目に敏感なラベル学習手法を提案する。
論文 参考訳(メタデータ) (2020-09-30T15:45:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。