論文の概要: Introducing a Central African Primate Vocalisation Dataset for Automated
Species Classification
- arxiv url: http://arxiv.org/abs/2101.10390v1
- Date: Mon, 25 Jan 2021 20:21:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-14 18:56:48.304520
- Title: Introducing a Central African Primate Vocalisation Dataset for Automated
Species Classification
- Title(参考訳): 自動種分類のための中央アフリカ霊長類発声データセットの導入
- Authors: Joeri A. Zwerts, Jelle Treep, Casper S. Kaandorp, Floor Meewis, Amparo
C. Koot, Heysem Kaya
- Abstract要約: 収集したデータセットを紹介し、アプローチと初期結果を説明します。
記録をエネルギ・チェンジに基づく自動発声検出により集計した。
4種類の霊長類分類において, 最大82%の非重み付き平均リコール(UAR)試験結果が得られた。
- 参考スコア(独自算出の注目度): 4.322922553076088
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Automated classification of animal vocalisations is a potentially powerful
wildlife monitoring tool. Training robust classifiers requires sizable
annotated datasets, which are not easily recorded in the wild. To circumvent
this problem, we recorded four primate species under semi-natural conditions in
a wildlife sanctuary in Cameroon with the objective to train a classifier
capable of detecting species in the wild. Here, we introduce the collected
dataset, describe our approach and initial results of classifier development.
To increase the efficiency of the annotation process, we condensed the
recordings with an energy/change based automatic vocalisation detection.
Segmenting the annotated chunks into training, validation and test sets,
initial results reveal up to 82% unweighted average recall (UAR) test set
performance in four-class primate species classification.
- Abstract(参考訳): 動物の発声の自動分類は、潜在的に強力な野生動物の監視ツールです。
堅牢な分類器のトレーニングには、相当量の注釈付きデータセットが必要です。
この問題を回避すべく,カメルーンの野生生物保護区において,野生生物を検出可能な分類器の訓練を目的として,半自然条件下で4種の霊長類を記録した。
本稿では,収集したデータセットを紹介し,このアプローチと分類器開発の初期結果について述べる。
アノテーション処理の効率を高めるために,エネルギ/チェンジに基づく自動発声検出により録音を凝縮した。
注釈付きチャンクをトレーニング,検証,テストセットに分割した結果,4種類の霊長類分類において,最大82%の非重み付き平均リコール(UAR)テストセットの性能が確認された。
関連論文リスト
- Efficient Transferability Assessment for Selection of Pre-trained Detectors [63.21514888618542]
本稿では,事前学習対象検出器の効率的な伝達性評価について検討する。
我々は、事前訓練された検出器の大規模で多様な動物園を含む検出器転送性ベンチマークを構築した。
実験により,本手法は伝達性の評価において,他の最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-03-14T14:23:23Z) - All Thresholds Barred: Direct Estimation of Call Density in Bioacoustic
Data [1.7916003204531015]
本研究では,データ単位の呼び出し密度を推定するための検証手法を提案する。
我々はこれらの分布を用いて、分布シフトの対象となるサイトレベルの密度を予測する。
論文 参考訳(メタデータ) (2024-02-23T14:52:44Z) - Improving Primate Sounds Classification using Binary Presorting for Deep
Learning [6.044912425856236]
本稿では,MELスペクトル表現のサブセグメンテーションを初めてリラベルする一般化アプローチを提案する。
バイナリプリソートと分類の両方において、畳み込みニューラルネットワーク(CNN)と様々なデータ拡張技術を利用する。
本研究は,異なる霊長類種の音の分類を課題とする,挑戦的なTextitComparE 2021データセットについて,本手法の結果を紹介する。
論文 参考訳(メタデータ) (2023-06-28T09:35:09Z) - Low-complexity deep learning frameworks for acoustic scene
classification [64.22762153453175]
音響シーン分類(ASC)のための低複雑さ深層学習フレームワークを提案する。
提案するフレームワークは、フロントエンドのスペクトログラム抽出、オンラインデータ拡張、バックエンドの分類、予測される確率の後期融合の4つの主要なステップに分けることができる。
DCASE 2022 Task 1 Development データセットで実施した実験は,低複雑さの要求を十分に満たし,最も高い分類精度を 60.1% で達成した。
論文 参考訳(メタデータ) (2022-06-13T11:41:39Z) - Classification of animal sounds in a hyperdiverse rainforest using
Convolutional Neural Networks [0.0]
受動的に記録された音場から機械学習アプローチによる自動種検出は有望な手法である。
本研究では,ボルネオの熱帯林の音環境と,移動学習による畳み込みニューラルネットワークモデル(CNN)を用いた。
以上の結果から,トランスファー学習とデータ拡張は,多くの稀な種を持つ小さなサウンドスケーププロジェクトにおいても,CNNを用いて声の分類が可能であることが示唆された。
論文 参考訳(メタデータ) (2021-11-29T21:34:57Z) - Prototypical Classifier for Robust Class-Imbalanced Learning [64.96088324684683]
埋め込みネットワークに付加的なパラメータを必要としないtextitPrototypealを提案する。
プロトタイプは、訓練セットがクラス不均衡であるにもかかわらず、すべてのクラスに対してバランスと同等の予測を生成する。
我々は, CIFAR-10LT, CIFAR-100LT, Webvision のデータセットを用いて, プロトタイプが芸術の状況と比較した場合, サブスタンスの改善が得られることを検証した。
論文 参考訳(メタデータ) (2021-10-22T01:55:01Z) - Recognizing bird species in diverse soundscapes under weak supervision [0.2148535041822524]
複雑で多様なサウンドスケープにおける鳥の発声に対するロバストな分類手法を提案し,BirdCLEF 2021チャレンジにおいて第2位を獲得した。
本稿では,新しい拡張法で補足された効率的なモデリングとトレーニングルーチンを用いることで,事前学習した畳み込みニューラルネットワークをフル活用する方法を説明する。
論文 参考訳(メタデータ) (2021-07-16T06:54:38Z) - Training Classifiers that are Universally Robust to All Label Noise
Levels [91.13870793906968]
ディープニューラルネットワークは、ラベルノイズの存在下で過度に適合する傾向がある。
ポジティヴ・アンラベルラーニングの新たなサブカテゴリを取り入れた蒸留ベースのフレームワークを提案する。
我々の枠組みは概して中~高騒音レベルにおいて優れています。
論文 参考訳(メタデータ) (2021-05-27T13:49:31Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Towards Robustness to Label Noise in Text Classification via Noise
Modeling [7.863638253070439]
NLPの大規模なデータセットは、誤った自動および人間のアノテーション手順のために、ノイズの多いラベルに悩まされる。
本稿では,ラベルノイズを用いたテキスト分類の問題について検討し,分類器上での補助雑音モデルを用いてこのノイズを捉えることを目的とする。
論文 参考訳(メタデータ) (2021-01-27T05:41:57Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。