論文の概要: An empirical investigation into audio pipeline approaches for
classifying bird species
- arxiv url: http://arxiv.org/abs/2108.04449v1
- Date: Tue, 10 Aug 2021 05:02:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-11 23:18:40.190527
- Title: An empirical investigation into audio pipeline approaches for
classifying bird species
- Title(参考訳): 鳥類の分類のためのオーディオパイプラインアプローチに関する実証的研究
- Authors: David Behr, Ciira wa Maina, Vukosi Marivate
- Abstract要約: 本論文は,鳥類種のモニタリングに適した音声分類パイプラインの側面について検討する。
従来のディープニューラルネットワーク(DNN)の有効性を探求するアプローチと、畳み込みレイヤを利用するアプローチの2つを考慮する。
- 参考スコア(独自算出の注目度): 0.9158130615768508
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper is an investigation into aspects of an audio classification
pipeline that will be appropriate for the monitoring of bird species on edges
devices. These aspects include transfer learning, data augmentation and model
optimization. The hope is that the resulting models will be good candidates to
deploy on edge devices to monitor bird populations. Two classification
approaches will be taken into consideration, one which explores the
effectiveness of a traditional Deep Neural Network(DNN) and another that makes
use of Convolutional layers.This study aims to contribute empirical evidence of
the merits and demerits of each approach.
- Abstract(参考訳): 本稿では,エッジデバイス上での鳥類種のモニタリングに適した音声分類パイプラインについて検討する。
これらの側面には、転送学習、データ拡張、モデル最適化が含まれる。
結果のモデルが、鳥の個体数を監視するためにエッジデバイスにデプロイする良い候補になることを期待している。
従来型深層ニューラルネットワーク(dnn)と畳み込み層(dnn)の有効性を検討する2つの分類手法を考察し,それぞれのアプローチのメリットとデメリットに関する実証的証拠を提供することを目的としている。
関連論文リスト
- AudioProtoPNet: An interpretable deep learning model for bird sound classification [1.49199020343864]
本研究では,マルチラベル鳥の音の分類にPrototypeal Part Network(ProtoPNet)を適応したAudioProtoPNetを紹介する。
これは本質的に解釈可能なモデルであり、埋め込みを抽出するためにConvNeXtのバックボーンを使用する。
このモデルは、9,734種の鳥類と6,800時間以上の録音からなるBirdSetトレーニングデータセットで訓練された。
論文 参考訳(メタデータ) (2024-04-16T09:37:41Z) - Efficient Transferability Assessment for Selection of Pre-trained Detectors [63.21514888618542]
本稿では,事前学習対象検出器の効率的な伝達性評価について検討する。
我々は、事前訓練された検出器の大規模で多様な動物園を含む検出器転送性ベンチマークを構築した。
実験により,本手法は伝達性の評価において,他の最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-03-14T14:23:23Z) - Exploring Meta Information for Audio-based Zero-shot Bird Classification [113.17261694996051]
本研究では,メタ情報を用いてゼロショット音声分類を改善する方法について検討する。
我々は,多種多様なメタデータが利用可能であることから,鳥種を例として用いている。
論文 参考訳(メタデータ) (2023-09-15T13:50:16Z) - Active Bird2Vec: Towards End-to-End Bird Sound Monitoring with
Transformers [2.404305970432934]
自己教師付き(SSL)と深層能動学習(DAL)を組み合わせた鳥音モニタリングにおけるエンドツーエンド学習へのシフトを提案する。
我々は,従来のスペクトログラム変換をバイパスし,直接生音声処理を実現することを目的としている。
論文 参考訳(メタデータ) (2023-08-14T13:06:10Z) - Transfer Learning with Semi-Supervised Dataset Annotation for Birdcall
Classification [0.0]
本研究では,BirdCLEF 2023コンペティションのための半教師付きデータセットアノテーションを用いたトランスファー学習について検討する。
提案手法では,既存の市販モデルであるBirdNETとMixITを用いて,コンペティションにおける表現とラベル付けの課題に対処する。
論文 参考訳(メタデータ) (2023-06-29T07:56:27Z) - Improving Primate Sounds Classification using Binary Presorting for Deep
Learning [6.044912425856236]
本稿では,MELスペクトル表現のサブセグメンテーションを初めてリラベルする一般化アプローチを提案する。
バイナリプリソートと分類の両方において、畳み込みニューラルネットワーク(CNN)と様々なデータ拡張技術を利用する。
本研究は,異なる霊長類種の音の分類を課題とする,挑戦的なTextitComparE 2021データセットについて,本手法の結果を紹介する。
論文 参考訳(メタデータ) (2023-06-28T09:35:09Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - Guiding Generative Language Models for Data Augmentation in Few-Shot
Text Classification [59.698811329287174]
我々は、GPT-2を用いて、分類性能を向上させるために、人工訓練インスタンスを生成する。
実験の結果,少数のラベルインスタンスでGPT-2を微調整すると,一貫した分類精度が向上することがわかった。
論文 参考訳(メタデータ) (2021-11-17T12:10:03Z) - Parsing Birdsong with Deep Audio Embeddings [0.5599792629509227]
特徴呼と環境騒音を半教師付きで同定する手法を提案する。
我々は、畳み込みオートエンコーダと2つの事前学習ネットワークを含む、音声サンプルの潜在表現を学習するために、いくつかの手法を利用する。
論文 参考訳(メタデータ) (2021-08-20T14:45:44Z) - Intersection Regularization for Extracting Semantic Attributes [72.53481390411173]
本稿では,ネットワーク抽出した特徴が意味属性のセットと一致するように,教師付き分類の問題を考える。
例えば、鳥類のイメージを種に分類することを学ぶとき、動物学者が鳥類を分類するために使用する特徴の出現を観察したい。
本稿では,複数層パーセプトロン(MLP)と並列決定木を併用した,離散的なトップレベルアクティベーションを持つニューラルネットワークのトレーニングを提案する。
論文 参考訳(メタデータ) (2021-03-22T14:32:44Z) - Classification of Smoking and Calling using Deep Learning [49.10965021800014]
予め訓練されたV3を変更することにより、喫煙と呼び出しの分類を行うパイプラインを導入する。
深層学習に基づく明度向上は、この分類タスクの分類と、他の有用なトレーニングトリックを改善するために実施される。
論文 参考訳(メタデータ) (2020-12-15T00:59:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。