論文の概要: Classification of animal sounds in a hyperdiverse rainforest using
Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2111.14971v1
- Date: Mon, 29 Nov 2021 21:34:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 15:56:30.332449
- Title: Classification of animal sounds in a hyperdiverse rainforest using
Convolutional Neural Networks
- Title(参考訳): 畳み込みニューラルネットワークを用いた熱帯雨林における動物の音の分類
- Authors: Yuren Sun, Tatiana Midori Maeda, Claudia Solis-Lemus, Daniel
Pimentel-Alarcon, Zuzana Burivalova
- Abstract要約: 受動的に記録された音場から機械学習アプローチによる自動種検出は有望な手法である。
本研究では,ボルネオの熱帯林の音環境と,移動学習による畳み込みニューラルネットワークモデル(CNN)を用いた。
以上の結果から,トランスファー学習とデータ拡張は,多くの稀な種を持つ小さなサウンドスケーププロジェクトにおいても,CNNを用いて声の分類が可能であることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: To protect tropical forest biodiversity, we need to be able to detect it
reliably, cheaply, and at scale. Automated species detection from passively
recorded soundscapes via machine-learning approaches is a promising technique
towards this goal, but it is constrained by the necessity of large training
data sets. Using soundscapes from a tropical forest in Borneo and a
Convolutional Neural Network model (CNN) created with transfer learning, we
investigate i) the minimum viable training data set size for accurate
prediction of call types ('sonotypes'), and ii) the extent to which data
augmentation can overcome the issue of small training data sets. We found that
even relatively high sample sizes (> 80 per call type) lead to mediocre
accuracy, which however improves significantly with data augmentation,
including at extremely small sample sizes, regardless of taxonomic group or
call characteristics. Our results suggest that transfer learning and data
augmentation can make the use of CNNs to classify species' vocalizations
feasible even for small soundscape-based projects with many rare species. Our
open-source method has the potential to enable conservation initiatives become
more evidence-based by using soundscape data in the adaptive management of
biodiversity.
- Abstract(参考訳): 熱帯林の生物多様性を保護するためには, 信頼性, 安価, 大規模に検出できる必要がある。
機械学習アプローチによる受動的に記録された音場からの自動種検出は、この目標に向けて有望な手法であるが、大規模なトレーニングデータセットの必要性に制約されている。
ボルネオの熱帯林からのサウンドスケープとトランスファー学習を用いた畳み込みニューラルネットワークモデル(cnn)を用いて検討した。
一 コールタイプ(「ソノタイプ」)の正確な予測のための最小限の訓練データセットのサイズ及び
二 小規模な訓練データセットの問題点を克服できる範囲
その結果, 比較的高いサンプルサイズ(コールタイプ80)でも中程度の精度が得られ, しかし, 分類群や呼び出し特性に関わらず, 極めて小さなサンプルサイズを含むデータ拡張では有意に改善することがわかった。
以上の結果から,トランスファー学習とデータ拡張は,多くの稀な種を持つ小さなサウンドスケーププロジェクトにおいても,CNNを用いて声の分類が可能であることが示唆された。
我々のオープンソース手法は,生物多様性の適応管理にサウンドスケープデータを用いることで,よりエビデンスに基づく保全活動を可能にする可能性がある。
関連論文リスト
- Explainable few-shot learning workflow for detecting invasive and exotic tree species [42.30413964219434]
本研究は,ブラジルのアトランティック・フォレストにおいて,外来樹種や外来樹種を検出するための,説明可能な数発の学習ワークフローを提案する。
このワークフローは、Siameseネットワークと説明可能なAI(XAI)を統合することで、最小のラベル付きデータで木種の分類を可能にする。
その結果,データスカース条件下においても,新たな木種を同定するためのワークフローの有効性が示された。
論文 参考訳(メタデータ) (2024-11-01T15:45:19Z) - Deep learning-based ecological analysis of camera trap images is impacted by training data quality and size [11.153016596465593]
アフリカサバンナとアジア亜熱帯乾燥林のカメラトラップデータの解析を行った。
我々は、専門家による種同定から得られた重要な生態指標と、深層ニューラルネットワークから生成された指標を比較した。
その結果、モデルアーキテクチャは最小限の影響しか与えないが、大量のノイズとデータセットサイズがこれらの指標に大きく影響していることが判明した。
論文 参考訳(メタデータ) (2024-08-26T15:26:27Z) - TinyChirp: Bird Song Recognition Using TinyML Models on Low-power Wireless Acoustic Sensors [1.0790796076947324]
大規模な生物多様性のモニタリングは難しい。
微細な粒度の種の検出と識別には、高度に正確な機械学習(ML)手法が必要である。
これらのモデルを低消費電力デバイスにデプロイするには、新しい圧縮技術とモデルアーキテクチャが必要である。
論文 参考訳(メタデータ) (2024-07-31T08:57:42Z) - Just How Flexible are Neural Networks in Practice? [89.80474583606242]
ニューラルネットワークは、パラメータを持つ少なくとも多くのサンプルを含むトレーニングセットに適合できると広く信じられている。
しかし実際には、勾配や正規化子など、柔軟性を制限したトレーニング手順によるソリューションしか見つからない。
論文 参考訳(メタデータ) (2024-06-17T12:24:45Z) - Transferable Models for Bioacoustics with Human Language Supervision [0.0]
BioLingualは、対照的な言語-オーディオ事前学習に基づくバイオ音響学の新しいモデルである。
分類群にまたがる1000種以上の呼び出しを識別し、完全なバイオ音響タスクをゼロショットで実行し、自然のテキストクエリから動物の発声記録を検索する。
論文 参考訳(メタデータ) (2023-08-09T14:22:18Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - Ensembles of Vision Transformers as a New Paradigm for Automated
Classification in Ecology [0.0]
データ効率のよい画像変換器(DeiTs)のアンサンブルが従来のSOTA(SOTA)よりも大幅に優れていたことを示す。
テストしたすべてのデータセットに対して、新しいSOTAを実現し、以前のSOTAの18.48%から87.50%の誤差を削減した。
論文 参考訳(メタデータ) (2022-03-03T14:16:22Z) - Zoo-Tuning: Adaptive Transfer from a Zoo of Models [82.9120546160422]
Zoo-Tuningは、事前訓練されたモデルのパラメータをターゲットタスクに適応的に転送することを学ぶ。
我々は、強化学習、画像分類、顔のランドマーク検出など、様々なタスクに対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-06-29T14:09:45Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。