論文の概要: Classification of animal sounds in a hyperdiverse rainforest using
Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2111.14971v1
- Date: Mon, 29 Nov 2021 21:34:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 15:56:30.332449
- Title: Classification of animal sounds in a hyperdiverse rainforest using
Convolutional Neural Networks
- Title(参考訳): 畳み込みニューラルネットワークを用いた熱帯雨林における動物の音の分類
- Authors: Yuren Sun, Tatiana Midori Maeda, Claudia Solis-Lemus, Daniel
Pimentel-Alarcon, Zuzana Burivalova
- Abstract要約: 受動的に記録された音場から機械学習アプローチによる自動種検出は有望な手法である。
本研究では,ボルネオの熱帯林の音環境と,移動学習による畳み込みニューラルネットワークモデル(CNN)を用いた。
以上の結果から,トランスファー学習とデータ拡張は,多くの稀な種を持つ小さなサウンドスケーププロジェクトにおいても,CNNを用いて声の分類が可能であることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: To protect tropical forest biodiversity, we need to be able to detect it
reliably, cheaply, and at scale. Automated species detection from passively
recorded soundscapes via machine-learning approaches is a promising technique
towards this goal, but it is constrained by the necessity of large training
data sets. Using soundscapes from a tropical forest in Borneo and a
Convolutional Neural Network model (CNN) created with transfer learning, we
investigate i) the minimum viable training data set size for accurate
prediction of call types ('sonotypes'), and ii) the extent to which data
augmentation can overcome the issue of small training data sets. We found that
even relatively high sample sizes (> 80 per call type) lead to mediocre
accuracy, which however improves significantly with data augmentation,
including at extremely small sample sizes, regardless of taxonomic group or
call characteristics. Our results suggest that transfer learning and data
augmentation can make the use of CNNs to classify species' vocalizations
feasible even for small soundscape-based projects with many rare species. Our
open-source method has the potential to enable conservation initiatives become
more evidence-based by using soundscape data in the adaptive management of
biodiversity.
- Abstract(参考訳): 熱帯林の生物多様性を保護するためには, 信頼性, 安価, 大規模に検出できる必要がある。
機械学習アプローチによる受動的に記録された音場からの自動種検出は、この目標に向けて有望な手法であるが、大規模なトレーニングデータセットの必要性に制約されている。
ボルネオの熱帯林からのサウンドスケープとトランスファー学習を用いた畳み込みニューラルネットワークモデル(cnn)を用いて検討した。
一 コールタイプ(「ソノタイプ」)の正確な予測のための最小限の訓練データセットのサイズ及び
二 小規模な訓練データセットの問題点を克服できる範囲
その結果, 比較的高いサンプルサイズ(コールタイプ80)でも中程度の精度が得られ, しかし, 分類群や呼び出し特性に関わらず, 極めて小さなサンプルサイズを含むデータ拡張では有意に改善することがわかった。
以上の結果から,トランスファー学習とデータ拡張は,多くの稀な種を持つ小さなサウンドスケーププロジェクトにおいても,CNNを用いて声の分類が可能であることが示唆された。
我々のオープンソース手法は,生物多様性の適応管理にサウンドスケープデータを用いることで,よりエビデンスに基づく保全活動を可能にする可能性がある。
関連論文リスト
- Forest Inspection Dataset for Aerial Semantic Segmentation and Depth
Estimation [6.635604919499181]
森林調査のための大規模航空データセットを新たに導入する。
現実世界と仮想的な自然環境の記録も含んでいる。
地域の森林破壊度を評価するための枠組みを開発する。
論文 参考訳(メタデータ) (2024-03-11T11:26:44Z) - Diffusion-based Neural Network Weights Generation [85.6725307453325]
データセット条件付き事前学習重み抽出による効率よく適応的な伝達学習手法を提案する。
具体的には、ニューラルネットワークの重みを再構築できる変分オートエンコーダを備えた潜時拡散モデルを用いる。
論文 参考訳(メタデータ) (2024-02-28T08:34:23Z) - Transferable Models for Bioacoustics with Human Language Supervision [0.0]
BioLingualは、対照的な言語-オーディオ事前学習に基づくバイオ音響学の新しいモデルである。
分類群にまたがる1000種以上の呼び出しを識別し、完全なバイオ音響タスクをゼロショットで実行し、自然のテキストクエリから動物の発声記録を検索する。
論文 参考訳(メタデータ) (2023-08-09T14:22:18Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - Ensembles of Vision Transformers as a New Paradigm for Automated
Classification in Ecology [0.0]
データ効率のよい画像変換器(DeiTs)のアンサンブルが従来のSOTA(SOTA)よりも大幅に優れていたことを示す。
テストしたすべてのデータセットに対して、新しいSOTAを実現し、以前のSOTAの18.48%から87.50%の誤差を削減した。
論文 参考訳(メタデータ) (2022-03-03T14:16:22Z) - Recognizing bird species in diverse soundscapes under weak supervision [0.2148535041822524]
複雑で多様なサウンドスケープにおける鳥の発声に対するロバストな分類手法を提案し,BirdCLEF 2021チャレンジにおいて第2位を獲得した。
本稿では,新しい拡張法で補足された効率的なモデリングとトレーニングルーチンを用いることで,事前学習した畳み込みニューラルネットワークをフル活用する方法を説明する。
論文 参考訳(メタデータ) (2021-07-16T06:54:38Z) - Zoo-Tuning: Adaptive Transfer from a Zoo of Models [82.9120546160422]
Zoo-Tuningは、事前訓練されたモデルのパラメータをターゲットタスクに適応的に転送することを学ぶ。
我々は、強化学習、画像分類、顔のランドマーク検出など、様々なタスクに対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-06-29T14:09:45Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。