Fugu-MT 論文翻訳(概要): Classification of animal sounds in a hyperdiverse rainforest using Convolutional Neural Networks

論文の概要: Classification of animal sounds in a hyperdiverse rainforest using Convolutional Neural Networks

arxiv url: http://arxiv.org/abs/2111.14971v1
Date: Mon, 29 Nov 2021 21:34:57 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-01 15:56:30.332449
Title: Classification of animal sounds in a hyperdiverse rainforest using Convolutional Neural Networks
Title（参考訳）: 畳み込みニューラルネットワークを用いた熱帯雨林における動物の音の分類
Authors: Yuren Sun, Tatiana Midori Maeda, Claudia Solis-Lemus, Daniel Pimentel-Alarcon, Zuzana Burivalova
Abstract要約: 受動的に記録された音場から機械学習アプローチによる自動種検出は有望な手法である。本研究では,ボルネオの熱帯林の音環境と,移動学習による畳み込みニューラルネットワークモデル(CNN)を用いた。以上の結果から,トランスファー学習とデータ拡張は,多くの稀な種を持つ小さなサウンドスケーププロジェクトにおいても,CNNを用いて声の分類が可能であることが示唆された。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: To protect tropical forest biodiversity, we need to be able to detect it reliably, cheaply, and at scale. Automated species detection from passively recorded soundscapes via machine-learning approaches is a promising technique towards this goal, but it is constrained by the necessity of large training data sets. Using soundscapes from a tropical forest in Borneo and a Convolutional Neural Network model (CNN) created with transfer learning, we investigate i) the minimum viable training data set size for accurate prediction of call types ('sonotypes'), and ii) the extent to which data augmentation can overcome the issue of small training data sets. We found that even relatively high sample sizes (> 80 per call type) lead to mediocre accuracy, which however improves significantly with data augmentation, including at extremely small sample sizes, regardless of taxonomic group or call characteristics. Our results suggest that transfer learning and data augmentation can make the use of CNNs to classify species' vocalizations feasible even for small soundscape-based projects with many rare species. Our open-source method has the potential to enable conservation initiatives become more evidence-based by using soundscape data in the adaptive management of biodiversity.
Abstract（参考訳）: 熱帯林の生物多様性を保護するためには, 信頼性, 安価, 大規模に検出できる必要がある。機械学習アプローチによる受動的に記録された音場からの自動種検出は、この目標に向けて有望な手法であるが、大規模なトレーニングデータセットの必要性に制約されている。ボルネオの熱帯林からのサウンドスケープとトランスファー学習を用いた畳み込みニューラルネットワークモデル(cnn)を用いて検討した。一コールタイプ(「ソノタイプ」)の正確な予測のための最小限の訓練データセットのサイズ及び二小規模な訓練データセットの問題点を克服できる範囲その結果, 比較的高いサンプルサイズ(コールタイプ80)でも中程度の精度が得られ, しかし, 分類群や呼び出し特性に関わらず, 極めて小さなサンプルサイズを含むデータ拡張では有意に改善することがわかった。以上の結果から,トランスファー学習とデータ拡張は,多くの稀な種を持つ小さなサウンドスケーププロジェクトにおいても,CNNを用いて声の分類が可能であることが示唆された。我々のオープンソース手法は,生物多様性の適応管理にサウンドスケープデータを用いることで,よりエビデンスに基づく保全活動を可能にする可能性がある。

関連論文リスト

Investigating Target Class Influence on Neural Network Compressibility for Energy-Autonomous Avian Monitoring [36.85680419418593]
本研究では,マイクロコントローラユニット(MCU)を直接現場で動作させる機械学習モデルを提案する。本研究は,複数種の鳥の発見を評価するために,様々な対象クラスのモデルを訓練し,圧縮した。また、異なるハードウェアプラットフォームに対してベンチマーク結果を提供し、エネルギー自動デバイスをデプロイする可能性を評価する。
論文参考訳（メタデータ） (2026-02-19T16:24:33Z)
What Matters for Bioacoustic Encoding [34.118070876417065]
本研究は,生物音響学の側面を包括する大規模実証研究である。既存のベンチマークと提案ベンチマークで最先端のエンコーダを得る。具体的には、種分類、検出、個人ID、発声レパートリー発見などのタスクを含む26のデータセットにまたがって、自己教師付き事前訓練に続いて、教師付き後訓練を行う。
論文参考訳（メタデータ） (2025-08-15T23:52:34Z)
Private Training & Data Generation by Clustering Embeddings [74.00687214400021]
差分プライバシー(DP)は、個々のデータを保護するための堅牢なフレームワークを提供する。本稿では,DP合成画像埋め込み生成のための新しい原理的手法を提案する。経験的に、合成的に生成された埋め込みに基づいて訓練された単純な2層ニューラルネットワークは、最先端(SOTA)分類の精度を達成する。
論文参考訳（メタデータ） (2025-06-20T00:17:14Z)
Explainable few-shot learning workflow for detecting invasive and exotic tree species [42.30413964219434]
本研究は,ブラジルのアトランティック・フォレストにおいて,外来樹種や外来樹種を検出するための,説明可能な数発の学習ワークフローを提案する。このワークフローは、Siameseネットワークと説明可能なAI(XAI)を統合することで、最小のラベル付きデータで木種の分類を可能にする。その結果,データスカース条件下においても,新たな木種を同定するためのワークフローの有効性が示された。
論文参考訳（メタデータ） (2024-11-01T15:45:19Z)
Deep learning-based ecological analysis of camera trap images is impacted by training data quality and size [11.153016596465593]
アフリカサバンナとアジア亜熱帯乾燥林のカメラトラップデータの解析を行った。我々は、専門家による種同定から得られた重要な生態指標と、深層ニューラルネットワークから生成された指標を比較した。その結果、モデルアーキテクチャは最小限の影響しか与えないが、大量のノイズとデータセットサイズがこれらの指標に大きく影響していることが判明した。
論文参考訳（メタデータ） (2024-08-26T15:26:27Z)
TinyChirp: Bird Song Recognition Using TinyML Models on Low-power Wireless Acoustic Sensors [1.0790796076947324]
大規模な生物多様性のモニタリングは難しい。微細な粒度の種の検出と識別には、高度に正確な機械学習(ML)手法が必要である。これらのモデルを低消費電力デバイスにデプロイするには、新しい圧縮技術とモデルアーキテクチャが必要である。
論文参考訳（メタデータ） (2024-07-31T08:57:42Z)
Just How Flexible are Neural Networks in Practice? [89.80474583606242]
ニューラルネットワークは、パラメータを持つ少なくとも多くのサンプルを含むトレーニングセットに適合できると広く信じられている。しかし実際には、勾配や正規化子など、柔軟性を制限したトレーニング手順によるソリューションしか見つからない。
論文参考訳（メタデータ） (2024-06-17T12:24:45Z)
Transferable Models for Bioacoustics with Human Language Supervision [0.0]
BioLingualは、対照的な言語-オーディオ事前学習に基づくバイオ音響学の新しいモデルである。分類群にまたがる1000種以上の呼び出しを識別し、完全なバイオ音響タスクをゼロショットで実行し、自然のテキストクエリから動物の発声記録を検索する。
論文参考訳（メタデータ） (2023-08-09T14:22:18Z)
Decision Forest Based EMG Signal Classification with Low Volume Dataset Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文参考訳（メタデータ） (2022-06-29T23:22:18Z)
Ensembles of Vision Transformers as a New Paradigm for Automated Classification in Ecology [0.0]
データ効率のよい画像変換器(DeiTs)のアンサンブルが従来のSOTA(SOTA)よりも大幅に優れていたことを示す。テストしたすべてのデータセットに対して、新しいSOTAを実現し、以前のSOTAの18.48%から87.50%の誤差を削減した。
論文参考訳（メタデータ） (2022-03-03T14:16:22Z)
Zoo-Tuning: Adaptive Transfer from a Zoo of Models [82.9120546160422]
Zoo-Tuningは、事前訓練されたモデルのパラメータをターゲットタスクに適応的に転送することを学ぶ。我々は、強化学習、画像分類、顔のランドマーク検出など、様々なタスクに対するアプローチを評価した。
論文参考訳（メタデータ） (2021-06-29T14:09:45Z)
Towards an Automatic Analysis of CHO-K1 Suspension Growth in Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文参考訳（メタデータ） (2020-10-20T08:36:51Z)
Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文参考訳（メタデータ） (2020-09-02T02:50:30Z)
Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文参考訳（メタデータ） (2020-03-10T03:10:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。