論文の概要: Western Mediterranean wetlands bird species classification: evaluating
small-footprint deep learning approaches on a new annotated dataset
- arxiv url: http://arxiv.org/abs/2207.05393v1
- Date: Tue, 12 Jul 2022 08:48:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-13 15:00:36.376910
- Title: Western Mediterranean wetlands bird species classification: evaluating
small-footprint deep learning approaches on a new annotated dataset
- Title(参考訳): 西地中海湿原の鳥類種分類:新しい注釈付きデータセットによる小型深層学習手法の評価
- Authors: Juan G\'omez-G\'omez, Ester Vida\~na-Vila, Xavier Sevillano
- Abstract要約: この研究は、2つの重いフットプリントと大きなフットプリントのディープニューラルネットワーク(VGG16とResNet50)と、軽量な代替手段であるMobileNetV2の比較分析である。
実験の結果,MobileNetV2 は平均 F1 スコアが ResNet50 よりも 5% 以下であることがわかった。
Aiguamolls de l'Emporda Natural Parkの20の固有鳥類種の201.6分と5,795のオーディオ抜粋からなる西地中海湿原鳥類データセットを作成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The deployment of an expert system running over a wireless acoustic sensors
network made up of bioacoustic monitoring devices that recognise bird species
from their sounds would enable the automation of many tasks of ecological
value, including the analysis of bird population composition or the detection
of endangered species in areas of environmental interest. Endowing these
devices with accurate audio classification capabilities is possible thanks to
the latest advances in artificial intelligence, among which deep learning
techniques excel. However, a key issue to make bioacoustic devices affordable
is the use of small footprint deep neural networks that can be embedded in
resource and battery constrained hardware platforms. For this reason, this work
presents a critical comparative analysis between two heavy and large footprint
deep neural networks (VGG16 and ResNet50) and a lightweight alternative,
MobileNetV2. Our experimental results reveal that MobileNetV2 achieves an
average F1-score less than a 5\% lower than ResNet50 (0.789 vs. 0.834),
performing better than VGG16 with a footprint size nearly 40 times smaller.
Moreover, to compare the models, we have created and made public the Western
Mediterranean Wetland Birds dataset, consisting of 201.6 minutes and 5,795
audio excerpts of 20 endemic bird species of the Aiguamolls de l'Empord\`a
Natural Park.
- Abstract(参考訳): 鳥種を音から認識する生体音響監視装置からなる無線音響センサネットワーク上でのエキスパートシステムの展開は、鳥の個体群組成の分析や環境問題領域における絶滅危惧種の検出など、多くの生態的価値のタスクの自動化を可能にする。
ディープラーニング技術が優れている人工知能の最新の進歩のおかげで、これらのデバイスに正確な音声分類機能を持たせることができる。
しかし、バイオ音響デバイスを安価にするための重要な問題は、リソースとバッテリに制約のあるハードウェアプラットフォームに組み込むことができる小さなフットプリントのディープニューラルネットワークを使用することである。
このことから、本研究では、重大と大規模のディープニューラルネットワーク(vgg16とresnet50)と、軽量な代替手段であるmobilenetv2との批判的な比較分析を行う。
実験の結果,MobileNetV2 は ResNet50 (0.789 vs. 0.834) よりも平均 F1 スコア以下で,フットプリントサイズが 40 倍近い VGG16 よりも優れていた。
さらに,本モデルと比較するため,Aiguamolls de l'Empord\`a Natural Parkの20種の固有鳥類の201.6分と5,795種のオーディオ抜粋からなる西地中海湿地鳥類データセットを作成した。
関連論文リスト
- TinyChirp: Bird Song Recognition Using TinyML Models on Low-power Wireless Acoustic Sensors [1.0790796076947324]
大規模な生物多様性のモニタリングは難しい。
微細な粒度の種の検出と識別には、高度に正確な機械学習(ML)手法が必要である。
これらのモデルを低消費電力デバイスにデプロイするには、新しい圧縮技術とモデルアーキテクチャが必要である。
論文 参考訳(メタデータ) (2024-07-31T08:57:42Z) - AudioProtoPNet: An interpretable deep learning model for bird sound classification [1.49199020343864]
本研究では,マルチラベル鳥の音の分類にPrototypeal Part Network(ProtoPNet)を適応したAudioProtoPNetを紹介する。
これは本質的に解釈可能なモデルであり、埋め込みを抽出するためにConvNeXtのバックボーンを使用する。
このモデルは、9,734種の鳥類と6,800時間以上の録音からなるBirdSetトレーニングデータセットで訓練された。
論文 参考訳(メタデータ) (2024-04-16T09:37:41Z) - Exploring Meta Information for Audio-based Zero-shot Bird Classification [113.17261694996051]
本研究では,メタ情報を用いてゼロショット音声分類を改善する方法について検討する。
我々は,多種多様なメタデータが利用可能であることから,鳥種を例として用いている。
論文 参考訳(メタデータ) (2023-09-15T13:50:16Z) - Ultra-low Power Deep Learning-based Monocular Relative Localization
Onboard Nano-quadrotors [64.68349896377629]
この研究は、2つのピアナノドロンのディープニューラルネットワーク(DNN)を介して、単分子の相対的な局所化に対処する、新しい自律的なエンドツーエンドシステムを示す。
超制約ナノドローンプラットフォームに対処するため,データセットの増大,量子化,システム最適化などを含む垂直統合フレームワークを提案する。
実験の結果,DNNは低分解能モノクローム画像のみを用いて最大2mの距離で10cmのターゲットナノドローンを正確に局在させることができることがわかった。
論文 参考訳(メタデータ) (2023-03-03T14:14:08Z) - Deep object detection for waterbird monitoring using aerial imagery [56.1262568293658]
本研究では,商用ドローンで収集した空中画像を用いて,水鳥の正確な検出,数え,監視に使用できる深層学習パイプラインを提案する。
畳み込み型ニューラルネットワークを用いた物体検出装置を用いて,テキサス沿岸の植民地性営巣島でよく見られる16種類の水鳥を検出できることを示す。
論文 参考訳(メタデータ) (2022-10-10T17:37:56Z) - Classification of animal sounds in a hyperdiverse rainforest using
Convolutional Neural Networks [0.0]
受動的に記録された音場から機械学習アプローチによる自動種検出は有望な手法である。
本研究では,ボルネオの熱帯林の音環境と,移動学習による畳み込みニューラルネットワークモデル(CNN)を用いた。
以上の結果から,トランスファー学習とデータ拡張は,多くの稀な種を持つ小さなサウンドスケーププロジェクトにおいても,CNNを用いて声の分類が可能であることが示唆された。
論文 参考訳(メタデータ) (2021-11-29T21:34:57Z) - A deep neural network for multi-species fish detection using multiple
acoustic cameras [0.0]
本稿では,CNN (Convolutional Neural Network) と従来のCV (Computer Vision) 技術の両方を活用する新しい手法を提案する。
パイプラインは、音像を前処理して2つの特徴を抽出し、信号をローカライズし、検出性能を向上させる。
YOLOv3ベースのモデルは、2つの一般的な音響カメラで記録された複数の種の魚のデータを用いて訓練された。
論文 参考訳(メタデータ) (2021-09-22T11:47:24Z) - A Lottery Ticket Hypothesis Framework for Low-Complexity Device-Robust
Neural Acoustic Scene Classification [78.04177357888284]
デバイス・ロバスト音響シーン分類(ASC)のためのデータ拡張、知識伝達、プルーニング、量子化を組み合わせた新しいニューラルモデル圧縮戦略を提案する。
本稿では,低複雑マルチデバイスASCのためのアコースティック・ロッテリー(Austratic Lottery)という,効率的なジョイント・フレームワークについて報告する。
論文 参考訳(メタデータ) (2021-07-03T16:25:24Z) - Cetacean Translation Initiative: a roadmap to deciphering the
communication of sperm whales [97.41394631426678]
最近の研究では、非ヒト種における音響コミュニケーションを分析するための機械学習ツールの約束を示した。
マッコウクジラの大量生物音響データの収集と処理に必要な重要な要素について概説する。
開発された技術能力は、非人間コミュニケーションと動物行動研究を研究する幅広いコミュニティにおいて、クロス応用と進歩をもたらす可能性が高い。
論文 参考訳(メタデータ) (2021-04-17T18:39:22Z) - OutlierNets: Highly Compact Deep Autoencoder Network Architectures for
On-Device Acoustic Anomaly Detection [77.23388080452987]
人間のオペレーターはしばしば異常な音で産業機械を診断する。
ディープラーニングによる異常検出手法は、工場でのデプロイメントを禁止する膨大な計算リソースを必要とすることが多い。
ここでは、マシン駆動設計探索戦略を探求し、非常にコンパクトなディープコンボリューションオートエンコーダネットワークアーキテクチャのファミリーであるOutlierNetsを作成します。
論文 参考訳(メタデータ) (2021-03-31T04:09:30Z) - Modelling Animal Biodiversity Using Acoustic Monitoring and Deep
Learning [0.0]
本稿では,機械学習の最先端技術を用いて,時系列音声信号から特徴を自動的に抽出する手法について概説する。
得られた鳥の歌はメル周波数ケプストラム(MFC)を用いて処理され、後に多層パーセプトロン(MLP)を用いて分類される特徴を抽出する。
提案手法は感度0.74,特異度0.92,精度0.74で有望な結果を得た。
論文 参考訳(メタデータ) (2021-03-12T13:50:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。