論文の概要: Few-shot Long-Tailed Bird Audio Recognition
- arxiv url: http://arxiv.org/abs/2206.11260v1
- Date: Wed, 22 Jun 2022 04:14:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-25 04:35:22.580836
- Title: Few-shot Long-Tailed Bird Audio Recognition
- Title(参考訳): 小型ロングテール鳥音声認識
- Authors: Marcos V. Conde and Ui-Jin Choi
- Abstract要約: 本研究では,音環境記録を解析するための音響検出・分類パイプラインを提案する。
私たちのソリューションは、Kaggleで開催されたBirdCLEF 2022 Challengeで、807チームの18位を獲得しました。
- 参考スコア(独自算出の注目度): 3.8073142980733
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: It is easier to hear birds than see them. However, they still play an
essential role in nature and are excellent indicators of deteriorating
environmental quality and pollution. Recent advances in Machine Learning and
Convolutional Neural Networks allow us to process continuous audio data to
detect and classify bird sounds. This technology can assist researchers in
monitoring bird populations' status and trends and ecosystems' biodiversity.
We propose a sound detection and classification pipeline to analyze complex
soundscape recordings and identify birdcalls in the background. Our method
learns from weak labels and few data and acoustically recognizes the bird
species. Our solution achieved 18th place of 807 teams at the BirdCLEF 2022
Challenge hosted on Kaggle.
- Abstract(参考訳): 鳥を見るより鳥の声が聞こえやすい。
しかし、それらは自然界において重要な役割を担い、環境の質と汚染を悪化させる優れた指標である。
機械学習と畳み込みニューラルネットワークの最近の進歩により、連続した音声データを処理して鳥の鳴き声を検出し分類することができる。
この技術は、研究者が鳥類の個体数や傾向、生態系の生物多様性をモニタリングするのに役立つ。
本研究では,複雑なサウンドスケープを解析し,背景の鳥の鳴き声を識別するための音響検出・分類パイプラインを提案する。
本手法は弱いラベルと少ないデータから学習し,鳥種を音響的に認識する。
私たちのソリューションは、Kaggleで開催されたBirdCLEF 2022 Challengeで、807チームの18位を獲得しました。
関連論文リスト
- Semi-supervised classification of bird vocalizations [0.0]
鳥類の個体数の変化は生態系の広範な変化を示す可能性がある。
時間重なり合う鳴き声を検出するための半教師付き音響鳥検知器を提案する。
平均F0.5スコアは315のクラスで0.701で、110種の鳥類をホールドアウトテストセットで記録する。
論文 参考訳(メタデータ) (2025-02-19T05:31:13Z) - NBM: an Open Dataset for the Acoustic Monitoring of Nocturnal Migratory Birds in Europe [0.0]
この研究は、西太平洋の117種から13,359種の注釈付き発声を収集した夜行性鳥類移動データセットを提示する。
このデータセットには正確な時間と頻度のアノテーションが含まれており、フランス全土の何十人もの鳥愛好家によって集められている。
特に,音声データの処理に適した2段階の深層物体検出モデルを訓練することにより,本データベースの有用性を実証する。
論文 参考訳(メタデータ) (2024-12-04T18:55:45Z) - AudioProtoPNet: An interpretable deep learning model for bird sound classification [1.49199020343864]
本研究では,マルチラベル鳥の音の分類にPrototypeal Part Network(ProtoPNet)を適応したAudioProtoPNetを紹介する。
これは本質的に解釈可能なモデルであり、埋め込みを抽出するためにConvNeXtのバックボーンを使用する。
このモデルは、9,734種の鳥類と6,800時間以上の録音からなるBirdSetトレーニングデータセットで訓練された。
論文 参考訳(メタデータ) (2024-04-16T09:37:41Z) - Exploring Meta Information for Audio-based Zero-shot Bird Classification [113.17261694996051]
本研究では,メタ情報を用いてゼロショット音声分類を改善する方法について検討する。
我々は,多種多様なメタデータが利用可能であることから,鳥種を例として用いている。
論文 参考訳(メタデータ) (2023-09-15T13:50:16Z) - Active Bird2Vec: Towards End-to-End Bird Sound Monitoring with
Transformers [2.404305970432934]
自己教師付き(SSL)と深層能動学習(DAL)を組み合わせた鳥音モニタリングにおけるエンドツーエンド学習へのシフトを提案する。
我々は,従来のスペクトログラム変換をバイパスし,直接生音声処理を実現することを目的としている。
論文 参考訳(メタデータ) (2023-08-14T13:06:10Z) - Deep object detection for waterbird monitoring using aerial imagery [56.1262568293658]
本研究では,商用ドローンで収集した空中画像を用いて,水鳥の正確な検出,数え,監視に使用できる深層学習パイプラインを提案する。
畳み込み型ニューラルネットワークを用いた物体検出装置を用いて,テキサス沿岸の植民地性営巣島でよく見られる16種類の水鳥を検出できることを示す。
論文 参考訳(メタデータ) (2022-10-10T17:37:56Z) - Climate Change & Computer Audition: A Call to Action and Overview on
Audio Intelligence to Help Save the Planet [98.97255654573662]
この研究は、オーディオインテリジェンスが気候に関わる課題を克服するために貢献できる領域の概要を提供する。
我々は、地球、水、空気、火、エーテルの5つの要素に従って、潜在的なコンピュータオーディションの応用を分類する。
論文 参考訳(メタデータ) (2022-03-10T13:32:31Z) - Training Classifiers that are Universally Robust to All Label Noise
Levels [91.13870793906968]
ディープニューラルネットワークは、ラベルノイズの存在下で過度に適合する傾向がある。
ポジティヴ・アンラベルラーニングの新たなサブカテゴリを取り入れた蒸留ベースのフレームワークを提案する。
我々の枠組みは概して中~高騒音レベルにおいて優れています。
論文 参考訳(メタデータ) (2021-05-27T13:49:31Z) - Cetacean Translation Initiative: a roadmap to deciphering the
communication of sperm whales [97.41394631426678]
最近の研究では、非ヒト種における音響コミュニケーションを分析するための機械学習ツールの約束を示した。
マッコウクジラの大量生物音響データの収集と処理に必要な重要な要素について概説する。
開発された技術能力は、非人間コミュニケーションと動物行動研究を研究する幅広いコミュニティにおいて、クロス応用と進歩をもたらす可能性が高い。
論文 参考訳(メタデータ) (2021-04-17T18:39:22Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Modelling Animal Biodiversity Using Acoustic Monitoring and Deep
Learning [0.0]
本稿では,機械学習の最先端技術を用いて,時系列音声信号から特徴を自動的に抽出する手法について概説する。
得られた鳥の歌はメル周波数ケプストラム(MFC)を用いて処理され、後に多層パーセプトロン(MLP)を用いて分類される特徴を抽出する。
提案手法は感度0.74,特異度0.92,精度0.74で有望な結果を得た。
論文 参考訳(メタデータ) (2021-03-12T13:50:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。