Fugu-MT 論文翻訳(概要): Few-shot Long-Tailed Bird Audio Recognition

論文の概要: Few-shot Long-Tailed Bird Audio Recognition

arxiv url: http://arxiv.org/abs/2206.11260v1
Date: Wed, 22 Jun 2022 04:14:25 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-25 04:35:22.580836
Title: Few-shot Long-Tailed Bird Audio Recognition
Title（参考訳）: 小型ロングテール鳥音声認識
Authors: Marcos V. Conde and Ui-Jin Choi
Abstract要約: 本研究では,音環境記録を解析するための音響検出・分類パイプラインを提案する。私たちのソリューションは、Kaggleで開催されたBirdCLEF 2022 Challengeで、807チームの18位を獲得しました。
参考スコア（独自算出の注目度）: 3.8073142980733
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: It is easier to hear birds than see them. However, they still play an essential role in nature and are excellent indicators of deteriorating environmental quality and pollution. Recent advances in Machine Learning and Convolutional Neural Networks allow us to process continuous audio data to detect and classify bird sounds. This technology can assist researchers in monitoring bird populations' status and trends and ecosystems' biodiversity. We propose a sound detection and classification pipeline to analyze complex soundscape recordings and identify birdcalls in the background. Our method learns from weak labels and few data and acoustically recognizes the bird species. Our solution achieved 18th place of 807 teams at the BirdCLEF 2022 Challenge hosted on Kaggle.
Abstract（参考訳）: 鳥を見るより鳥の声が聞こえやすい。しかし、それらは自然界において重要な役割を担い、環境の質と汚染を悪化させる優れた指標である。機械学習と畳み込みニューラルネットワークの最近の進歩により、連続した音声データを処理して鳥の鳴き声を検出し分類することができる。この技術は、研究者が鳥類の個体数や傾向、生態系の生物多様性をモニタリングするのに役立つ。本研究では,複雑なサウンドスケープを解析し,背景の鳥の鳴き声を識別するための音響検出・分類パイプラインを提案する。本手法は弱いラベルと少ないデータから学習し,鳥種を音響的に認識する。私たちのソリューションは、Kaggleで開催されたBirdCLEF 2022 Challengeで、807チームの18位を獲得しました。

関連論文リスト

ECOSoundSet: a finely annotated dataset for the automated acoustic identification of Orthoptera and Cicadidae in North, Central and temperate Western Europe [51.82780272068934]
ECOSoundSet (European Cicadidae and Orthoptera Sound dataSet) は,北欧,中央ヨーロッパ,温帯西ヨーロッパに分布する200種,24種(亜種を含む場合,それぞれ217種,26種)から10,653種を収録したデータセットである。このデータセットは、北ヨーロッパ、中央ヨーロッパ、温帯ヨーロッパにおけるオルソプターとシカダの音響分類のための深層学習アルゴリズムの訓練のために、既にオンラインで入手可能な記録に意味のある補完となる可能性がある。
論文参考訳（メタデータ） (2025-04-29T13:53:33Z)
Unsupervised outlier detection to improve bird audio dataset labels [0.0]
非標的の鳥類の音は、ラベルノイズと呼ばれる相違点をデータセットにラベル付けする。本稿では,オーディオ前処理とデメンタリティ低減と教師なし外乱検出を併用したクリーニングプロセスを提案する。
論文参考訳（メタデータ） (2025-04-25T19:04:40Z)
A Bird Song Detector for improving bird identification through Deep Learning: a case study from Doñana [2.7924253850013416]
ドナ国立公園(西スペイン)における鳥声自動識別パイプラインの開発 9ヶ所の生息地から461分間の音声を手動でアノテートし,34の授業で3,749のアノテーションを得た。分類前のバード・ソング・ディテクターの適用により種識別が向上し、鳥類が検出されたセグメントのみを分析する場合、すべての分類モデルが改善された。
論文参考訳（メタデータ） (2025-03-19T13:19:06Z)
Semi-supervised classification of bird vocalizations [0.0]
鳥類の個体数の変化は生態系の広範な変化を示す可能性がある。時間重なり合う鳴き声を検出するための半教師付き音響鳥検知器を提案する。平均F0.5スコアは315のクラスで0.701で、110種の鳥類をホールドアウトテストセットで記録する。
論文参考訳（メタデータ） (2025-02-19T05:31:13Z)
AudioProtoPNet: An interpretable deep learning model for bird sound classification [1.49199020343864]
本研究では,マルチラベル鳥の音の分類にPrototypeal Part Network(ProtoPNet)を適応したAudioProtoPNetを紹介する。これは本質的に解釈可能なモデルであり、埋め込みを抽出するためにConvNeXtのバックボーンを使用する。このモデルは、9,734種の鳥類と6,800時間以上の録音からなるBirdSetトレーニングデータセットで訓練された。
論文参考訳（メタデータ） (2024-04-16T09:37:41Z)
Self-Supervised Learning for Few-Shot Bird Sound Classification [10.395255631261458]
音声における自己教師あり学習(SSL)は、様々な領域において大きな可能性を秘めている。本研究では,アノテーションを必要とせずに,音声録音から有意義な鳥の音の表現を抽出できることを実証する。
論文参考訳（メタデータ） (2023-12-25T22:33:45Z)
Exploring Meta Information for Audio-based Zero-shot Bird Classification [113.17261694996051]
本研究では,メタ情報を用いてゼロショット音声分類を改善する方法について検討する。我々は,多種多様なメタデータが利用可能であることから,鳥種を例として用いている。
論文参考訳（メタデータ） (2023-09-15T13:50:16Z)
Active Bird2Vec: Towards End-to-End Bird Sound Monitoring with Transformers [2.404305970432934]
自己教師付き(SSL)と深層能動学習(DAL)を組み合わせた鳥音モニタリングにおけるエンドツーエンド学習へのシフトを提案する。我々は,従来のスペクトログラム変換をバイパスし,直接生音声処理を実現することを目的としている。
論文参考訳（メタデータ） (2023-08-14T13:06:10Z)
Deep object detection for waterbird monitoring using aerial imagery [56.1262568293658]
本研究では,商用ドローンで収集した空中画像を用いて,水鳥の正確な検出,数え,監視に使用できる深層学習パイプラインを提案する。畳み込み型ニューラルネットワークを用いた物体検出装置を用いて,テキサス沿岸の植民地性営巣島でよく見られる16種類の水鳥を検出できることを示す。
論文参考訳（メタデータ） (2022-10-10T17:37:56Z)
Climate Change & Computer Audition: A Call to Action and Overview on Audio Intelligence to Help Save the Planet [98.97255654573662]
この研究は、オーディオインテリジェンスが気候に関わる課題を克服するために貢献できる領域の概要を提供する。我々は、地球、水、空気、火、エーテルの5つの要素に従って、潜在的なコンピュータオーディションの応用を分類する。
論文参考訳（メタデータ） (2022-03-10T13:32:31Z)
Parsing Birdsong with Deep Audio Embeddings [0.5599792629509227]
特徴呼と環境騒音を半教師付きで同定する手法を提案する。我々は、畳み込みオートエンコーダと2つの事前学習ネットワークを含む、音声サンプルの潜在表現を学習するために、いくつかの手法を利用する。
論文参考訳（メタデータ） (2021-08-20T14:45:44Z)
Training Classifiers that are Universally Robust to All Label Noise Levels [91.13870793906968]
ディープニューラルネットワークは、ラベルノイズの存在下で過度に適合する傾向がある。ポジティヴ・アンラベルラーニングの新たなサブカテゴリを取り入れた蒸留ベースのフレームワークを提案する。我々の枠組みは概して中～高騒音レベルにおいて優れています。
論文参考訳（メタデータ） (2021-05-27T13:49:31Z)
Cetacean Translation Initiative: a roadmap to deciphering the communication of sperm whales [97.41394631426678]
最近の研究では、非ヒト種における音響コミュニケーションを分析するための機械学習ツールの約束を示した。マッコウクジラの大量生物音響データの収集と処理に必要な重要な要素について概説する。開発された技術能力は、非人間コミュニケーションと動物行動研究を研究する幅広いコミュニティにおいて、クロス応用と進歩をもたらす可能性が高い。
論文参考訳（メタデータ） (2021-04-17T18:39:22Z)
Discriminative Singular Spectrum Classifier with Applications on Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文参考訳（メタデータ） (2021-03-18T11:01:21Z)
Modelling Animal Biodiversity Using Acoustic Monitoring and Deep Learning [0.0]
本稿では,機械学習の最先端技術を用いて,時系列音声信号から特徴を自動的に抽出する手法について概説する。得られた鳥の歌はメル周波数ケプストラム(MFC)を用いて処理され、後に多層パーセプトロン(MLP)を用いて分類される特徴を抽出する。提案手法は感度0.74,特異度0.92,精度0.74で有望な結果を得た。
論文参考訳（メタデータ） (2021-03-12T13:50:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。