論文の概要: One-shot learning for acoustic identification of bird species in
non-stationary environments
- arxiv url: http://arxiv.org/abs/2105.00202v1
- Date: Sat, 1 May 2021 09:43:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-05 09:28:46.957899
- Title: One-shot learning for acoustic identification of bird species in
non-stationary environments
- Title(参考訳): 非定常環境における鳥種の音響識別のためのワンショット学習
- Authors: Michelangelo Acconcjaioco and Stavros Ntalampiras
- Abstract要約: 本稿では,クラス辞書の変更を検知し,新しいクラスをオンザフライで組み込むフレームワークを提案する。
我々は,logMel スペクトログラム空間で動作する Siamese Neural Network からなるワンショット学習アーキテクチャを設計する。
- 参考スコア(独自算出の注目度): 5.177947445379688
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work introduces the one-shot learning paradigm in the computational
bioacoustics domain. Even though, most of the related literature assumes
availability of data characterizing the entire class dictionary of the problem
at hand, that is rarely true as a habitat's species composition is only known
up to a certain extent. Thus, the problem needs to be addressed by
methodologies able to cope with non-stationarity. To this end, we propose a
framework able to detect changes in the class dictionary and incorporate new
classes on the fly. We design an one-shot learning architecture composed of a
Siamese Neural Network operating in the logMel spectrogram space. We
extensively examine the proposed approach on two datasets of various bird
species using suitable figures of merit. Interestingly, such a learning scheme
exhibits state of the art performance, while taking into account extreme
non-stationarity cases.
- Abstract(参考訳): 本稿では,計算バイオ音響領域におけるワンショット学習パラダイムを紹介する。
関連文献の多くは、問題のクラス辞書全体を特徴付けるデータが利用可能であると仮定しているが、生息地の種組成がある程度しか知られていないことは稀である。
したがって、この問題は非定常性に対処できる方法論によって対処する必要がある。
そこで本研究では,クラス辞書の変更を検知し,新しいクラスをオンザフライで組み込むフレームワークを提案する。
我々は,logMel スペクトログラム空間で動作する Siamese Neural Network からなるワンショット学習アーキテクチャを設計する。
本研究は,様々な鳥類の2つのデータセットに関する提案手法を,適度な評価指標を用いて詳細に検討した。
興味深いことに、このような学習スキームは、極端な非定常ケースを考慮して、アートパフォーマンスの状態を示す。
関連論文リスト
- Generalization in birdsong classification: impact of transfer learning methods and dataset characteristics [2.6740633963478095]
大規模な鳥音分類における伝達学習の有効性について検討する。
実験により, 微調整蒸留と知識蒸留の双方で高い性能が得られた。
動物音コミュニティにおけるより包括的なラベリングの実践を提唱する。
論文 参考訳(メタデータ) (2024-09-21T11:33:12Z) - Detecting Statements in Text: A Domain-Agnostic Few-Shot Solution [1.3654846342364308]
最先端のアプローチは通常、作成にコストがかかる大規模な注釈付きデータセット上の微調整モデルを含む。
本稿では,クレームに基づくテキスト分類タスクの共通パラダイムとして,定性的で多目的な少ショット学習手法の提案とリリースを行う。
本手法は,気候変動対策,トピック/スタンス分類,うつ病関連症状検出の3つの課題の文脈で説明する。
論文 参考訳(メタデータ) (2024-05-09T12:03:38Z) - Open-World Semantic Segmentation Including Class Similarity [31.799000996671975]
本論文は, オープンワールドのセマンティックセマンティックセグメンテーション, すなわち, トレーニング中に未確認の物体を解釈する画像データの変種に対処する。
本稿では,クローズドワールドのセマンティックセグメンテーションを正確に行う新しい手法を提案する。
論文 参考訳(メタデータ) (2024-03-12T11:11:19Z) - Improving Primate Sounds Classification using Binary Presorting for Deep
Learning [6.044912425856236]
本稿では,MELスペクトル表現のサブセグメンテーションを初めてリラベルする一般化アプローチを提案する。
バイナリプリソートと分類の両方において、畳み込みニューラルネットワーク(CNN)と様々なデータ拡張技術を利用する。
本研究は,異なる霊長類種の音の分類を課題とする,挑戦的なTextitComparE 2021データセットについて,本手法の結果を紹介する。
論文 参考訳(メタデータ) (2023-06-28T09:35:09Z) - A Closer Look at Few-shot Classification Again [68.44963578735877]
トレーニングフェーズと適応フェーズで構成されている。
トレーニングアルゴリズムと適応アルゴリズムが完全に絡み合っていることを実証的に証明する。
各フェーズのメタアナリシスは、いくつかの興味深い洞察を示し、いくつかのショット分類の重要な側面をよりよく理解するのに役立ちます。
論文 参考訳(メタデータ) (2023-01-28T16:42:05Z) - Few-shot Open-set Recognition Using Background as Unknowns [58.04165813493666]
未使用のオープンセット認識は、見知らぬクラスの限られた訓練データしか持たない、目に見える画像と新しい画像の両方を分類することを目的としている。
提案手法は,複数のベースラインより優れるだけでなく,3つのベンチマークで新たな結果が得られた。
論文 参考訳(メタデータ) (2022-07-19T04:19:29Z) - Resolving label uncertainty with implicit posterior models [71.62113762278963]
本稿では,データサンプルのコレクション間でラベルを共同で推論する手法を提案する。
異なる予測子を後部とする生成モデルの存在を暗黙的に仮定することにより、弱い信念の下での学習を可能にする訓練目標を導出する。
論文 参考訳(メタデータ) (2022-02-28T18:09:44Z) - Parsing Birdsong with Deep Audio Embeddings [0.5599792629509227]
特徴呼と環境騒音を半教師付きで同定する手法を提案する。
我々は、畳み込みオートエンコーダと2つの事前学習ネットワークを含む、音声サンプルの潜在表現を学習するために、いくつかの手法を利用する。
論文 参考訳(メタデータ) (2021-08-20T14:45:44Z) - Intersection Regularization for Extracting Semantic Attributes [72.53481390411173]
本稿では,ネットワーク抽出した特徴が意味属性のセットと一致するように,教師付き分類の問題を考える。
例えば、鳥類のイメージを種に分類することを学ぶとき、動物学者が鳥類を分類するために使用する特徴の出現を観察したい。
本稿では,複数層パーセプトロン(MLP)と並列決定木を併用した,離散的なトップレベルアクティベーションを持つニューラルネットワークのトレーニングを提案する。
論文 参考訳(メタデータ) (2021-03-22T14:32:44Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - Transferring Dense Pose to Proximal Animal Classes [83.84439508978126]
より一般的な対象検出器やセグメンタなどと同様に、密集したポーズ認識に存在する知識を、他のクラスにおける密集したポーズ認識の問題に移すことが可能であることを示す。
我々は、人間と幾何学的に整合した新しい動物のためのDensePoseモデルを確立することでこれを行う。
また、クラスチンパンジーにDensePoseの方法でラベル付けされた2つのベンチマークデータセットを導入し、アプローチを評価するためにそれらを使用します。
論文 参考訳(メタデータ) (2020-02-28T21:43:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。