論文の概要: Automatic Bat Call Classification using Transformer Networks
- arxiv url: http://arxiv.org/abs/2309.11218v1
- Date: Wed, 20 Sep 2023 11:15:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-21 16:32:57.252151
- Title: Automatic Bat Call Classification using Transformer Networks
- Title(参考訳): 変圧器ネットワークを用いた自動バス呼分類
- Authors: Frank Fundel, Daniel A. Braun, Sebastian Gottwald
- Abstract要約: 自動呼び出しの識別における大きな課題は、高い呼び出しのばらつき、種間の類似性、呼び出しの干渉、注釈付きデータの欠如である。
本稿では,リアルタイムな分類シナリオに適用可能なマルチラベル分類のためのTransformerアーキテクチャを提案する。
提案手法は, 88.92%(F1スコア84.23%)と多種マクロF1スコア74.40%(F1スコア74.40%)の精度を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Automatically identifying bat species from their echolocation calls is a
difficult but important task for monitoring bats and the ecosystem they live
in. Major challenges in automatic bat call identification are high call
variability, similarities between species, interfering calls and lack of
annotated data. Many currently available models suffer from relatively poor
performance on real-life data due to being trained on single call datasets and,
moreover, are often too slow for real-time classification. Here, we propose a
Transformer architecture for multi-label classification with potential
applications in real-time classification scenarios. We train our model on
synthetically generated multi-species recordings by merging multiple bats calls
into a single recording with multiple simultaneous calls. Our approach achieves
a single species accuracy of 88.92% (F1-score of 84.23%) and a multi species
macro F1-score of 74.40% on our test set. In comparison to three other tools on
the independent and publicly available dataset ChiroVox, our model achieves at
least 25.82% better accuracy for single species classification and at least
6.9% better macro F1-score for multi species classification.
- Abstract(参考訳): コウモリの自動識別は、コウモリとその生息する生態系をモニタリングする上で、難しいが重要な課題である。
自動呼び出しの識別における大きな課題は、高い呼び出し変数、種間の類似性、干渉呼び出し、注釈付きデータの欠如である。
現在利用可能なモデルの多くは、単一のコールデータセットでトレーニングされているため、実際のデータに対するパフォーマンスが比較的低い上に、リアルタイムな分類には遅すぎることが多い。
本稿では,リアルタイムな分類シナリオに適用可能なマルチラベル分類のためのTransformerアーキテクチャを提案する。
複数のbats呼び出しを複数の同時呼び出しで単一の記録にマージすることにより、合成した多種多様な記録でモデルを訓練する。
本手法は, 88.92%(F1スコア84.23%)と多種マクロF1スコア74.40%の精度を実現する。
独立したデータセットであるchirovoxの他の3つのツールと比較して、単一種分類の精度は少なくとも25.82%向上し、マルチ種分類のマクロf1-scoreは少なくとも6.9%向上している。
関連論文リスト
- CKSP: Cross-species Knowledge Sharing and Preserving for Universal Animal Activity Recognition [7.012560255346829]
我々は,多種多様な動物種のセンサデータに基づいて,多種間知識共有保存(CKSP)と呼ばれる一対一のフレームワークを提案する。
一般的な特徴を学習するために、共有されたフルランクの畳み込み層を使用し、CKSPフレームワークは種間の相補性を学ぶことができる。
種間のデータ分布の相違から生じる訓練競合を考慮し,種別バッチ正規化(SBN)モジュールを考案した。
論文 参考訳(メタデータ) (2024-10-22T02:44:10Z) - Learning to rumble: Automated elephant call classification, detection and endpointing using deep architectures [0.0]
連続録音音声における象の鳴き声の検出・分離・分類の問題点を考察する。
実験では,アジアとアフリカゾウの鳴き声を含む2つの注釈付きデータセットを用いた。
従来この目的に使用されていなかったニューラルアーキテクチャであるオーディオ・スペクトログラム・トランスフォーマー(AST)を用いて,新しいシーケンス・ツー・シーケンス方式で構成した。
完全自動化されたゾウ呼検出・サブコール分類システムが到達範囲内にあると結論付けている。
論文 参考訳(メタデータ) (2024-10-15T21:56:40Z) - A Lightweight Measure of Classification Difficulty from Application Dataset Characteristics [4.220363193932374]
効率的なコサイン類似度に基づく分類困難度尺度Sを提案する。
データセットのクラス数とクラス内およびクラス間の類似度メトリクスから計算される。
この手法を実践者が、繰り返しトレーニングやテストによって、6倍から29倍の速度で効率の良いモデルを選択するのにどのように役立つかを示す。
論文 参考訳(メタデータ) (2024-04-09T03:27:09Z) - Generative Multi-modal Models are Good Class-Incremental Learners [51.5648732517187]
クラス増分学習のための新しい生成型マルチモーダルモデル(GMM)フレームワークを提案する。
提案手法は適応生成モデルを用いて画像のラベルを直接生成する。
Few-shot CIL設定では、現在の最先端のすべてのメソッドに対して少なくとも14%精度が向上し、忘れてはならない。
論文 参考訳(メタデータ) (2024-03-27T09:21:07Z) - Confidence-Based Model Selection: When to Take Shortcuts for
Subpopulation Shifts [119.22672589020394]
モデル信頼度がモデル選択を効果的に導くことができるConfidence-based Model Selection (CosMoS)を提案する。
我々はCosMoSを,データ分散シフトのレベルが異なる複数のテストセットを持つ4つのデータセットで評価した。
論文 参考訳(メタデータ) (2023-06-19T18:48:15Z) - Rationale-Guided Few-Shot Classification to Detect Abusive Language [5.977278650516324]
乱用言語検出のためのRGFS(Rationale-Guided Few-Shot Classification)を提案する。
2つの理性統合BERTアーキテクチャ(RGFSモデル)を導入し、5つの異なる乱用言語データセット上でシステムを評価する。
論文 参考訳(メタデータ) (2022-11-30T14:47:14Z) - Solutions for Fine-grained and Long-tailed Snake Species Recognition in
SnakeCLEF 2022 [30.8004334312293]
我々はSnakeCLEF 2022でヘビの種を認識できる方法を紹介した。
いくつかの異なるモデルのアンサンブルにより、3位にランクインしたプライベートスコア82.65%が最終リーダーボードで達成される。
論文 参考訳(メタデータ) (2022-07-04T05:55:58Z) - Gated recurrent units and temporal convolutional network for multilabel
classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。
提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文 参考訳(メタデータ) (2021-10-09T00:00:16Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z) - Solving Long-tailed Recognition with Deep Realistic Taxonomic Classifier [68.38233199030908]
ロングテール認識は、現実世界のシナリオにおける自然な非一様分散データに取り組む。
モダンは人口密度の高いクラスではうまく機能するが、そのパフォーマンスはテールクラスでは著しく低下する。
Deep-RTCは、リアリズムと階層的予測を組み合わせたロングテール問題の新しい解法として提案されている。
論文 参考訳(メタデータ) (2020-07-20T05:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。