論文の概要: Automatic Bat Call Classification using Transformer Networks
- arxiv url: http://arxiv.org/abs/2309.11218v1
- Date: Wed, 20 Sep 2023 11:15:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-21 16:32:57.252151
- Title: Automatic Bat Call Classification using Transformer Networks
- Title(参考訳): 変圧器ネットワークを用いた自動バス呼分類
- Authors: Frank Fundel, Daniel A. Braun, Sebastian Gottwald
- Abstract要約: 自動呼び出しの識別における大きな課題は、高い呼び出しのばらつき、種間の類似性、呼び出しの干渉、注釈付きデータの欠如である。
本稿では,リアルタイムな分類シナリオに適用可能なマルチラベル分類のためのTransformerアーキテクチャを提案する。
提案手法は, 88.92%(F1スコア84.23%)と多種マクロF1スコア74.40%(F1スコア74.40%)の精度を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Automatically identifying bat species from their echolocation calls is a
difficult but important task for monitoring bats and the ecosystem they live
in. Major challenges in automatic bat call identification are high call
variability, similarities between species, interfering calls and lack of
annotated data. Many currently available models suffer from relatively poor
performance on real-life data due to being trained on single call datasets and,
moreover, are often too slow for real-time classification. Here, we propose a
Transformer architecture for multi-label classification with potential
applications in real-time classification scenarios. We train our model on
synthetically generated multi-species recordings by merging multiple bats calls
into a single recording with multiple simultaneous calls. Our approach achieves
a single species accuracy of 88.92% (F1-score of 84.23%) and a multi species
macro F1-score of 74.40% on our test set. In comparison to three other tools on
the independent and publicly available dataset ChiroVox, our model achieves at
least 25.82% better accuracy for single species classification and at least
6.9% better macro F1-score for multi species classification.
- Abstract(参考訳): コウモリの自動識別は、コウモリとその生息する生態系をモニタリングする上で、難しいが重要な課題である。
自動呼び出しの識別における大きな課題は、高い呼び出し変数、種間の類似性、干渉呼び出し、注釈付きデータの欠如である。
現在利用可能なモデルの多くは、単一のコールデータセットでトレーニングされているため、実際のデータに対するパフォーマンスが比較的低い上に、リアルタイムな分類には遅すぎることが多い。
本稿では,リアルタイムな分類シナリオに適用可能なマルチラベル分類のためのTransformerアーキテクチャを提案する。
複数のbats呼び出しを複数の同時呼び出しで単一の記録にマージすることにより、合成した多種多様な記録でモデルを訓練する。
本手法は, 88.92%(F1スコア84.23%)と多種マクロF1スコア74.40%の精度を実現する。
独立したデータセットであるchirovoxの他の3つのツールと比較して、単一種分類の精度は少なくとも25.82%向上し、マルチ種分類のマクロf1-scoreは少なくとも6.9%向上している。
関連論文リスト
- A Lightweight Measure of Classification Difficulty from Application Dataset Characteristics [4.220363193932374]
本稿では,データセットのクラス数とクラス内およびクラス間類似度指標から算出した効率的な分類難度尺度を提案する。
この尺度は,反復的なトレーニングやテストよりも,小さなデータセットに対して6~29倍高速に計算効率の高いモデルを選択する上で有効であることを示す。
論文 参考訳(メタデータ) (2024-04-09T03:27:09Z) - Generative Multi-modal Models are Good Class-Incremental Learners [51.5648732517187]
クラス増分学習のための新しい生成型マルチモーダルモデル(GMM)フレームワークを提案する。
提案手法は適応生成モデルを用いて画像のラベルを直接生成する。
Few-shot CIL設定では、現在の最先端のすべてのメソッドに対して少なくとも14%精度が向上し、忘れてはならない。
論文 参考訳(メタデータ) (2024-03-27T09:21:07Z) - Confidence-Based Model Selection: When to Take Shortcuts for
Subpopulation Shifts [119.22672589020394]
モデル信頼度がモデル選択を効果的に導くことができるConfidence-based Model Selection (CosMoS)を提案する。
我々はCosMoSを,データ分散シフトのレベルが異なる複数のテストセットを持つ4つのデータセットで評価した。
論文 参考訳(メタデータ) (2023-06-19T18:48:15Z) - Rationale-Guided Few-Shot Classification to Detect Abusive Language [5.977278650516324]
乱用言語検出のためのRGFS(Rationale-Guided Few-Shot Classification)を提案する。
2つの理性統合BERTアーキテクチャ(RGFSモデル)を導入し、5つの異なる乱用言語データセット上でシステムを評価する。
論文 参考訳(メタデータ) (2022-11-30T14:47:14Z) - Solutions for Fine-grained and Long-tailed Snake Species Recognition in
SnakeCLEF 2022 [30.8004334312293]
我々はSnakeCLEF 2022でヘビの種を認識できる方法を紹介した。
いくつかの異なるモデルのアンサンブルにより、3位にランクインしたプライベートスコア82.65%が最終リーダーボードで達成される。
論文 参考訳(メタデータ) (2022-07-04T05:55:58Z) - A Novel Plug-in Module for Fine-Grained Visual Classification [0.19336815376402716]
本稿では,多くの一般的なバックボーンと一体化して,強力な識別領域を提供する新しいプラグインモジュールを提案する。
実験の結果,提案するプラグインモジュールは最先端のアプローチよりも優れていた。
論文 参考訳(メタデータ) (2022-02-08T12:35:58Z) - Gated recurrent units and temporal convolutional network for multilabel
classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。
提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文 参考訳(メタデータ) (2021-10-09T00:00:16Z) - Error Detection in Large-Scale Natural Language Understanding Systems
Using Transformer Models [0.0]
Alexa、Siri、Cortana、Google Assistantといった大規模な会話アシスタントは、ドメイン、インテント、名前付きエンティティ認識の複数のモデルを使用して、発話毎に処理する。
オフラインのTransformerモデルを用いて、ドメイン分類エラーを検出する。
そこで我々は,RoBERTaモデルから生成した発話エンコーディングと生産システムのNbest仮説を組み合わせた。
論文 参考訳(メタデータ) (2021-09-04T00:10:48Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z) - Solving Long-tailed Recognition with Deep Realistic Taxonomic Classifier [68.38233199030908]
ロングテール認識は、現実世界のシナリオにおける自然な非一様分散データに取り組む。
モダンは人口密度の高いクラスではうまく機能するが、そのパフォーマンスはテールクラスでは著しく低下する。
Deep-RTCは、リアリズムと階層的予測を組み合わせたロングテール問題の新しい解法として提案されている。
論文 参考訳(メタデータ) (2020-07-20T05:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。