Fugu-MT 論文翻訳(概要): Automatic Bat Call Classification using Transformer Networks

論文の概要: Automatic Bat Call Classification using Transformer Networks

arxiv url: http://arxiv.org/abs/2309.11218v1
Date: Wed, 20 Sep 2023 11:15:56 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-21 16:32:57.252151
Title: Automatic Bat Call Classification using Transformer Networks
Title（参考訳）: 変圧器ネットワークを用いた自動バス呼分類
Authors: Frank Fundel, Daniel A. Braun, Sebastian Gottwald
Abstract要約: 自動呼び出しの識別における大きな課題は、高い呼び出しのばらつき、種間の類似性、呼び出しの干渉、注釈付きデータの欠如である。本稿では,リアルタイムな分類シナリオに適用可能なマルチラベル分類のためのTransformerアーキテクチャを提案する。提案手法は, 88.92%(F1スコア84.23%)と多種マクロF1スコア74.40%(F1スコア74.40%)の精度を実現する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Automatically identifying bat species from their echolocation calls is a difficult but important task for monitoring bats and the ecosystem they live in. Major challenges in automatic bat call identification are high call variability, similarities between species, interfering calls and lack of annotated data. Many currently available models suffer from relatively poor performance on real-life data due to being trained on single call datasets and, moreover, are often too slow for real-time classification. Here, we propose a Transformer architecture for multi-label classification with potential applications in real-time classification scenarios. We train our model on synthetically generated multi-species recordings by merging multiple bats calls into a single recording with multiple simultaneous calls. Our approach achieves a single species accuracy of 88.92% (F1-score of 84.23%) and a multi species macro F1-score of 74.40% on our test set. In comparison to three other tools on the independent and publicly available dataset ChiroVox, our model achieves at least 25.82% better accuracy for single species classification and at least 6.9% better macro F1-score for multi species classification.
Abstract（参考訳）: コウモリの自動識別は、コウモリとその生息する生態系をモニタリングする上で、難しいが重要な課題である。自動呼び出しの識別における大きな課題は、高い呼び出し変数、種間の類似性、干渉呼び出し、注釈付きデータの欠如である。現在利用可能なモデルの多くは、単一のコールデータセットでトレーニングされているため、実際のデータに対するパフォーマンスが比較的低い上に、リアルタイムな分類には遅すぎることが多い。本稿では,リアルタイムな分類シナリオに適用可能なマルチラベル分類のためのTransformerアーキテクチャを提案する。複数のbats呼び出しを複数の同時呼び出しで単一の記録にマージすることにより、合成した多種多様な記録でモデルを訓練する。本手法は, 88.92%(F1スコア84.23%)と多種マクロF1スコア74.40%の精度を実現する。独立したデータセットであるchirovoxの他の3つのツールと比較して、単一種分類の精度は少なくとも25.82%向上し、マルチ種分類のマクロf1-scoreは少なくとも6.9%向上している。

関連論文リスト

Adaptive Thresholding for Multi-Label Classification via Global-Local Signal Fusion [0.0]
マルチラベル分類 (MLC) ではサンプル毎に複数のラベルを予測する必要がある。従来のアプローチでは、固定しきい値を適用したり、ラベルを個別に扱うことで、コンテキストやグローバルな希少性を見渡せる。我々は、グローバル(IDFベース)とローカル(KNNベース)の信号を融合して、ラベルごとの閾値を生成する適応しきい値設定機構を導入する。
論文参考訳（メタデータ） (2025-05-06T02:19:37Z)
CKSP: Cross-species Knowledge Sharing and Preserving for Universal Animal Activity Recognition [7.012560255346829]
我々は,多種多様な動物種のセンサデータに基づいて,多種間知識共有保存(CKSP)と呼ばれる一対一のフレームワークを提案する。一般的な特徴を学習するために、共有されたフルランクの畳み込み層を使用し、CKSPフレームワークは種間の相補性を学ぶことができる。種間のデータ分布の相違から生じる訓練競合を考慮し,種別バッチ正規化(SBN)モジュールを考案した。
論文参考訳（メタデータ） (2024-10-22T02:44:10Z)
Learning to rumble: Automated elephant call classification, detection and endpointing using deep architectures [0.0]
連続録音音声における象の鳴き声の検出・分離・分類の問題点を考察する。実験では,アジアとアフリカゾウの鳴き声を含む2つの注釈付きデータセットを用いた。従来この目的に使用されていなかったニューラルアーキテクチャであるオーディオ・スペクトログラム・トランスフォーマー(AST)を用いて,新しいシーケンス・ツー・シーケンス方式で構成した。完全自動化されたゾウ呼検出・サブコール分類システムが到達範囲内にあると結論付けている。
論文参考訳（メタデータ） (2024-10-15T21:56:40Z)
A Lightweight Measure of Classification Difficulty from Application Dataset Characteristics [4.220363193932374]
効率的なコサイン類似度に基づく分類困難度尺度Sを提案する。データセットのクラス数とクラス内およびクラス間の類似度メトリクスから計算される。この手法を実践者が、繰り返しトレーニングやテストによって、6倍から29倍の速度で効率の良いモデルを選択するのにどのように役立つかを示す。
論文参考訳（メタデータ） (2024-04-09T03:27:09Z)
Generative Multi-modal Models are Good Class-Incremental Learners [51.5648732517187]
クラス増分学習のための新しい生成型マルチモーダルモデル(GMM)フレームワークを提案する。提案手法は適応生成モデルを用いて画像のラベルを直接生成する。 Few-shot CIL設定では、現在の最先端のすべてのメソッドに対して少なくとも14%精度が向上し、忘れてはならない。
論文参考訳（メタデータ） (2024-03-27T09:21:07Z)
BirdSet: A Large-Scale Dataset for Audio Classification in Avian Bioacoustics [2.2399415927517414]
textttBirdSetは、鳥のバイオ音響に焦点を当てたオーディオ分類のための大規模なベンチマークデータセットである。 textttBirdSetは、トレーニング用に1万近いクラス($uparrow!18times$)から6800以上の録音時間($uparrow!17%$)、強くラベル付けされた8つの評価データセットで400時間以上($uparrow!7times$)でAudioSetを上回っている。
論文参考訳（メタデータ） (2024-03-15T15:10:40Z)
Confidence-Based Model Selection: When to Take Shortcuts for Subpopulation Shifts [119.22672589020394]
モデル信頼度がモデル選択を効果的に導くことができるConfidence-based Model Selection (CosMoS)を提案する。我々はCosMoSを,データ分散シフトのレベルが異なる複数のテストセットを持つ4つのデータセットで評価した。
論文参考訳（メタデータ） (2023-06-19T18:48:15Z)
Rationale-Guided Few-Shot Classification to Detect Abusive Language [5.977278650516324]
乱用言語検出のためのRGFS(Rationale-Guided Few-Shot Classification)を提案する。 2つの理性統合BERTアーキテクチャ(RGFSモデル)を導入し、5つの異なる乱用言語データセット上でシステムを評価する。
論文参考訳（メタデータ） (2022-11-30T14:47:14Z)
Solutions for Fine-grained and Long-tailed Snake Species Recognition in SnakeCLEF 2022 [30.8004334312293]
我々はSnakeCLEF 2022でヘビの種を認識できる方法を紹介した。いくつかの異なるモデルのアンサンブルにより、3位にランクインしたプライベートスコア82.65%が最終リーダーボードで達成される。
論文参考訳（メタデータ） (2022-07-04T05:55:58Z)
Gated recurrent units and temporal convolutional network for multilabel classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文参考訳（メタデータ） (2021-10-09T00:00:16Z)
No Fear of Heterogeneity: Classifier Calibration for Federated Learning with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文参考訳（メタデータ） (2021-06-09T12:02:29Z)
Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。 3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文参考訳（メタデータ） (2020-07-21T14:31:27Z)
Solving Long-tailed Recognition with Deep Realistic Taxonomic Classifier [68.38233199030908]
ロングテール認識は、現実世界のシナリオにおける自然な非一様分散データに取り組む。モダンは人口密度の高いクラスではうまく機能するが、そのパフォーマンスはテールクラスでは著しく低下する。 Deep-RTCは、リアリズムと階層的予測を組み合わせたロングテール問題の新しい解法として提案されている。
論文参考訳（メタデータ） (2020-07-20T05:57:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。