論文の概要: Hybrid Disagreement-Diversity Active Learning for Bioacoustic Sound Event Detection
- arxiv url: http://arxiv.org/abs/2505.20956v2
- Date: Wed, 28 May 2025 20:06:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 13:10:25.748848
- Title: Hybrid Disagreement-Diversity Active Learning for Bioacoustic Sound Event Detection
- Title(参考訳): 生体音響イベント検出のためのハイブリッド分散・ダイバーシティアクティブラーニング
- Authors: Shiqi Zhang, Tuomas Virtanen,
- Abstract要約: MFFT(Match First Farthest-traversal)は,委員会投票の不一致と多様性分析を統合した活発な学習手法である。
MFFTは、冷間開始時に68%、温間開始時に71%のmAPを達成し、アノテーションの2.3%しか使用していない。
特に、MFFTはコールドスタートのシナリオと、絶滅危惧種のモニタリングに重要な希少種に優れており、その実用的価値を示している。
- 参考スコア(独自算出の注目度): 9.16288808621826
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bioacoustic sound event detection (BioSED) is crucial for biodiversity conservation but faces practical challenges during model development and training: limited amounts of annotated data, sparse events, species diversity, and class imbalance. To address these challenges efficiently with a limited labeling budget, we apply the mismatch-first farthest-traversal (MFFT), an active learning method integrating committee voting disagreement and diversity analysis. We also refine an existing BioSED dataset specifically for evaluating active learning algorithms. Experimental results demonstrate that MFFT achieves a mAP of 68% when cold-starting and 71% when warm-starting (which is close to the fully-supervised mAP of 75%) while using only 2.3% of the annotations. Notably, MFFT excels in cold-start scenarios and with rare species, which are critical for monitoring endangered species, demonstrating its practical value.
- Abstract(参考訳): バイオアコースティック・サウンド・イベント検出 (BioSED) は生物多様性の保全に不可欠であるが, 限られた量のアノテートデータ, スパース・イベント, 種多様性, クラス不均衡など, モデル開発と訓練の実践的課題に直面している。
これらの課題を限定的なラベル付け予算で効率的に解決するために、委員会投票の不一致と多様性分析を統合した活発な学習手法であるMFFT(Match First Farthest-traversal)を適用した。
また、アクティブな学習アルゴリズムを評価するために、既存のBioSEDデータセットを洗練します。
実験の結果、MFFTは冷間開始時に68%、温間開始時に71%のmAPを達成し、アノテーションの2.3%しか使用していないことが明らかとなった。
特に、MFFTはコールドスタートのシナリオと、絶滅危惧種のモニタリングに重要な希少種に優れており、その実用的価値を示している。
関連論文リスト
- Audio-Visual Class-Incremental Learning for Fish Feeding intensity Assessment in Aquaculture [29.42598968673262]
魚の摂食強度評価(FFIA)は産業用養殖管理において重要である。
最近のマルチモーダルアプローチは、FFIAの堅牢性と効率性を改善することを約束している。
AV-CIL-FFIAは,水養環境下で6種の魚の摂餌強度を計測する81,932個のラベル付き視覚クリップからなる新しいデータセットである。
そして、FFIAのための音声視覚クラスインクリメンタルラーニング(CIL)の先駆者となり、AV-CIL-FFIAのベンチマークにより、単一モダリティ法を著しく上回ることを示す。
論文 参考訳(メタデータ) (2025-04-21T15:24:34Z) - Towards Deep Active Learning in Avian Bioacoustics [1.7522552085069194]
アクティブラーニング(AL)は、アノテーションのコストを削減し、ラベル付けに最も有用なインスタンスをクエリすることで、さまざまなシナリオへの適応を高速化する。
本稿では、ALのアプローチを概説し、重要な課題を紹介し、小規模のパイロットスタディを実施している。
論文 参考訳(メタデータ) (2024-06-26T08:43:05Z) - Multitask frame-level learning for few-shot sound event detection [46.32294691870714]
本稿では,限られたサンプルを用いて音声イベントを自動的に認識・分類することを目的とした音声イベント検出(SED)について述べる。
本稿では,データ拡張のためのリニアタイミングマスクであるTimeFilterAugと,マルチタスクフレームレベルのSEDフレームワークを提案する。
提案手法はFスコア63.8%を達成し, バイオ音響事象検出カテゴリーにおける第1位を確保した。
論文 参考訳(メタデータ) (2024-03-17T05:00:40Z) - Learning with Imbalanced Noisy Data by Preventing Bias in Sample
Selection [82.43311784594384]
実世界のデータセットには、ノイズの多いラベルだけでなく、クラス不均衡も含まれている。
不均衡なデータセットにおけるノイズラベルに対処する,単純かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-02-17T10:34:53Z) - When Measures are Unreliable: Imperceptible Adversarial Perturbations
toward Top-$k$ Multi-Label Learning [83.8758881342346]
新しい損失関数は、視覚的および測定的不受容性を両立できる敵の摂動を生成するために考案された。
大規模ベンチマークデータセットを用いた実験により,提案手法が最上位の$kのマルチラベルシステムを攻撃する際の優位性を実証した。
論文 参考訳(メタデータ) (2023-07-27T13:18:47Z) - Active Learning with Contrastive Pre-training for Facial Expression
Recognition [19.442685015494316]
本研究では,3つの公開FERデータセットを用いた最近のアクティブラーニング手法について検討する。
その結果,既存のアクティブラーニング手法はFERの文脈ではうまく動作しないことがわかった。
本稿では,まず,非ラベルデータセット全体に基づいて基礎となる表現を学習する,自己教師付き事前学習を提案する。
論文 参考訳(メタデータ) (2023-07-06T03:08:03Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - PercentMatch: Percentile-based Dynamic Thresholding for Multi-Label
Semi-Supervised Classification [64.39761523935613]
トレーニング中の各クラスに対する正と負の擬似ラベルのスコア閾値を動的に変更するためのパーセンタイルベースのしきい値調整手法を提案する。
近年のSSL方式と比較して, Pascal VOC2007 と MS-COCO のデータセットの性能は高い。
論文 参考訳(メタデータ) (2022-08-30T01:27:48Z) - Scale-Equivalent Distillation for Semi-Supervised Object Detection [57.59525453301374]
近年のSemi-Supervised Object Detection (SS-OD) 法は主に自己学習に基づいており、教師モデルにより、ラベルなしデータを監視信号としてハードな擬似ラベルを生成する。
実験結果から,これらの手法が直面する課題を分析した。
本稿では,大規模オブジェクトサイズの分散とクラス不均衡に頑健な簡易かつ効果的なエンド・ツー・エンド知識蒸留フレームワークであるSED(Scale-Equivalent Distillation)を提案する。
論文 参考訳(メタデータ) (2022-03-23T07:33:37Z) - Towards Reducing Labeling Cost in Deep Object Detection [61.010693873330446]
本稿では,検知器の不確実性と頑健性の両方を考慮した,アクティブラーニングのための統一的なフレームワークを提案する。
提案手法は, 確率分布のドリフトを抑えながら, 極めて確実な予測を擬似ラベル化することができる。
論文 参考訳(メタデータ) (2021-06-22T16:53:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。