論文の概要: Uncertainty Calibration of Multi-Label Bird Sound Classifiers
- arxiv url: http://arxiv.org/abs/2511.08261v1
- Date: Wed, 12 Nov 2025 01:49:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.724293
- Title: Uncertainty Calibration of Multi-Label Bird Sound Classifiers
- Title(参考訳): マルチラベル鳥音分類器の不確かさ校正
- Authors: Raphael Schwinger, Ben McEwen, Vincent S. Kather, René Heinrich, Lukas Rauch, Sven Tomforde,
- Abstract要約: 生体音響学において、キャリブレーションは、重なり合う発声、長い尾を持つ種分布、訓練データと展開データの間の分布シフトによって挑戦される。
我々は、BirdSetベンチマークにおいて、4つの最先端のマルチラベル音声分類器の校正をベンチマークし、グローバル、データセットごと、クラスごとの校正の両方を評価した。
- 参考スコア(独自算出の注目度): 2.3510007132962203
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Passive acoustic monitoring enables large-scale biodiversity assessment, but reliable classification of bioacoustic sounds requires not only high accuracy but also well-calibrated uncertainty estimates to ground decision-making. In bioacoustics, calibration is challenged by overlapping vocalisations, long-tailed species distributions, and distribution shifts between training and deployment data. The calibration of multi-label deep learning classifiers within the domain of bioacoustics has not yet been assessed. We systematically benchmark the calibration of four state-of-the-art multi-label bird sound classifiers on the BirdSet benchmark, evaluating both global, per-dataset and per-class calibration using threshold-free calibration metrics (ECE, MCS) alongside discrimination metrics (cmAP). Model calibration varies significantly across datasets and classes. While Perch v2 and ConvNeXt$_{BS}$ show better global calibration, results vary between datasets. Both models indicate consistent underconfidence, while AudioProtoPNet and BirdMAE are mostly overconfident. Surprisingly, calibration seems to be better for less frequent classes. Using simple post hoc calibration methods we demonstrate a straightforward way to improve calibration. A small labelled calibration set is sufficient to significantly improve calibration with Platt scaling, while global calibration parameters suffer from dataset variability. Our findings highlight the importance of evaluating and improving uncertainty calibration in bioacoustic classifiers.
- Abstract(参考訳): パッシブ・アコースティック・モニタリングは、大規模生物多様性評価を可能にするが、バイオ音響音の信頼性の高い分類には、高い精度だけでなく、基礎的意思決定に対する不確実性評価も必要である。
生体音響学において、キャリブレーションは、重なり合う発声、長い尾を持つ種分布、訓練データと展開データの間の分布シフトによって挑戦される。
バイオ音響学領域における多ラベル深層学習分類器の校正は未だ評価されていない。
我々は,BirdSetベンチマークを用いて,最先端の4つの鳥音分類器の校正を系統的に評価し,大域的,データセットごと,クラスごとの校正の両方を,識別指標(cmAP)とともにしきい値のない校正指標(ECE,MCS)を用いて評価した。
モデルのキャリブレーションはデータセットやクラスによって大きく異なる。
Perch v2 と ConvNeXt$_{BS}$ はより優れたグローバルキャリブレーションを示すが、結果はデータセットによって異なる。
どちらのモデルも一貫して不信感を示すが、AudioProtoPNetとBirdMAEは概ね過信である。
意外なことに、校正は授業の頻度を低くする方がよいようだ。
簡単なポストホックキャリブレーション法を用いて、キャリブレーションを改善するための簡単な方法を示す。
小さいラベル付きキャリブレーションセットはプラッツスケーリングによるキャリブレーションを著しく改善するのに十分であり、グローバルキャリブレーションパラメータはデータセットの変動に悩まされている。
本研究は,バイオ音響分類器における不確実性校正の評価と改善の重要性を強調した。
関連論文リスト
- Scalable Utility-Aware Multiclass Calibration [53.28176049547449]
ユーティリティキャリブレーション(英: Utility calibration)は、特定のユーティリティ関数に対するキャリブレーション誤差を測定する一般的なフレームワークである。
我々は、このフレームワークが既存のキャリブレーションメトリクスを統一し、再解釈する方法を実証する。
論文 参考訳(メタデータ) (2025-10-29T12:32:14Z) - Beyond One-Hot Labels: Semantic Mixing for Model Calibration [22.39558434131574]
textbfCalibration-aware Semantic Mixing (CSM) は、クラス特性の混合したトレーニングサンプルを生成する新しいフレームワークである。
我々はCSMが最先端のキャリブレーション手法よりも優れたキャリブレーションを実現することを示す。
論文 参考訳(メタデータ) (2025-04-18T08:26:18Z) - Adaptive Calibrator Ensemble for Model Calibration under Distribution
Shift [23.794897699193875]
アダプティブ・キャリブレータ・アンサンブル(ACE)は、通常はキャリブレーション・セットよりも難しいOODデータセットをキャリブレーション・セットに分類する。
ACEは一般に、一連のOODベンチマークにおけるいくつかの最先端のキャリブレーション方式の性能を改善している。
論文 参考訳(メタデータ) (2023-03-09T15:22:02Z) - On Calibrating Semantic Segmentation Models: Analyses and An Algorithm [51.85289816613351]
セマンティックセグメンテーションキャリブレーションの問題について検討する。
モデルキャパシティ、作物サイズ、マルチスケールテスト、予測精度はキャリブレーションに影響を及ぼす。
我々は、単純で統一的で効果的なアプローチ、すなわち選択的スケーリングを提案する。
論文 参考訳(メタデータ) (2022-12-22T22:05:16Z) - Investigation of Different Calibration Methods for Deep Speaker
Embedding based Verification Systems [66.61691401921296]
本稿では, ディープスピーカ埋込抽出器のスコアキャリブレーション法について検討する。
この研究のさらなる焦点は、スコア正規化がシステムの校正性能に与える影響を推定することである。
論文 参考訳(メタデータ) (2022-03-28T21:22:22Z) - Hidden Heterogeneity: When to Choose Similarity-Based Calibration [12.788224825185633]
ブラックボックスキャリブレーション法は、キャリブレーションが予測精度を向上させるサブポレーションを検出することができない。
隠れ不均一性(HH)の定量的尺度を提案する。
実験により, 類似度に基づくキャリブレーション法によって達成されたキャリブレーションの改善は, 現在あるHH量と相関し, 十分なキャリブレーションデータを得た場合, 大域的なキャリブレーション法で達成したキャリブレーションを概ね上回っていることがわかった。
論文 参考訳(メタデータ) (2022-02-03T20:43:25Z) - Localized Calibration: Metrics and Recalibration [133.07044916594361]
完全大域キャリブレーションと完全個別化キャリブレーションのギャップにまたがる細粒度キャリブレーション指標を提案する。
次に,局所再校正法であるLoReを導入し,既存の校正法よりもLCEを改善する。
論文 参考訳(メタデータ) (2021-02-22T07:22:12Z) - Unsupervised Calibration under Covariate Shift [92.02278658443166]
ドメインシフト下でのキャリブレーションの問題を導入し、それに対処するための重要サンプリングに基づくアプローチを提案する。
実世界のデータセットと合成データセットの両方において,本手法の有効性を評価し検討した。
論文 参考訳(メタデータ) (2020-06-29T21:50:07Z) - Multi-Class Uncertainty Calibration via Mutual Information
Maximization-based Binning [8.780958735684958]
ポストホック多クラスキャリブレーションは、ディープニューラルネットワーク予測の信頼度推定を提供する一般的なアプローチである。
近年の研究では、広く使われているスケーリング手法がキャリブレーション誤差を過小評価していることが示されている。
類似クラス間で1つのキャリブレータを共有する共有クラスワイド(sCW)キャリブレーション戦略を提案する。
論文 参考訳(メタデータ) (2020-06-23T15:31:59Z) - Better Classifier Calibration for Small Data Sets [0.0]
キャリブレーションのためのデータ生成により,キャリブレーションアルゴリズムの性能が向上することを示す。
提案手法は計算コストを増大させるが、主なユースケースは小さなデータセットであるので、この余分な計算コストは重要ではない。
論文 参考訳(メタデータ) (2020-02-24T12:27:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。