論文の概要: All Thresholds Barred: Direct Estimation of Call Density in Bioacoustic
Data
- arxiv url: http://arxiv.org/abs/2402.15360v1
- Date: Fri, 23 Feb 2024 14:52:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-26 14:24:04.357889
- Title: All Thresholds Barred: Direct Estimation of Call Density in Bioacoustic
Data
- Title(参考訳): バイオ音響データにおけるコール密度の直接推定
- Authors: Amanda K. Navine, Tom Denton, Matthew J. Weldy, Patrick J. Hart
- Abstract要約: 本研究では,データ単位の呼び出し密度を推定するための検証手法を提案する。
我々はこれらの分布を用いて、分布シフトの対象となるサイトレベルの密度を予測する。
- 参考スコア(独自算出の注目度): 1.7916003204531015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Passive acoustic monitoring (PAM) studies generate thousands of hours of
audio, which may be used to monitor specific animal populations, conduct broad
biodiversity surveys, detect threats such as poachers, and more. Machine
learning classifiers for species identification are increasingly being used to
process the vast amount of audio generated by bioacoustic surveys, expediting
analysis and increasing the utility of PAM as a management tool. In common
practice, a threshold is applied to classifier output scores, and scores above
the threshold are aggregated into a detection count. The choice of threshold
produces biased counts of vocalizations, which are subject to false
positive/negative rates that may vary across subsets of the dataset. In this
work, we advocate for directly estimating call density: The proportion of
detection windows containing the target vocalization, regardless of classifier
score. Our approach targets a desirable ecological estimator and provides a
more rigorous grounding for identifying the core problems caused by
distribution shifts -- when the defining characteristics of the data
distribution change -- and designing strategies to mitigate them. We propose a
validation scheme for estimating call density in a body of data and obtain,
through Bayesian reasoning, probability distributions of confidence scores for
both the positive and negative classes. We use these distributions to predict
site-level densities, which may be subject to distribution shifts. We test our
proposed methods on a real-world study of Hawaiian birds and provide simulation
results leveraging existing fully annotated datasets, demonstrating robustness
to variations in call density and classifier model quality.
- Abstract(参考訳): パッシブ・アコースティック・モニタリング(PAM)研究は、特定の動物の個体群をモニターしたり、幅広い生物多様性の調査を行ったり、密猟者などの脅威を検出するために数千時間のオーディオを生成する。
種識別のための機械学習分類器は、バイオ音響サーベイによって生成される膨大な量のオーディオ処理、分析の迅速化、管理ツールとしてのPAMの有用性の向上にますます利用されている。
一般的には、分類器出力スコアにしきい値を適用し、しきい値以上のスコアを検出カウントに集約する。
しきい値の選択は、データセットのサブセットによって異なるかもしれない偽陽性/負のレートの発声のバイアス数を生成する。
本研究は, 呼密度の直接推定を提唱する: 分類器のスコアによらず, 対象の発声を含む検出窓の割合。
我々のアプローチは、望ましい生態学的推定器を目標とし、データ分散の変化の定義特性が変化するときに、分散シフトによって引き起こされるコア問題を特定するためのより厳密な基盤を提供する。
本研究では,データ単位内の呼密度を推定し,ベイズ的推論により,正と負の両方の信頼度スコアの確率分布を求める検証手法を提案する。
我々はこれらの分布を用いて、分布シフトの対象となるサイトレベルの密度を予測する。
提案手法をハワイ鳥の実世界実験で検証し,既存の完全注釈データセットを活用したシミュレーション結果を提供し,呼密度と分類器モデル品質の変動に対するロバスト性を示す。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Extracting Clean and Balanced Subset for Noisy Long-tailed Classification [66.47809135771698]
そこで我々は,分布マッチングの観点から,クラスプロトタイプを用いた新しい擬似ラベリング手法を開発した。
手動で特定の確率尺度を設定することで、ノイズと長い尾を持つデータの副作用を同時に減らすことができる。
本手法は, クリーンなラベル付きクラスバランスサブセットを抽出し, ラベルノイズ付きロングテール分類において, 効果的な性能向上を実現する。
論文 参考訳(メタデータ) (2024-04-10T07:34:37Z) - Towards Automated Animal Density Estimation with Acoustic Spatial
Capture-Recapture [2.5193666094305938]
デジタルレコーダーにより、測量士は大量のデータを低コストで収集することができる。
しかし、これらのデータの中で標的となる種の発声を識別するのは簡単ではない。
機械学習(ML)手法はしばしばその識別に使用される。
音響的空間キャプチャー・キャプチャー推定のための3つの手法を提案する。
論文 参考訳(メタデータ) (2023-08-24T15:29:24Z) - Optimizing the Noise in Self-Supervised Learning: from Importance
Sampling to Noise-Contrastive Estimation [80.07065346699005]
GAN(Generative Adversarial Networks)のように、最適な雑音分布はデータ分布に等しくなると広く想定されている。
我々は、この自己教師型タスクをエネルギーベースモデルの推定問題として基礎づけるノイズ・コントラスト推定に目を向ける。
本研究は, 最適雑音のサンプリングは困難であり, 効率性の向上は, データに匹敵する雑音分布を選択することに比べ, 緩やかに行うことができると結論付けた。
論文 参考訳(メタデータ) (2023-01-23T19:57:58Z) - Propagating Variational Model Uncertainty for Bioacoustic Call Label
Smoothing [15.929064190849665]
ベイズニューラルネットワークが計算した予測不確実性信号を用いて、モデルが訓練している自己学習タスクの学習をガイドすることに焦点を当てる。
コストのかかるモンテカルロサンプリングを選ばず、近似的な隠れ分散をエンドツーエンドに伝播する。
損失計算における不確かさの明示的利用により, 変動モデルにより予測・校正性能が向上したことを示す。
論文 参考訳(メタデータ) (2022-10-19T13:04:26Z) - Learning to Adapt to Domain Shifts with Few-shot Samples in Anomalous
Sound Detection [7.631596468553607]
異常検出は、産業機器の監視など、多くの重要な応用がある。
サンプルの少ない新しい条件に適応するフレームワークを提案する。
提案手法は,最近リリースされた各種機械の音響測定データセットを用いて評価する。
論文 参考訳(メタデータ) (2022-04-05T00:22:25Z) - Benchmarking Uncertainty Qualification on Biosignal Classification Tasks
under Dataset Shift [16.15816241847314]
そこで本研究では,生体信号のデータセットシフトを推定する際の不確実性を評価する枠組みを提案する。
特に、呼吸音と心電図信号に基づく3つの分類タスクを用いて、5つの代表的な不確実性判定方法のベンチマークを行う。
論文 参考訳(メタデータ) (2021-12-16T20:42:17Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Deep Semi-supervised Knowledge Distillation for Overlapping Cervical
Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。
摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。
実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-21T13:27:09Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。