論文の概要: Ecologically Valid Benchmarking and Adaptive Attention: Scalable Marine Bioacoustic Monitoring
- arxiv url: http://arxiv.org/abs/2509.04682v1
- Date: Thu, 04 Sep 2025 22:03:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 14:27:25.418472
- Title: Ecologically Valid Benchmarking and Adaptive Attention: Scalable Marine Bioacoustic Monitoring
- Title(参考訳): Ecologically Valid Benchmarking and Adaptive Attention: Scalable Marine Bioacoustic Monitoring
- Authors: Nicholas R. Rasmussen, Rodrigue Rizk, Longwei Wang, KC Santosh,
- Abstract要約: GetNetUPAMは、現実的な可変性の下で安定性をモデル化するためのネストされたクロスバリデーションフレームワークである。
データは異なるサイト年区分に分割され、記録を保存し、各バリデーションフォールドがユニークな環境サブセットを反映することを保証する。
ARPA-Nは、DenseNetベースラインに対する平均精度が14.4%向上し、すべてのメトリクスで対数2スケールのオーダー・オブ・マグニチュードが減少する。
- 参考スコア(独自算出の注目度): 2.558238597112103
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Underwater Passive Acoustic Monitoring (UPAM) provides rich spatiotemporal data for long-term ecological analysis, but intrinsic noise and complex signal dependencies hinder model stability and generalization. Multilayered windowing has improved target sound localization, yet variability from shifting ambient noise, diverse propagation effects, and mixed biological and anthropogenic sources demands robust architectures and rigorous evaluation. We introduce GetNetUPAM, a hierarchical nested cross-validation framework designed to quantify model stability under ecologically realistic variability. Data are partitioned into distinct site-year segments, preserving recording heterogeneity and ensuring each validation fold reflects a unique environmental subset, reducing overfitting to localized noise and sensor artifacts. Site-year blocking enforces evaluation against genuine environmental diversity, while standard cross-validation on random subsets measures generalization across UPAM's full signal distribution, a dimension absent from current benchmarks. Using GetNetUPAM as the evaluation backbone, we propose the Adaptive Resolution Pooling and Attention Network (ARPA-N), a neural architecture for irregular spectrogram dimensions. Adaptive pooling with spatial attention extends the receptive field, capturing global context without excessive parameters. Under GetNetUPAM, ARPA-N achieves a 14.4% gain in average precision over DenseNet baselines and a log2-scale order-of-magnitude drop in variability across all metrics, enabling consistent detection across site-year folds and advancing scalable, accurate bioacoustic monitoring.
- Abstract(参考訳): 水中受動的音響モニタリング (UPAM) は, 長期的生態解析のための豊富な時空間データを提供するが, 内在ノイズと複雑な信号依存性はモデル安定性と一般化を妨げる。
マルチレイヤーウィンドウは、ターゲット音像定位を改善したが、環境騒音のシフト、多様な伝搬効果、および生物と人為的資源の混在により、堅牢なアーキテクチャと厳密な評価が要求される。
本稿では,階層型ネスト型クロスバリデーションフレームワークであるGetNetUPAMを紹介する。
データは異なるサイト年区分に分割され、記録の不均一性を保持し、各バリデーションフォールドが固有の環境サブセットを反映することを保証し、局所的なノイズやセンサアーティファクトへの過度な適合を減らす。
サイト年間ブロッキングは、真の環境多様性に対する評価を強制する一方、ランダムサブセットの標準的なクロスバリデーションは、UPAMの全信号分布の一般化を測定する。
本稿では,GetNetUPAMを評価バックボーンとして用い,不規則スペクトル次元のニューラルネットワークであるアダプティブ・レゾリューション・プール・アンド・アテンション・ネットワーク(ARPA-N)を提案する。
空間的注意を伴う適応的なプーリングは受容場を拡張し、過剰なパラメータなしでグローバルなコンテキストをキャプチャする。
GetNetUPAMの下では、ARPA-Nは、DenseNetベースラインに対する平均精度が14.4%向上し、すべてのメトリクスに対する対数2スケールのオーダー・オブ・マグニチュードの減少を実現している。
関連論文リスト
- FedGSCA: Medical Federated Learning with Global Sample Selector and Client Adaptive Adjuster under Label Noise [3.5585588724306643]
フェデレートラーニング(FL)は、データのプライバシを保持しながら、協調的な医療画像分類のソリューションとして登場した。
ノイズの多い医療FLにおけるロバスト性向上のための新しいフレームワークであるFedGSCAを提案する。
我々はFedGSCAを実世界の1つのコロンスライスデータセットと2つの合成医療データセットで様々なノイズ条件下で評価した。
論文 参考訳(メタデータ) (2025-07-13T08:51:51Z) - Adaptive Control Attention Network for Underwater Acoustic Localization and Domain Adaptation [8.017203108408973]
海洋における音源の局所化は、環境の複雑でダイナミックな性質のために難しい課題である。
本研究では,移動音源と受信機の距離を正確に予測するマルチブランチネットワークアーキテクチャを提案する。
提案手法は,SOTA(State-of-the-art)アプローチに類似した設定で優れる。
論文 参考訳(メタデータ) (2025-06-20T18:13:30Z) - Evaluating ML Robustness in GNSS Interference Classification, Characterization & Localization [42.14439854721613]
ジャミング装置はグローバルナビゲーション衛星システム(GNSS)からの信号を妨害する
本稿では、低周波アンテナから得られたスナップショットからなる広範囲なデータセットを提案する。
本研究の目的は,機械学習モデル(ML)の環境変化に対するレジリエンスを評価することである。
論文 参考訳(メタデータ) (2024-09-23T15:20:33Z) - Multi-Source and Test-Time Domain Adaptation on Multivariate Signals using Spatio-Temporal Monge Alignment [59.75420353684495]
コンピュータビジョンやバイオメディカルデータなどの信号に対する機械学習の応用は、ハードウェアデバイスやセッション記録にまたがる変動のため、しばしば課題に直面している。
本研究では,これらの変動を緩和するために,時空間モンジュアライメント(STMA)を提案する。
我々はSTMAが、非常に異なる設定で取得したデータセット間で、顕著で一貫したパフォーマンス向上をもたらすことを示す。
論文 参考訳(メタデータ) (2024-07-19T13:33:38Z) - Stable Neighbor Denoising for Source-free Domain Adaptive Segmentation [91.83820250747935]
擬似ラベルノイズは主に不安定なサンプルに含まれており、ほとんどのピクセルの予測は自己学習中に大きく変化する。
我々は, 安定・不安定な試料を効果的に発見する, SND(Stable Neighbor Denoising)アプローチを導入する。
SNDは、様々なSFUDAセマンティックセグメンテーション設定における最先端メソッドよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-06-10T21:44:52Z) - AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。
我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。
提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文 参考訳(メタデータ) (2021-12-09T15:10:47Z) - Certified Adversarial Defenses Meet Out-of-Distribution Corruptions:
Benchmarking Robustness and Simple Baselines [65.0803400763215]
この研究は、最先端のロバストモデルがアウト・オブ・ディストリビューションデータに遭遇した場合、敵のロバスト性がどのように変化を保証しているかを批判的に検証する。
本稿では,トレーニングデータのスペクトルカバレッジを改善するために,新たなデータ拡張方式であるFourierMixを提案する。
また,FourierMixの拡張により,様々なOODベンチマークにおいて,より優れたロバスト性保証を実現することが可能となる。
論文 参考訳(メタデータ) (2021-12-01T17:11:22Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。